關於 cookie 的說明

本網站使用瀏覽器紀錄 (Cookies) 來提供您最好的使用體驗,我們使用的 Cookie 也包括了第三方 Cookie。相關資訊請訪問我們的隱私權與 Cookie 政策。如果您選擇繼續瀏覽或關閉這個提示,便表示您已接受我們的網站使用條款。

搜尋結果Search Result

符合「ROCm」新聞搜尋結果, 共 37 篇 ,以下為 1 - 24 篇 訂閱此列表,掌握最新動態
AMD釋出全新ROCm 6.3版本開源軟體,解鎖AI與HPC的新高度

AMD釋出最新的ROCm 6.3版本開源軟體,新增頂尖工具以簡化開發,同時提升人工智慧(AI)和高效能運算(HPC)工作負載的效能和可擴展性。   ROCm 6.3的關鍵亮點包括: ·             SGLang-專為優化在AMD Instinct GPU上執行的大型語言模型(LLM)和視覺語言模型(VLM)等頂尖生成模型的推論所建構,可提升LLM推論的吞吐量高達6倍。 ·             進階的Transformer最佳化-FlashAttention-2為ROCm 6.3進行最佳化,可將Transformer模型訓練和推論加速高達3倍,縮短企業級AI的上市時間。 ·             AMD Fortran編譯器-簡化傳統HPC應用的GPU加速,提供直接卸載、反向相容性,並且能輕鬆整合,無需大量更改編碼。 ·             rocFFT中的全新多節點FFT-多節點FFT支援在更大的資料集上進行高效能FFT運算,改善油氣和科學研究等領域的效率與決策時間。 ·             增強的電腦視覺庫-AV1和rocJPEG等增強視覺庫使開發者能夠為各種工作負載建構先進的AI解決方案,例如影片分析和資料集增強,助力媒體娛樂至自主系統等產業。   透過秉持開源精神並不斷發展以滿足開發者需求,AMD ROCm 6.3持續幫助企業加速創新,提升擴展能力,並在競爭激烈的產業中保持領先地位。   

文章來源 : 世紀奧美 發表時間 : 瀏覽次數 : 3954 加入收藏 :
AMD Radeon PRO W7900雙槽GPU與ROCm 6.1.3版本聯袂問市

AMD Radeon PRO W7900雙槽工作站繪圖卡即日起透過合作零售商販售,建議市場售價為3,499美元。AMD Radeon PRO W7900雙槽工作站繪圖卡針對支援多個GPU的高效能平台進行最佳化,並為設計專業人士與AI開發人員帶來強大且可擴充的工作站解決方案。其關鍵特色包括: ·         卓越效能-配備96個運算單元、192個AI加速器與96個光線追蹤加速器,單精度(FP32)峰值效能高達61.32 TFLOPs以及半精度(FP16)峰值效能高達122.64 TFLOPS。 ·         領先業界的性價比-與能夠在單一GPU幀緩衝區(framebuffer)上安裝70B參數模型的競爭產品相比,在Llama 3 70B Q4帶來高達38%的性價比提升。 ·         出色的記憶體-配備錯誤校正碼(ECC)技術的48GB記憶體可確保資料完整度,促成無縫多工處理並輕鬆處理複雜的執行專案。 ·         桌上型AI-配備高達4個AMD Radeon PRO W7900雙槽繪圖卡的本地端PC或工作站能為任何IT基礎架構挹注強大的AI效能,適合執行關鍵任務專案,確保敏感資料妥善保存於內部。   此外,適用於Radeon GPU的AMD ROCm 6.1開放式運算軟體現已釋出,讓使用AMD Radeon桌上型GPU進行AI開發和部署更具相容性、存取性和可擴展性。藉由支援高達4個通過驗證的Radeon RX或Radeon PRO GPU,使用者能利用各種組態以及資料平行處理功能,使每個GPU獨立進行運算推論並輸出回應結果,從而實現由AMD ROCm軟體與Radeon GPU驅動的客戶端進行多個使用者組態。   ROCm 6.1.3亦為Windows® Subsystem for Linux® (WSL 2)提供公測版支援,讓使用者在Windows系統上運行Linux系統的AI工具,並獲得TensorFlow框架正式認證。   欲了解更多資訊,請參閱AMD部落格文章及影片。欲了解更多關於AMD ROCm 6.1的資訊,請參閱此連結。

文章來源 : 世紀奧美 發表時間 : 瀏覽次數 : 3950 加入收藏 :
AMD將機器學習開發拓展到更多Radeon GPU產品中並宣布AMD ROCm 6.0將支援ONNX Runtime

AMD持續致力於讓研究人員與開發人員更加便捷地接觸到人工智慧(AI),透過AMD ROCm 6.0開放軟體產業體系擴大基於客户端的機器學習(ML)開發產品。   除了先前已支援的其他基於AMD RDNA 3架構的GPU,包括AMD Radeon PRO W7900、Radeon RX 7900 XTX以及Radeon RX 7900 XT顯示卡外,AI研究人員與ML工程師憑藉ROCm 6.0,現在也可在AMD Radeon PRO W7800以及Radeon RX 7900 GRE桌上型顯示卡上進行開發。   隨著支援越來越多的硬體產品組合,AMD正在使AI社群以多種價位與效能水準來採用強大的GPU,進而加速AI工作負載。   同時,AMD宣布ROCm 6.0現已支援深度學習框架ONNX Runtime,讓使用者在本地AMD硬體上對更加廣泛的來源資料進行推論,同時透過AMD的繪圖推論引擎MIGraphX,將INT8加入可用資料類型(包括FP32與FP16)。   AMD將持續致力於透過擴大增加支援硬體與功能,讓開發人員與研究人員更加容易地取得與使用AI。   此外,隨著AI討論聲量日趨茁壯,AMD在部落格發表全新內容,以進一步了解AI的運作方式以及AMD如何支援x86系統上的AI開發: 名詞討論:從AI到生成式AI:解析「人工智慧」、「神經網路」和「深度學習」等流行用語,並探討生成式AI與其他類型AI的區別。 即將推出的Windows Task Manager更新將為Ryzen 8040系列處理器添加NPU監控功能:闡述日益普及的AI PC如何促使追蹤神經處理單元(NPU)效能系統監控工具的需求增加。為滿足此需求,AMD正在與微軟合作,在Ryzen 8040系列處理器中添加NPU監控功能,讓使用者可以追蹤XDNA引擎的系統使用量。   欲了解更多資訊,請瀏覽以下AMD部落格文章: AMD透過AMD ROCm 6.0與AMD Radeon™ GPU為機器學習開發拓展AI產品 名詞討論:從AI到生成式AI 即將推出的Windows Task Manager更新將為Ryzen 8040系列處理器添加NPU監控功能

文章來源 : 世紀奧美 發表時間 : 瀏覽次數 : 4592 加入收藏 :
AMD發布ROCm 5.6,為AI帶來最佳化效能

AMD發布全新AMD ROCm 5.6開放軟體平台,AMD人工智慧事業群資深副總裁Vamsi Boppana於部落格文章中重點介紹ROCm 5.6的新功能。   ROCm 5.6為人工智慧(AI)與大型語言模型(LLM)工作負載帶來: 將Hugging Face單元測試套件整合至ROCm QA中。 在PyTorch 2.0感應器模式下對OpenAI Triton的增量支援。 透過ROCm對PyTorch、TensorFlow和JAX提供OpenXLA支援,支援更廣泛的社群。   對於HPC應用程式,ROCm 5.6引入對快速傅立葉變換(Fast Fourier Transform,FFT)、基礎線性代數程式集(Basic Linear Algebra Subprograms,BLAS)與計算機(solver)等多個數學函式庫的效能提升。這些數學函式庫是HPC應用程式的基礎,並增強了ROCm開發和部署工具,包括安裝、ROCgdb(CPU-GPU整合除錯器)、ROCm分析工具和文件。   為提供最卓越的效能,AMD也將於未來數月內對框架和後端編譯器作進一步的最佳化,其中包括MLIR基礎架構改進,鞏固AMD對OpenAI Triton與OpenXLA編譯器的支援。客戶將在Hugging Face的AMD Hub上看到更多為AMD解決方案作出最佳化的開源AI模型。    此外,AMD將於今年稍後正式在採用AMD RDNA 3架構的特定顯示卡上釋出AMD ROCm支援。Linux預計將於今年秋季正式支援基於RDNA 3架構的顯示卡,首先是48GB Radeon PRO W7900繪圖卡與24GB Radeon RX 7900 XTX顯示卡,並將陸續發佈更多支援顯示卡和擴充功能。   

文章來源 : 世紀奧美 發表時間 : 瀏覽次數 : 11233 加入收藏 :
2025 年 1 月 15 日 (星期三) 農曆十二月十六日
首 頁 我的收藏 搜 尋 新聞發佈