本網站使用瀏覽器紀錄 (Cookies) 來提供您最好的使用體驗,我們使用的 Cookie 也包括了第三方 Cookie。相關資訊請訪問我們的隱私權與 Cookie 政策。如果您選擇繼續瀏覽或關閉這個提示,便表示您已接受我們的網站使用條款。 關閉
AMD釋出最新的ROCm 6.3版本開源軟體,新增頂尖工具以簡化開發,同時提升人工智慧(AI)和高效能運算(HPC)工作負載的效能和可擴展性。 ROCm 6.3的關鍵亮點包括: · SGLang-專為優化在AMD Instinct GPU上執行的大型語言模型(LLM)和視覺語言模型(VLM)等頂尖生成模型的推論所建構,可提升LLM推論的吞吐量高達6倍。 · 進階的Transformer最佳化-FlashAttention-2為ROCm 6.3進行最佳化,可將Transformer模型訓練和推論加速高達3倍,縮短企業級AI的上市時間。 · AMD Fortran編譯器-簡化傳統HPC應用的GPU加速,提供直接卸載、反向相容性,並且能輕鬆整合,無需大量更改編碼。 · rocFFT中的全新多節點FFT-多節點FFT支援在更大的資料集上進行高效能FFT運算,改善油氣和科學研究等領域的效率與決策時間。 · 增強的電腦視覺庫-AV1和rocJPEG等增強視覺庫使開發者能夠為各種工作負載建構先進的AI解決方案,例如影片分析和資料集增強,助力媒體娛樂至自主系統等產業。 透過秉持開源精神並不斷發展以滿足開發者需求,AMD ROCm 6.3持續幫助企業加速創新,提升擴展能力,並在競爭激烈的產業中保持領先地位。
AMD Radeon PRO W7900雙槽工作站繪圖卡即日起透過合作零售商販售,建議市場售價為3,499美元。AMD Radeon PRO W7900雙槽工作站繪圖卡針對支援多個GPU的高效能平台進行最佳化,並為設計專業人士與AI開發人員帶來強大且可擴充的工作站解決方案。其關鍵特色包括: · 卓越效能-配備96個運算單元、192個AI加速器與96個光線追蹤加速器,單精度(FP32)峰值效能高達61.32 TFLOPs以及半精度(FP16)峰值效能高達122.64 TFLOPS。 · 領先業界的性價比-與能夠在單一GPU幀緩衝區(framebuffer)上安裝70B參數模型的競爭產品相比,在Llama 3 70B Q4帶來高達38%的性價比提升。 · 出色的記憶體-配備錯誤校正碼(ECC)技術的48GB記憶體可確保資料完整度,促成無縫多工處理並輕鬆處理複雜的執行專案。 · 桌上型AI-配備高達4個AMD Radeon PRO W7900雙槽繪圖卡的本地端PC或工作站能為任何IT基礎架構挹注強大的AI效能,適合執行關鍵任務專案,確保敏感資料妥善保存於內部。 此外,適用於Radeon GPU的AMD ROCm 6.1開放式運算軟體現已釋出,讓使用AMD Radeon桌上型GPU進行AI開發和部署更具相容性、存取性和可擴展性。藉由支援高達4個通過驗證的Radeon RX或Radeon PRO GPU,使用者能利用各種組態以及資料平行處理功能,使每個GPU獨立進行運算推論並輸出回應結果,從而實現由AMD ROCm軟體與Radeon GPU驅動的客戶端進行多個使用者組態。 ROCm 6.1.3亦為Windows® Subsystem for Linux® (WSL 2)提供公測版支援,讓使用者在Windows系統上運行Linux系統的AI工具,並獲得TensorFlow框架正式認證。 欲了解更多資訊,請參閱AMD部落格文章及影片。欲了解更多關於AMD ROCm 6.1的資訊,請參閱此連結。
AMD持續致力於讓研究人員與開發人員更加便捷地接觸到人工智慧(AI),透過AMD ROCm 6.0開放軟體產業體系擴大基於客户端的機器學習(ML)開發產品。 除了先前已支援的其他基於AMD RDNA 3架構的GPU,包括AMD Radeon PRO W7900、Radeon RX 7900 XTX以及Radeon RX 7900 XT顯示卡外,AI研究人員與ML工程師憑藉ROCm 6.0,現在也可在AMD Radeon PRO W7800以及Radeon RX 7900 GRE桌上型顯示卡上進行開發。 隨著支援越來越多的硬體產品組合,AMD正在使AI社群以多種價位與效能水準來採用強大的GPU,進而加速AI工作負載。 同時,AMD宣布ROCm 6.0現已支援深度學習框架ONNX Runtime,讓使用者在本地AMD硬體上對更加廣泛的來源資料進行推論,同時透過AMD的繪圖推論引擎MIGraphX,將INT8加入可用資料類型(包括FP32與FP16)。 AMD將持續致力於透過擴大增加支援硬體與功能,讓開發人員與研究人員更加容易地取得與使用AI。 此外,隨著AI討論聲量日趨茁壯,AMD在部落格發表全新內容,以進一步了解AI的運作方式以及AMD如何支援x86系統上的AI開發: 名詞討論:從AI到生成式AI:解析「人工智慧」、「神經網路」和「深度學習」等流行用語,並探討生成式AI與其他類型AI的區別。 即將推出的Windows Task Manager更新將為Ryzen 8040系列處理器添加NPU監控功能:闡述日益普及的AI PC如何促使追蹤神經處理單元(NPU)效能系統監控工具的需求增加。為滿足此需求,AMD正在與微軟合作,在Ryzen 8040系列處理器中添加NPU監控功能,讓使用者可以追蹤XDNA引擎的系統使用量。 欲了解更多資訊,請瀏覽以下AMD部落格文章: AMD透過AMD ROCm 6.0與AMD Radeon™ GPU為機器學習開發拓展AI產品 名詞討論:從AI到生成式AI 即將推出的Windows Task Manager更新將為Ryzen 8040系列處理器添加NPU監控功能
AMD持續為開發人員與研究人員拓展跨入AI的途徑,宣布在AMD ROCm 5.7開放軟體產業體系中增加了對Radeon RX 7900 XT顯示卡的支援。 AMD近期拓展ROCm支援到其他基於AMD RDNA 3架構的顯示卡,包括Radeon RX 7900 XTX和Radeon PRO W7900之後,在PyTorch中使用機器學習(ML)模型和演算法的開發人員現在也可以在Ubuntu Linux作業系統上使用AMD ROCm 5.7支援的Radeon RX 7900 XT顯示卡。 Radeon RX 7900 XT提供20GB的高速GPU記憶體和168個AI加速器,更緊湊的封裝使功耗需求比Radeon RX 7900 XTX更低,且為基於AMD RDNA 3架構最平價的顯示卡,在PyTorch上加速機器學習研發動能。 桌上型機器學習提供本地化、具隱私性且實惠的途徑,無須依賴雲端解決方案即可支援機器學習訓練與推論。 欲了解更多關於支援AMD RDNA 3顯示卡的AMD ROCm 5.7,請瀏覽AMD部落格文章。
AMD持續為開發人員與研究人員拓展跨入AI的途徑。AMD近期發布最新版本的ROCm 5.7,為用於加速運算的開放軟體產業體系。同時,AMD宣布ROCm 5.7在基於AMD RDNA 3架構的顯示卡上擴大對PyTorch機器學習(ML)的支援。 採用PyTorch機器學習模型與演算法的使用者,現在可在Ubuntu Linux作業系統上藉由AMD ROCm 5.7充分發揮AMD Radeon RX 7900 XTX顯示卡與Radeon PRO W7900繪圖卡的平行運算能力,並憑藉192個專屬AI加速器,帶來相較前一代產品高達2倍的每運算單元AI效能提升。 桌上型機器學習提供本地化且具隱私性的低成本途徑,不須依賴雲端解決方案即可支援機器學習訓練與推論。 欲了解更多關於支援AMD RDNA 3顯示卡的AMD ROCm 5.7,請瀏覽AMD部落格文章。
AMD發布全新AMD ROCm 5.6開放軟體平台,AMD人工智慧事業群資深副總裁Vamsi Boppana於部落格文章中重點介紹ROCm 5.6的新功能。 ROCm 5.6為人工智慧(AI)與大型語言模型(LLM)工作負載帶來: 將Hugging Face單元測試套件整合至ROCm QA中。 在PyTorch 2.0感應器模式下對OpenAI Triton的增量支援。 透過ROCm對PyTorch、TensorFlow和JAX提供OpenXLA支援,支援更廣泛的社群。 對於HPC應用程式,ROCm 5.6引入對快速傅立葉變換(Fast Fourier Transform,FFT)、基礎線性代數程式集(Basic Linear Algebra Subprograms,BLAS)與計算機(solver)等多個數學函式庫的效能提升。這些數學函式庫是HPC應用程式的基礎,並增強了ROCm開發和部署工具,包括安裝、ROCgdb(CPU-GPU整合除錯器)、ROCm分析工具和文件。 為提供最卓越的效能,AMD也將於未來數月內對框架和後端編譯器作進一步的最佳化,其中包括MLIR基礎架構改進,鞏固AMD對OpenAI Triton與OpenXLA編譯器的支援。客戶將在Hugging Face的AMD Hub上看到更多為AMD解決方案作出最佳化的開源AI模型。 此外,AMD將於今年稍後正式在採用AMD RDNA 3架構的特定顯示卡上釋出AMD ROCm支援。Linux預計將於今年秋季正式支援基於RDNA 3架構的顯示卡,首先是48GB Radeon PRO W7900繪圖卡與24GB Radeon RX 7900 XTX顯示卡,並將陸續發佈更多支援顯示卡和擴充功能。
A12 藝術空間
ROCm
請先登入後才能發佈新聞。
還不是會員嗎?立即 加入台灣產經新聞網會員 ,使用免費新聞發佈服務。 (服務項目) (投稿規範)