IT之家 11 月 27 日消息,科技媒体 techpowerup 昨日(11 月 26 日)发布博文,报道称 AMD 公司发布了 ROCm 6.3 版本更新,集成了用于加速 AI 推理的 SGLang,并重新设计 FlashAttention-2 ...
AMD近日在AI及高性能计算领域迈出重要一步,发布了ROCm 6.3版本更新。此次更新不仅集成了专为AI推理加速设计的SGLang运行时,还对FlashAttention-2进行了全面优化,旨在提升AI训练和推理的效率。