LAW - 搜索 News

新浪网4 小时

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

有趣的是，昨天拱火的The Information，今天又急忙发出一篇文章来灭火。他们强调，昨天的文章只是在说改进大模型必须找到新方法，并不是说Scaling Law已经终结。

51CTO4 小时

今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议

换句话就是，对于大规模的训练任务，低精度的量化可能不再足够有效。按照结论，对Scaling Law的遵循意味着我们需要保持更高精度，然而一直以来，人们通常会选择量化（将连续值或多精度值转换为较低精度）来节省计算资源。

51CTO6 小时

Scaling Law还有救？MIT破解LLM进化新路！测试时训练让性能暴涨6倍 ...

Scaling Law并未失效，只是不再局限于参数规模的增加。MIT团队最新研究发现，测试时训练在Scaling大模型上，显现出突破性潜力，ARC公共基准测试中拿下61.9%成绩，媲美人类选手。

腾讯网7 小时

深度｜Scaling Law遭遇瓶颈，全球易于获取的数据耗尽，英伟达提出新 ...

人工智能公司在训练新的大型语言模型时面临延迟和挑战一些研究人员正在关注新模型中推理所需的更多时间转变可能会影响人工智能资源竞争，例如芯片和能源据路透社报道，像 OpenAI 这样的人工智能公司正在寻求克服在追求更大规模语言模型过程中出现的 ...

虎嗅网4 小时

Scaling Law终结，量化也不管用，AI大佬都在审视这篇论文

本文来自微信公众号：量子位，作者：一水，原文标题：《今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议》，题图来自：AI生成几十万人关注，一发表即被行业大佬评为“这是很长时间以来最重要的论文”。哈佛、斯坦福、MIT等团队的一项研究表明：训练的token越多，需要的精度就越高。例如，Llama-3在不同数据量下（圆形8B、三角形70B、星星405B），随着数据集大小 ...