How to Infer - 搜索 News

6 天

超强o1模型智商已超120！1小时写出NASA博士1年代码，最新编程赛超越99 ...

陶哲轩表示，虽然这篇MathOverflow上的帖子可能已经包含在o1的训练数据中了，但依旧能展现模型在语义搜索方面的强大功能，而且搜集、总结出的答案的质量可以与MathOverflow这类专业的问答网站相当。

5 天

深度｜OpenAI o1 的思维链与周鸿祎的慢思考

OpenAI 在 9 月 13 日发布的 o1-preview 模型后，o1 系列凭借其强大推理能力和解决问题能力得到大家广泛关注。有业内人士表示，o1 开创了“强化学习的 Scaling Laws”，即“Inference ...

8 天

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型：1 小时写出 NASA 博士 1 ...

最终，o1-mini 帮助 AryanDLuffy 获得了 3922 分的总成绩，在超过 16 万参赛者中排名 277，也就是排名在前 0.17%。这远远超过了 OpenAI 自己做的基准测试结果。o1 模型在他们的模拟 Codeforces 比赛中还只是超过了 89% 的人类选手。

腾讯网18 小时

万字推演OpenAI o1 self-play RL 技术路线

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！作者：曹宇，阿里巴巴集团 · 大模型练习生，AI 系统及算法方向原文：https:/ ...

16 天

用Test Time换Training Time能让LLM更强吗？

2、该工作的核心思路基于一项假设展开。即，通过在测试时（test-time）投入额外的计算资源，LLM 在理论上应该能做到比训练时更好的表现，且这种测试时获得的能力应当还有潜力在智能体和推理任务中带来新的研究方向。

雷锋网3 小时

潞晨科技尤洋：300 亿市值的野心之上，我在做哪些选择？

在向 AI 科技评论谈起商业上的目标时，尤洋表示，“我们要把潞晨的市值做到 200 亿到 300 亿这个量级，然后上市。目标非常量化也很明确，就是达到 20 亿的收入。” 随着大模型的发展重心由 Pre-training 逐渐转向 ...

6 天

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题，明确的正确答案> ，再加上类似 AlphaGo 中 MCTS 和 RL ...

6 天

OpenAI o1模型的发布：通向AGI的新探索

2024年9月，OpenAI发布了其新模型o1，这一被称为“🍓”模型的技术成果迅速引发了广泛关注。o1并不是一个独立的原始版本，而是一个预览版，展示了一种全新的推理模式，为通向通用人工智能（AGI）开启了新的可能性。它在编程和数学问题上的表现尤其突 ...

13 天

为什么这家公司的芯片推理速度比英伟达快20倍？

从更深层次来看，大模型推理速度的瓶颈源于底层计算架构的固有限制，主要体现在存算交换带宽方面，这就是所谓的"存储墙"问题。在传统的冯·诺依曼架构中，计算单元和存储单元是分离的，数据需要在这两个单元之间不断移动，这个过程会消耗大量时间和能源。而随着处理器 ...

1 天

谁能成为英伟达平替？

在2021年之前，Tenstorrent还是一家名不见经传的公司。不过，随着被誉为“硅仙人”的半导体行业大神级人物吉姆・凯勒（Jim Keller）宣布加入该公司并担任首席技术官兼总裁，这家公司一时名声大噪。

14 天

科技巨头打响语音模型之战，亚马逊用Claude升级Alexa，Cerebras语音模式 ...

虽然OpenAI的「Her」还是期货，但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri，如今巨头亚马逊和新秀Cerebras也加入了这场竞争。

12 天

开学第一课 | 黄坚教授：人工智能中的统计学及其相互作用

Jian Huang is a Chair Professor of Data Science and Analytics in the Departments of Data Science and AI, and Applied Mathematics at The Hong Kong Polytechnic University. He obtained his Ph.D. in Stati ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果