Math - 搜索 News

1 天

早在2023年8月，阿里云就开源通义千问70亿参数模型至免费可商用，再到今年的Qwen1.5、Qwen2、Qwen2.5接连发布，让开发者快速用上最先进模型的同时，获得更大控制权和调优空间，从而成为更多企业的首选。

11 小时

OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o ...

1 天

阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

阿里推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math，三大类模型共有10多个版本，Qwen2.5在多个基准测试中击败了Llama-3.1指令微调模型，该系列预训练数据大幅度增长达18万亿tokens。

2 天

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题，明确的正确答案> ，再加上类似 AlphaGo 中 MCTS 和 RL ...

10 小时

通义千问重磅开源Qwen2.5，性能超越Llama

自从2023年8月开源以来，通义在全球开源大模型领域后来居上，成为开发者尤其是中国开发者的首选模型。性能上，通义大模型日拱一卒，逐步赶超美国最强开源模型Llama，多次登顶Hugging ...

2 天

o1突发内幕曝光？谷歌8月论文已揭示原理，大模型光有软件不存在 ...

o1模型学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。并且随着更多的强化学习（训练时计算）和更多的思考时间（测试时计算），o1 的性能持续提高。这样的新发现不免让人想到去年谷歌内部文件里提出的观点： ...

1 天

通义千问Qwen2.5震撼推出：超越Llama的开源大模型新时代

在2024年9月19日的云栖大会上，阿里云CTO周靖人正式发布了通义千问的新一代开源大语言模型——Qwen2.5。这一型号以旗舰产品Qwen2.5-72B为首，声势浩大地宣告其性能超越Llama系列，稳居全球开源大模型的王座。此次发布的Qwen2.5 ...

36氪1 天

Qwen2.5登上全球开源王座，72B模型击败LIama3 405B，轻松胜过GPT-4o-mini

除3B和72B模型外，此次所有开源模型均采用Apache 2.0许可。 Qwen2.5：0.5B、1.5B、3B、7B、14B、32B和72B Qwen2.5-Coder：1.5B、7B和32B（on the way） Qwen2.5-Math：1.5B、7B和72B。直接一整个眼花缭乱，已经有网友开始用上了。相比于Qwen2系列，Qwen2.5系列主要有这么几个方面升级。