Math - 搜索 News

智东西9月19日杭州报道，今日，阿里云推出全球最强开源大模型Qwen2.5-72B，性能“跨量级”超越Llama3.1-405B，再登全球开源大模型王座。 ▲Qwen2.5-72B在多项权威测试中超越Llama-405B ...

搜狐20 小时

在指令跟随、理解结构化数据（如表格）、生成结构化输出等方面Qwen2.5都进步明显。专项模型方面，用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math都比前代有了实质性进步。Qwen2.5-Coder在多达5.5T tokens的编程相关数据上作了训练；Qwen2.5-Math支持使用思维链和工具 ...

1 天

阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

阿里推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math，三大类模型共有10多个版本，Qwen2.5在多个基准测试中击败了Llama-3.1指令微调模型，该系列预训练数据大幅度增长达18万亿tokens。

9 小时

通义千问重磅开源Qwen2.5，性能超越Llama

自从2023年8月开源以来，通义在全球开源大模型领域后来居上，成为开发者尤其是中国开发者的首选模型。性能上，通义大模型日拱一卒，逐步赶超美国最强开源模型Llama，多次登顶Hugging ...

来自MSN1 天

Qwen2.5登上全球开源王座！72B模型击败LIama3 405B，轻松胜过GPT-4o-mini

白小交发自凹非寺量子位 | 公众号 QbitAI 击败LIama3！Qwen2.5登上全球开源王座。而后者仅以五分之一的参数规模，就在多任务中超越LIama3 405B。各种任务表现也远超同类别的其他模型。

来自MSN19 小时

数学AI模型新霸主来了，据说卷过了GPT-4和Claude，来试试？

在人工智能领域，数学能力的突破一直是业界关注的焦点。近日，阿里云推出的新一代数学模型Qwen2-Math系列，以其卓越的数学推理和解题能力，在基准测试中超越了GPT-4、Claude等通用大型语言模型，成为数学AI模型的新霸主。 Qwen2-Math系列模型，包括1.5B、7B和72B三 ...

搜狐19 小时

阿里云宣布开源Qwen2.5，上架超100个模型

Qwen2.5-72B模型在MMLU-rudex基准（考察通用知识）、MBPP 基准（考察代码能力）和MATH基准（考察数学能力）的得分高达86.8、88.2、83.1。Qwen2.5支持128K的上下文长度，可生成最多8K内容，支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 种以上语言。

1 天

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

Qwen2.5系列模型的开源，不仅采用了Apache2.0许可证，还提供了多种不同规模的版本，以适应不同的应用需求。此外，通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

6 小时

o1带火的CoT到底行不行？新论文引发了论战

OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也‍提到 o1 在某些任务上的表现并不比 GPT-4o ...

8 小时

IBM秘密裁员数千人，科技巨头不得不迎转型“阵痛”

2024年，科技行业经历了前所未有的裁员潮，IBM 已宣布悄然裁掉数千名员工，宏观经济的变化是导致裁员潮的重要原因之一，面对人工智能的兴起，新能源汽车变革的加剧，部分企业目前正处于转型的“阵痛期” ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果