Math - 搜索 News

腾讯网23 小时

全球开源大模型新王！阿里Qwen2.5来了，性能跨量级超Llama3.1

智东西9月19日杭州报道，今日，阿里云推出全球最强开源大模型Qwen2.5-72B，性能“跨量级”超越Llama3.1-405B，再登全球开源大模型王座。 ▲Qwen2.5-72B在多项权威测试中超越Llama-405B ...

4 小时

通义千问重磅开源Qwen2.5，性能超越Llama

自从2023年8月开源以来，通义在全球开源大模型领域后来居上，成为开发者尤其是中国开发者的首选模型。性能上，通义大模型日拱一卒，逐步赶超美国最强开源模型Llama，多次登顶Hugging ...

1 天

阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

阿里推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math，三大类模型共有10多个版本，Qwen2.5在多个基准测试中击败了Llama-3.1指令微调模型，该系列预训练数据大幅度增长达18万亿tokens。

来自MSN1 天

Qwen2.5登上全球开源王座！72B模型击败LIama3 405B，轻松胜过GPT-4o-mini

白小交发自凹非寺量子位 | 公众号 QbitAI 击败LIama3！Qwen2.5登上全球开源王座。而后者仅以五分之一的参数规模，就在多任务中超越LIama3 405B。各种任务表现也远超同类别的其他模型。

搜狐14 小时

阿里云宣布开源Qwen2.5，上架超100个模型

Qwen2.5-72B模型在MMLU-rudex基准（考察通用知识）、MBPP 基准（考察代码能力）和MATH基准（考察数学能力）的得分高达86.8、88.2、83.1。Qwen2.5支持128K的上下文长度，可生成最多8K内容，支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 种以上语言。

2 小时

o1带火的CoT到底行不行？新论文引发了论战

OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也‍提到 o1 在某些任务上的表现并不比 GPT-4o ...

来自MSN15 小时

数学AI模型新霸主来了，据说卷过了GPT-4和Claude，来试试？

在人工智能领域，数学能力的突破一直是业界关注的焦点。近日，阿里云推出的新一代数学模型Qwen2-Math系列，以其卓越的数学推理和解题能力，在基准测试中超越了GPT-4、Claude等通用大型语言模型，成为数学AI模型的新霸主。 Qwen2-Math系列模型，包括1.5B、7B和72B三 ...

1 天

通义千问Qwen2.5震撼推出：超越Llama的开源大模型新时代

在2024年9月19日的云栖大会上，阿里云CTO周靖人正式发布了通义千问的新一代开源大语言模型——Qwen2.5。这一型号以旗舰产品Qwen2.5-72B为首，声势浩大地宣告其性能超越Llama系列，稳居全球开源大模型的王座。此次发布的Qwen2.5 ...

1 天

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

Qwen2.5系列模型的开源，不仅采用了Apache2.0许可证，还提供了多种不同规模的版本，以适应不同的应用需求。此外，通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

站长之家1 天

阿里史上规模开源发布，超GPT-4o 、Llama-3.1！

今天凌晨，阿里巴巴官宣了史上最大规模的开源发布，推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。这三大类模型一共有10多个版本，包括0.5B、1.5B、3B、7B、14B、32B和72B，适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果