搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
5 小时
走出元宇宙阴影、拥抱开源AI模型,Meta实现“扎克伯格式复兴”
Meta首次尝试推出的AI项目并未取得显著进展。2022年11月,FAIR发布了名为Galactica的聊天机器人,它基于大语言模型构建,并接受了科学文本的训练。与以往的FAIR模型一样,Galactica也是以开源形式发布的,旨在让研究人员深入了解 ...
1 天
这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct
众所周知,近期发布的 OpenAI o1 在数学、 代码、长程规划等问题上取得了显著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此,有人认为,新的扩展律 —— 后训练扩展律(Post-Training Scaling ...
腾讯网
1 小时
UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男
除了人类评审员,VibeCheck还调用了GPT-4o mini来评价不同大模型的回复,结果发现与人类的评估结果相符。也就是说,GPT-4o mini也能发现上述人类评审员总结的细微差异。
腾讯网
4 天
Meta Llama 3,知多少?
Hello folks,我是 Luga,今天我们来聊一下 LLM(大型语言模型) 生态相关技术:Meta Llama 3.1,一个被称为世界上最大、最有能力、最先进的开源人工智能模型。 2024年,对于人工智能领域来说可谓意义非凡。继 ...
1 天
Meta 挖角 Salesforce AI 首席执行官史宗玮,令其领导人工智能商业部门 ...
Meta 副总裁 John Hegeman 向外媒表示,全球风靡的 AI 热潮为企业商业部门带来了重要机遇,人们可以使用 AI 提高效率和改善客户体验,由史宗玮领导的人工智能商业部门团队将进一步 Llama 模型应用,协助 Meta 实现这一愿景。
6 天
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
RoPE-2D:在自注意层中用相对旋转位置编码代替传统的绝对位置嵌入。虽然必须对学习到的位置嵌入进行插值以处理新的图像大小(通常以牺牲性能为代价),但相对位置编码自然而然地适合可变的图像大小。
29 天
Meta 推出 Llama 3.2 1B / 3B 模型量化版:功耗更低、可适用更多轻量移动 ...
据介绍,研究人员一共为 Llama 3.2 的 1B 和 3B 模型各推出了两款量化版本,分别为 Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA 和 Llama 3.2 3B SpinQuant。
19 天
重磅!LLaMA-O1复刻OpenAIo1:开启人工智能新纪元
在人工智能的快速发展中,最近一项激动人心的成果浮出水面——LLaMA-O1的发布。这款复刻自OpenAIo1推理大模型的开源项目,来自上海人工智能实验室(AILab),采用了强化学习的全新代码架构。这一项目不仅吸引了广泛关注,还为大规模人工智能模型的数学推理能力的提升提供了新的思路和资源。
29 天
Meta新推Llama 3.2量化版,1B/3B模型功耗再降低!
【ITBEAR】meta公司近日宣布,继9月推出Llama ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果
反馈