搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
14 小时
Scaling Law还有救?MIT破解LLM进化新路!测试时训练让性能暴涨6倍 ...
OpenAI研究科学家、德扑之父Noam Brown第一时间转发了新研究,并称我们通过o1开发了一种scale测试时计算的新方法,但它并不是唯一的方法,也可能不是最好的方法。很兴奋可以看到学术研究人员朝着这个方向,探索出新的方法。
1 天
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
考虑到测试时的资源限制,作者采用了参数高效的LoRA,为每个测试任务学习一组独立的adapter参数,附加在预训练模型的每一层之上,通过一个低秩矩阵与原始权重相乘起到调节作用。
13 天
OpenAI最新研究:「打假高手」大模型事实性基准SimpleQA来了,已开源
目前的语言模型有时会产生错误的输出或没有证据证明的答案,这个问题被称为“幻觉”。语言模型如果能产生更准确的回答,减少幻觉,则更值得信赖,可用于更广泛的应用领域。 https://cdn.openai.com/papers/simpleqa.pdf ...
腾讯网
1 天
o1不是唯一路径!MIT新研究:测试时训练,模型推理能力大幅提升
OpenAI o1团队成员 Noam Brown 表示,o1的大规模计算可能不是最好的方法,很高兴看到有学者在提高推理能力上探索新的方法。 数据生成 的核心是将测试任务中蕴含的输入输出对关系,通过数据增强的方式最大限度地利用,可具体分为两个步骤。
腾讯网
1 天
AGI范式终于找到了?MIT新研究颠覆复杂推理测试,ARC挑战赛比肩人类
麻省理工学院(MIT) 的研究人员最近提出了测试时训练”(Test-Time Training, TTT) 的新方法,并在抽象推理挑战赛 (ARC) ...
7 天
CMU、Meta联手放大招! VQAScore一个问题搞定文生图模型评测,准确性远 ...
传统的评价方法,要么是靠人眼看,主观性太强;要么是用一些简单的指标,比如CLIPScore,但这些指标往往无法捕捉到复杂文本提示中的细节,比如对象之间的关系、逻辑推理等等。这就导致很多文生图模型的评测结果不准确,甚至会出现一些搞笑的情况,明明生成的图 ...
5 天
The Standard, Hua Hin 度假酒店推出手工艺、灵性体验与美酒佳肴等系列活动
The Standard, Hua Hin 度假酒店与泰国领先的创意人士、DJ ...
楚北网
11 天
健康界是什么机构(健康界是官方机构吗)
目前,自然指数(Nature Index)已发展成为国际公认的能够衡量机构、国家和地区在自然科学领域的高质量研究产出与合作情况的重要指标。运用这个数据库,可以根据各机构的论文发表数量及类别来进行排名和期刊索引。
新浪网
13 天
OpenAI 宣布开源 SimpleQA 新基准,专治大模型“胡言乱语”
IT之家 10 月 31 日消息,当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI ...
6 天
同作两文WB条带共享 涉温岭第一人民医院 天津泰达医院 洛马林达大学
2018年7月30日,天津泰达医院神经内科&洛马林达大学生理学与药理学系在Journal of Neuroinflammation (中科院一区 IF=9.3)期刊上在线发表题为 "Recombinant CTRP9 administration ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈