LLM Alignment - 搜索 News

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：覆盖8种语言，超 ...

在大语言模型（LLMs）不断发展的背景下，如何评估这些模型在多轮对话和多语言环境下的指令遵循（instruction following）能力，成为一个重要的研究方向。现有评估基准多集中于单轮对话和单语言任务，难以揭示复杂场景中的模型表现。

12 天

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强？北大、MIT团队 ...

而OpenAI o1在“慢思考”也就是生成Hidden COT的过程中，通过分析OpenAI官网给出的Hidden ...

腾讯网1 天

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

新智元报道编辑：alan【新智元导读】代码模型可以自己进化，利用自身生成的数据来进行指令调优，效果超越GPT-4o直接蒸馏！LLM作为智能的基座，可以衍生出各种能力。代码能力就是其中一种：程序补全、注释、优化、修bug、测试等等。而想要充分发挥LLM的巨大潜力，指令调优（Instruction ...

来自MSN5 天

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

Janus团队投稿自凹非寺量子位 | 公众号 QbitAI 在多模态AI领域，基于预训练视觉编码器与MLLM的方法（如LLaVA系列）在视觉理解任务上展现出卓越性能。而基于Rectified Flow的模型（如Stable Diffusion ...

51CTO24 天

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问题

如果 LLM 保持现在的发展势头，预计在 2028 年（中位数 ... 基于这些考虑，谷歌 DeepMind 和芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva，即 Evolving Alignment via Asymmetric Self-Play，也就是「通过非对称自博弈实现的演进式对齐」。概述地讲，eva ...

腾讯网2 天

SaaS的范式正在转变为SaS，海外AI风投在后软件时代的投资逻辑

—企业领导者已经花了几十年的时间使用软件来推动公司的发展。十年前，只有 15 家 SaaS 或软件独角兽，如今有 416 家。企业软件公司的总公开市值超过 1 万亿美元来源 / 深思SenseAI ...

8 天

入选NeurIPS 2024，中科院团队提出非侵入式大脑解码新框架，为脑机 ...

中国科学院自动化研究所团队创新性地设计了一种多模态集成框架，该框架融合 fMRI 特征提取器与大语言模型，可解决大脑活动的视觉重建问题，增强脑信号解码能力，实现脑信号描述、复杂推理、概念定位和视觉重建等任务。

证券之星18 天

探索“AI爱因斯坦”的无限可能上智院与合作伙伴联合发布“科学 ...

随着2024年诺贝尔物理学奖和化学奖授予了人工智能 (AI)相关研究，科学智能（科学和AI深度融合）及其研究方向引发了从科学家到公众的广泛关注。在与从事科学智能领域前沿研究学者的大量深度访谈基础上，上智院联合合作伙伴，共同概括科学智能新范式，并梳理和凝练了科学智能的十大前沿方向。

来自MSN13 天

AI for Science：站在科研范式的转折点上

2024年10月的第二个星期，诺贝尔奖的归属陆续揭晓。其中，诺贝尔物理学奖和化学奖相继颁发给了在人工智能与基础科学交叉领域取得重大突破的科学家们。一时间，互联网上段子齐飞—— “物理学真的不存在了吗？” “Physics应该写成PhysiCS！” ...

36氪29 天

什么会影响大模型安全？NeurIPS'24新研究提出大模型越狱攻击新基准与 ...

全新大语言模型越狱攻击基准与评估体系来了。来自香港科技大学（Guangzhou）USAIL研究团队，从攻击者和防御者的角度探讨了什么因素会影响大模型 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果