LLM Alignment - 搜索 News

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

新智元报道编辑：alan【新智元导读】代码模型可以自己进化，利用自身生成的数据来进行指令调优，效果超越GPT-4o直接蒸馏！LLM作为智能的基座，可以衍生出各种能力。代码能力就是其中一种：程序补全、注释、优化、修bug、测试等等。而想要充分发挥LLM的巨大潜力，指令调优（Instruction ...

来自MSN5 天

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

Janus团队投稿自凹非寺量子位 | 公众号 QbitAI 在多模态AI领域，基于预训练视觉编码器与MLLM的方法（如LLaVA系列）在视觉理解任务上展现出卓越性能。而基于Rectified Flow的模型（如Stable Diffusion ...

51CTO24 天

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问题

如果 LLM 保持现在的发展势头，预计在 2028 年（中位数 ... 基于这些考虑，谷歌 DeepMind 和芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva，即 Evolving Alignment via Asymmetric Self-Play，也就是「通过非对称自博弈实现的演进式对齐」。概述地讲，eva ...

新浪网25 天

高效评估多模态预训练对齐质量，中科大提出模态融合率MIR

是否还在苦恼如何评估自己预训练好的多模态 LLM 的性能？是否还在使用并不靠谱的损失 Loss，困惑度 Perplexity（PPL），上下文 In-Context 评估 ...

51CTO1 个月

AI「长脑子」了？LLM惊现「人类脑叶」结构并有数学代码分区，MIT ...

Max Tegmark团队又出神作了！他们发现，LLM中居然存在人类大脑结构一样的脑叶分区，分为数学/代码、短文本、长篇科学论文等 ...

腾讯网1 个月

LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期 ...

为了解决这一问题,Jin等人提出了一种名为LLM-Mixer的创新框架,旨在通过引入多尺度时间序列分解,使LLMs更好地适应时间序列预测任务。该研究的主要 ...

GitHub10 个月

Tips: 图片完全由AI生成

LLM-Dojo使用简洁且易阅读的代码构建模型训练、RLHF框架等各种功能，使项目易于学习且方便魔改与实验，与大多开源框架相同均是基于huggingface。主要内容如下： SFT训练框架: 简洁清晰的开源大模型训练框架，支持Deepspeed多卡、Lora、QLora、全参等训练，自动适配 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果