搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
腾讯网
1 天
彩云小梦V3.5上线!首个基于DCFormer架构通用大模型发布
今年的ICML会议上,彩云科技团队的3篇论文,在录用平均分为4.25-6.33的情况下,获得平均7分的高分,并成为国内唯二受邀参加维也纳ICML 2024登台演讲的企业,另一家则是华为。
齐鲁网
17 小时
彩云科技发布基于DCFormer架构通用大模型云锦天章
11月13日,彩云科技在北京总部与媒体进行一场主题为“From Paper to App”的沟通会。会上,彩云科技CEO袁行远,就通用大模型未来进化之路,与人工智能的落地场景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。
17 天
Transformer架构迎来突破:谷歌创新方法有效攻克长文本处理难题
为了解决这个问题,研究者们尝试了稀疏注意力机制和上下文压缩技术,但这些方法往往以牺牲性能为代价,可能会导致关键信息的丢失。 谷歌的研究人员提出了一种名为选择性注意力的新方法,这种方法可以动态忽略不再相关的标记,从而提高Transformer模型的效率 ...
人民资讯 on MSN
17 小时
彩云科技发布业内首个基于DCFormer架构的通用大模型
作为国内最早做LLM(大语言模型)的公司之一,彩云科技在2017年就已经开始做NLP和大模型方面的工作。目前,彩云科技旗下有彩云天气、彩云小梦、彩云小译三款面向C端用户的AI产品,是国内为数不多能够实现盈利的人工智能公司。
来自MSN
9 天
大语言模型:LLM的基本原理解读
本文讲述了大语言模型LLM的基本原理以及应用,仅供参考。 最近在做一些基于LLM(Large Language Models)的项目,计划系统化的梳理一个LLM系列文章,整个大纲,大概包括以下内容: 1、大语言模型:LLM的基本原理解读 2、如何将LLM应用到实际的业务中 3、基于LLM构建应用程序:设计指南 4、LLM的高阶应用:提示工程 5、LLM的高阶应用:插件的使用 6、LLM的高阶应用: ...
8 小时
彩云小梦V3.5上线 彩云科技推出首个基于DCFormer架构通用大模型
而在应用端,拥有四百万用户的彩云小梦,也迎来了基于全新DCFormer架构的V.3.5版本。与之前的版本相比,彩云小梦V3.5整体流畅性和连贯性提升了20%,支持前文长度由2000字提升至10000字,故事背景设定最长长度高达10000字。“这意味着 ...
GitHub
28 天
HanXinzi-AI/awesome-NLP-resources
自然语言处理项目&工具库&资源大全,划分子领域版块汇集梳理,每周自动更新 本资源清单包含100个python自然语言处理相关的项目&工具库&资源,这些资源总共分成11个不同的子板块,这些项目目前在github上已经收到180K个点赞。所有的工具资源每周会自动从GitHub ...
GitHub
18 天
natural-language-processing-with-hugging-face-and-transformers.md
Skip to content Navigation Menu Toggle navigation ...
4 天
大模型新时代:斯坦福CS25课程揭秘Transformers与LLMs的未来
随着人工智能技术的不断进步,深度学习中的Transformers和大型语言模型(LLMs)正引领着这一领域的变革。2024年春季,斯坦福大学推出的CS25课程将深入探索这些技术的内在机制与应用前景,为希望了解这一领域的学习者提供了重要契机。 CS25课程的核心内容涵盖了Transformers的基本原理及其在自然语言处理(NLP)中的广泛应用。Transformers模型最早在2017年的《Att ...
腾讯网
21 小时
万字干货|复杂表格多Agent方案:从LLM洞察、系统性思考到实践经验总结
阿里妹导读笔者结合实践经验以近期在负责的复杂表格智能问答为切入点,结合大模型的哲学三问(“是谁、从哪里来、到哪里去”),穿插阐述自己对大模型的一些理解与判断,以及面向公共云LLM的建设模式思考,并分享软件设计+模型算法结合的一些研发实践经验。一、前言2022年11月,ChatGPT平地一声雷,开启了“大模型+”时代, ...
来自MSN
21 小时
TSMamba:基于Mamba架构的高效时间序列预测基础模型
在当今数据驱动的世界中,时间序列预测在多个领域扮演着关键角色。从医疗保健分析师预测患者流量,到金融分析师预测股市趋势,再到气候科学家预测环境变化,准确的时间序列预测都至关重要。然而,传统的预测模型面临着三个主要挑战: 数据获取难度:对于新兴模式的预测 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈