天际兴平网

BAT大模子“会师”:腾讯周全凋谢自研混元大模子,更坚贞、更成熟

来源: 时间:2024-11-01 17:36:23

继baidu文心大模子 、会师阿里巴巴通义大模子宣告之后,模腾模更业界对于腾讯的讯周谢自大模子不断抱以期待。在2023腾讯全天下数字生态大会上 ,全凋腾讯混元大模子正式宣告,研混元至此  ,坚贞BAT正式会师大模子赛道 。更成

腾讯总体低级实施副总裁 、会师云与智慧财富事业群CEO汤道生展现,模腾模更腾讯将迈入“周全拥抱大模子”时期 :“以大模子天生技术为中间 ,讯周谢自家养智能正在成为下一轮数字化睁开的全凋关键能源,也为处置财富痛点 ,研混元带来了全新的坚贞思绪。腾讯财富互联网将经由智能增强、更成数据增强  、会师衔接增强,不断助力财富增强 。”

腾讯总体低级实施副总裁、云与智慧财富事业群CEO 汤道生腾讯总体低级实施副总裁、云与智慧财富事业群CEO 汤道生

不断投入2300亿 ,夯实自主可控“技术底座”

“腾讯深信产物为王,刚强做扎实的技术 ,构立功能卓越 、自主可控的云产物系统。”汤道生展现 ,五年来,腾讯的研发投入逾越2300亿,在中间数字科技的良多规模,实现为了功能的突破。在音视频规模 ,腾讯编码器在MSU天下大赛中,一次性包揽下场部15个天下冠军 。散漫了腾讯云高功能的星星海效率器 、深度优化的操作零星Tencent OS与自研数据库TDSQL,腾讯云在最近一次TPC-C功能测试中,创下了每一分钟反对于8.14 亿笔生意的天下记实 。

此外 ,腾讯在家养智能 、云原生、音视频通讯 、区块链、收集清静等规模 ,在全天下取患上专利授权3.3万件,恳求总数逾越6.6万件 ,位列中国企业第一位 ,全天下第二 。

值患上一提的是,腾讯提出聚焦产物,在生态系统中做好数字化工具的提供者,将集成 、交付  、销售等关键 ,更多交给生态过错,请过错“唱主角” 。当初,腾讯以及1万1千家生态过错睁开详尽相助,推出拆穿困绕100多个财富场景的行业处置妄想 ,配合效率千行百业。而腾讯的冠军产物,普遍适配以及被集成到过错的零星中 ,成为过错破局的“尖刀” 。

去年 ,生态过错支出占到腾讯云部份支出的三分之一,支出增速是腾讯云增速的4倍 。

全链路自研, 混元大模子更坚贞 、更成熟

腾讯混元大模子是由腾讯全链路自研的通用狂语言模子 ,具备超千亿参数规模,预磨炼语料超2万亿tokens  ,具备强盛的中文创作能耐 ,重大语境下的逻辑推理能耐,以及坚贞的使命实施能耐 。

据腾讯总体副总裁蒋杰介绍,腾讯混元大模子从第一个token开始从零磨炼,把握了从模子算法到机械学习框架 ,再到AI根基配置装备部署的全链路自研技术 。

腾讯总体副总裁 蒋杰腾讯总体副总裁 蒋杰

从2021年开始 ,腾讯先后推出千亿以及万亿参数的NLP浓密大模子  ,突破CLUE三大榜单记实,实如今中文清晰能耐上的新突破 。

当初  ,业界大模子在场景中的运用依然有限 ,主要会集在容错率高 、使命重大的休闲场景。腾讯在算法层面妨碍了一系列自研立异 ,后退了模子坚贞性以及成熟度 。

针对于大模子简略“横三竖四”的下场 ,腾讯优化了预磨炼算法及策略,让混元大模子的幻觉比照主流开源大模子飞腾了30%至50%;经由强化学习的措施 ,让模子学会识别陷阱下场;经由位置编码优化 ,后退了超长文的处置下场以及功能;提出面脑链的新策略 ,让大模子可能像人同样散漫实际的运用途景妨碍推理以及抉择规画 。

此外 ,腾讯还自研了机械学习框架Angel ,使磨炼速率比照业界主流框架提升1 倍,推理速率比业界主流框架提升1.3倍  。

患上益于全链路自研技术,腾讯混元大模子可能清晰高下文的寄义,而且有长文影像能耐 ,可能流利地妨碍业余规模的多轮对于话 。除了此之外,它还能妨碍文学创作、文本摘要 、脚色饰演等内容创作 ,做到短缺清晰用户妄想,并高效 、精确的给出无意效性的回覆。

在中国信通院《大规模预磨炼模子技术以及运用的评估措施》的尺度适宜性测试中 ,混元大模子共测评66个能耐项,在“模子开拓”以及“模子能耐”两个紧张规模的综合评估均取患了之后的最高分。在主流的评测集MMLU、CEval以及AGI-eval上,混元大模子均有优异的展现  ,特意是在中文的文科 、高考题以及数学等子项上展现突出 。

融入财富场景,释放数据最大价钱

腾讯混元大模子是“从实际中来 ,到实际中去”的适用级大模子 。蒋杰展现:“咱们研发大模子的目的不是在评测上取患上高分 ,而是将技术运用到实际场景中。腾讯将周全拥抱大模子。”

当初,混元大模子已经接入腾讯50多个营业并取患上开始下场 ,搜罗腾讯云 、腾讯广告  、腾讯游戏 、腾讯金融科技、腾讯团聚 、腾讯文档 、微信搜一搜、QQ浏览器等营业以及产物。

其中 ,腾讯团聚基于混元大模子打造了AI小助手,惟独要重大的做作语言指令 ,就能实现团聚信息提取 、内容合成等重大使命 ,会后还能天生智能总结纪要。据实测,在指令清晰、会中问答 、团聚摘要 、团聚待办项等多个方面,混元大模子均取患上较高的用户接管率。

“以大模子天生技术为中间,家养智能正在成为下一轮数字化睁开的关键能源,也为处置财富痛点带来了全新的思绪 。狂语言模子让人机交互体验变患上更重大,清晰妄想与操控零星的能耐也更强盛  ,大幅度提升数字化在财富中的可用性、易用性 。”在汤道生看来,大模子需要基于财富场景,与企业数据融会,能耐释放出最大的价钱 。

为此,腾讯推出了“腾讯云MaaS效率”,在腾讯云行业大模子精选商铺中 ,不光提供混元大模子,还上架了20多种行业最新 、最盛行的开源通用大模子,以及拆穿困绕金融 、文旅 、批发 、政务、医疗 、教育等20多个规模的行业大模子。

企业可能凭证需要,抉择适宜的模子 ,而后借助腾讯云智能的TI平台 ,导入企业专有数据,做进一步的磨炼与精调 ,快捷天生更有针对于性的专属大模子 ,知足企业特色化需要。

同时 ,腾讯也将大模子与腾讯的行业处置妄想 、企业级运用散漫,在破费、营销、售后效率、办公等多个关键 ,实现本领提升,达至降本增效  。

最近   ,腾讯云也周全接入Llama 二、Bloom等20多个主流模子 ,以及混元同样 ,都反对于直接部署调用 。客户可能凭证实际需要,基于混元、也可能基于开源模子,打造自己专属的行业大模子。

“在探究未来的道路上 ,腾讯愿与过错携手,配合探究大模子等全新行业机缘 ,不断拓展下沉市场 ,坚持打磨‘好产物’,拥抱‘被集成’,搭建‘数字化大舞台’,请过错当好主角 ,共建财富智能未来 。”汤道生最后夸张。