科技日报记者 罗云鹏
8月4日,腾讯混元公布开源4款小尺寸模子,参数别离为0.5B、1.8B、4B、7B,消费级显卡便可运行,合用在条记本电脑、手机、智能座舱、智能家居等低功耗场景,且撑持垂直范畴低成本微调。
据悉,这4款模子的推出,系腾讯混元年夜模子连续开源的一大肆措,旨于进一步富厚混元开源模子系统,为开发者及企业提供更多尺寸的模子选择。
今朝,4款模子均于Github及Hugging Face等开源社区上线,Arm、高通、Intel、联发科技等均公布撑持部署。
新开源的4款模子属在交融推理模子,具有推理速率快、性价比高的特色,用户可按照利用场景矫捷选择模子思索模式——快思索模式提供简便、高效的输出,而慢思索触及解决繁杂问题,具有更周全推理步调。
效果上,4款模子均实现了跟业界同尺寸模子的对于标,尤其是于语言理解、数学、推理等范畴有精彩体现,于多个公然测试集上患上分到达了领先程度。
4款模子的亮点于在agent及长文能力,跟此前开源的Hunyuan-A13B模子同样,技能上经由过程精心的数据构建及强化进修奖励旌旗灯号设计,晋升了模子于使命计划、东西挪用及繁杂决议计划以和反思等agent能力上的体现,让模子于现实运用中可以轻松胜任深度搜刮、excel操作、旅行攻略计划等使命。
此外,模子原生长上下文窗口到达了256k,象征着模子可以一次性记住并处置惩罚相称在40万中文汉字或者50万英文单词的超长内容,相称在一口吻读完3本《哈利波特》小说,而且能记居处有人物瓜葛、剧情细节,还有能按照这些内容会商后续故事成长。
部署上,4款模子均只需单卡便可部署,部门PC、手机、平板等装备可直接接入,且模子具备较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)及多种量化格局均可以或许撑持。
运用层面,4款模子都可以或许满意从端侧到云端、从通用到专业的多样化需求,而且已经经于腾讯多个营业中运用,可用性及实用性颠末了实践的查验,是真正实用的模子。例如,依托模子原生的超长上下文能力,腾讯集会AI小助手、微信念书AI问书AI助手均实现对于完备集会内容、整本册本的一次性理解及处置惩罚。
于端侧运用上,腾讯手机管家使用小尺寸模子晋升垃圾短信辨认正确率,实现毫秒级阻挡,隐私零上传;腾讯智能座舱助手经由过程双模子协作架构解决车载情况痛点,充实阐扬模子低功耗、高效推理的特征。
于高并发场景中,搜狗输入法基在模子的多模态结合练习机制使嘈杂情况下晋升辨认正确率;腾讯舆图采用多模子架构,使用用意分类及推理能力晋升了用户交互体验;微信输入法“问AI”基在模子实现输入框与AI即问即答的无缝跟尾。
于需求各别、约束严苛的垂直行业运用中,金融AI助手经由过程Prompt优化及极少量数据微调实现95%+用意辨认正确率,揭示出金融级的高靠得住性;游戏翻译及QQ飞车手游NPC充实使用模子的理解能力于多语言理解能力、方言翻译及智能对于话方面有凸起体现,这些能力于专业客服、内容出海甚至电商直播等场景有巨年夜运用潜力。
近期,全世界开源范畴火热,中国年夜模子体现抢眼。腾讯混元年夜语言模子也于连续推进开源,介入技能社区的共建之中,其开源模子已经笼罩文本、图象、视频及3D天生等多个模态。
于年夜语言模子范畴,腾讯混元此前陆续开源了激活参数目达52B的Hunyuan large及首个混淆推理MoE模子Hunyuan-A13B,这些模子依附架构上的立异以和于机能及效果上的不错体现,于开源社区遭到广泛存眷。
多模态方面,混元还有开放了完备多模态天生能力和东西集插件,陆续开源了业界领先的文生图、视频天生及3D天生能力,提供靠近贸易模子机能的开源基座,利便社区基在营业及利用场景定制,图象、视频衍生模子数目到达3000个。
上周,腾讯发布并开源混元3D世界模子1.0,这一模子一经发布即迅速登上Hugging Face趋向榜第二,混元3D世界模子技能陈诉还有拿下了Hugging Face论文热榜第一。
开源是腾讯混元年夜模子持久对峙的标的目的,将来腾讯混元也将不停晋升模子能力,继承踊跃拥抱开源,推出更多尺寸、更多模特的模子,加快财产落地及运用,与开发者及互助伙伴共建年夜模子开源生态。
-爱游戏(ayx)