kaiyun体育文小言已毕了多模子间的智能协同-云开·全站APPkaiyun

kaiyun体育文小言已毕了多模子间的智能协同-云开·全站APPkaiyun

3 月 31 日,新一期百度 AI DAY 上,文小言晓示完制品牌焕新与功能升级。除品牌视觉形象焕新外,文小言聚焦模子怒放与功能翻新,支撑多模子和会转移,升级全新语音大模子、图片问答、AI 生图生视频等多项才调,为用户带来更智能、更高效的 AI 体验。kaiyun体育

百度 AI 居品翻新业务庄重东说念主薛苏强调:" AI 的将来不再是单纯的技巧参数比拼,而是奈何通过多模子协同,确实为用户创造价值。文小言但愿通过怒放生态,整合顶尖模子才调,作念出更宏大、更通俗的 AI 居品。"

多模子和会:打造 AI "超等大脑",再行界说用户体验

文小言这次升级的中枢亮点在于"多模子和会转移"。通过整合百度自研的文心 X1、文心 4.5 等顶尖模子,并接入 DeepSeek-R1、可灵等级三方优质模子,文小言已毕了多模子间的智能协同。用户只需聘任"自动步地",即可一键调用最优模子组合,或字据需求生动聘任单一模子完成特定任务,大幅培育反应速率与任务处分才调。

以"商酌三种作风的南偏东客厅成果图"为例,文小言好像精确剖析装修作风互异,调用文心 X1 完成深度推理,生成三幅作风迥异但视角一致的装修成果图;顺手拍摄一张茅台镇的相片,文小言就不错调用文心 4.5 的多模态分析才调,精确识别出地舆位置、当地产业、修复作风等详实信息。

功能升级:全新语音大模子、图片问答,解锁 AI 诓骗新场景

这次功能升级,文小言进一步培育了全新语音大模子、图片问答、AI 生图生视频等才调,全面优化用户体验。

全新语音大模子支撑方言对话、复杂常识问答及随时打断等场景,用户可进行语音常识问答或兴致变装束演。

百度语音首席架构师贾磊浮现,该模子是百度在业界首个推出、基于全新彼此眷注眼光 ( Cross-Attention ) 的端到端语音话语大模子。在语音场景振奋一定交互目标下,大模子调用老本比行业平均缩短 50%-90%,推理反应速率极快,将语音交互恭候时代压缩至 1 秒傍边,极大培育了交互灵通性。同期,在大模子加执下,已毕了流式逐字的 LLM 开动的有情绪语音合成,情绪足够、传神、拟东说念主,交互听感也得到极大培育。

图片问答功能让用户不错通过拍摄或上传图片,以笔墨或语音发问径直获得深度剖析。举例,拍摄通盘数学题可及时生成解题念念路与视频剖析;上传多款商品图可对比参数、价钱,提拔购物决议;拍摄杯子商酌图后,AI 可自动剖析作风并生成同款手机壳、支架等操纵居品。



值得一提的是,新增的"图个冷常识"功能更富兴致性,用户可预设"历史学者""科技达东说念主"等东说念主设视角,为团结图片赋予多维解读。举例,当用户商讨"猫窗探秘,为何猫爱窗边的科学真相?",文小言能从狩猎本能、能量获得、领地意志等角度给出专有解读。