申请技术丨讯飞星火
申报领域丨人工智能
产品描述:
讯飞星火认知大模型,是科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。整体布局为“1+N”体系。其中,“1”是指通用认知智能大模型;“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。讯飞星火认知大模型拥有七大核心能力,分别为:多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学能力、多功能多语言代码能力和多模态输入和表达能力。
独特优势:
1、科大讯飞自主研发“1+3+1”的创新体系,支撑讯飞星火认知大模型的持续进步:自主研发的安全可控大模型训练基座;高质量海量数据构建、多语种多任务统一建模、基于用户对话数据的强化学习;软硬一体化的高性能大模型推理平台。
2、在国产大模型中抢先实现“PC、iOS、安卓、小程序和H5”主流系统的全覆盖,并支持跨设备历史记录同步,使用户可在主流系统平台自由切换。
3、目前,讯飞星火认知大模型在教育、医疗、工业、办公、汽车、数字员工等领域落地应用,已赋能星火语伴APP、医疗诊后康复管理平台、羚羊工业互联网平台、讯飞听见智慧屏等产品。
4、拥有清晰的技术路径和行之有效的方法。通过全面对标ChatGPT提出的48项任务,在5月6日发布后,讯飞星火在2023年年内定下持续升级关键里程碑:6月9日,突破开放式问答,多轮对话、逻辑和数学能力再升级;8月15日,突破代码能力,多模态交互再升级;10月24日,通用模型对标ChatGPT,实现中文超越、英文相当。
应用场景:
1、在汽车领域
自由说·助力人车交互类人化在讯飞星火认知大模型的支持下,传统人车交互场景中对话风格固化的问题将得到突破性解决,通过大模型赋予汽车更强大的沟通和理解能力,让汽车拥有人类的思考与逻辑。在人车对话方面,通过多轮交互,汽车将拥有深度的上下文理解能力,前文提到的指代及语义将继承至后续的对话中,用户无需反复重复完整句意,结合深度语义理解,指令和聊天的说法将得到高强度泛化,让对话逻辑更贴近真人交谈。通过说法的全面打通,在用户在与车辆聊天的过程中也可同步下达车控、导航、娱乐等任务指令,实现跨业务场景自由交互。同时,在快速信源拓展的支持下,汽车所拥有的通用知识和汽车使用方面的专有知识将实现实时更新,并支持用户多样化调取查询,通过讯飞星火认知大模型的生成能力带来汽车服务的新场景,在驾程中,汽车是助理,是朋友,也是用车专家。
懂汽车·为每辆车定制专属知识库在智能化浪潮的席卷之下,车辆的功能已经实现了很大程度的拓展,但用户使用频率最高的依然是固定数量的基础功能,很多重要的功能往往因为用户懒得翻开厚厚的用车手册而闲置,通过讯飞星火认知大模型,科大讯飞可以助力车企将用车手册做进车里,为每辆车定制专属的知识库,让车辆自己在特定场景介绍并指导用户使用对应功能,这种改变将带来汽车“人设”和用户用车体验的双重升级,通过加载专用手册,实现车控功能指引、保养、维修服务接入和服务闭环,链接车企与用户,实现从服务体验到运营价值的全面转化。
拟人化·数字虚拟人多维提升用户体验通过多模态融合,汽车的感知能力实现了跨越式发展,语音与视觉的融合让汽车可以更精准地理解用户指令,结合多维表达,可以从语音、动作、形象、音效等多个维度高效输出。现在,科大讯飞将多模感知及多维表达与讯飞星火认知大模型深度融合,提供车企专属数字虚拟人定制能力,将前期采集的形象数据和知识数据输入虚拟人驱动引擎,通过讯飞星火认知大模型赋能,实现更多维的虚拟表达。该技术在销售场景、用车场景均可广泛使用,将为车企和用户带来更有趣、更多元、更自然的立体交互体验。
更开放·标准化接口高效接入多生态基于大模型Plugin标准接口,通过少量功能示例的列示,讯飞星火认知大模型即可实现深度上下文理解和可控对话管理,并主动生成提示语,与传统的大规模定制逻辑不同,新模式将大大缩短定制周期和成本,并从根本上高效提升语义理解效果,实现信源的快速接入和灵活拓展,满足车厂差异化定制需求。当前,讯飞星火认知大模型在汽车领域已支持出行、资讯和娱乐媒体等多场景下100+信源的接入。
2、在教育方面。搭载了讯飞星火认知大模型的讯飞AI学习机能够对作文进行深度理解,自动生成评语和范文,让AI能够像老师一样批改作文。在口语对话上,讯飞AI学习机精通中英双语,在学生说话的同时翻译出英文,并示范学生如何朗读。
3、在办公领域,通过讯飞星火认知大模型赋能机器翻译以及语音识别,讯飞智能办公本不仅可以在会议时全程记录,自动生成会议纪要,还可以对文本进行语篇规整,快速地将一个口水稿修改成一个书面稿。大幅缩减用户的工作时间。讯飞听见在录音转文字后,AI可直接生成多种文本内容;AI智能摘要,口语稿秒变书面稿;AI生成工作计划和待办,项目进程管理更高效;AI内容分析后,用户可进行互动提问;多语种翻译赋能企业出海、国际化传播。讯飞听见智慧屏可以捕捉10米内的声音,各种声音、视频的终端信号,通过专利技术可以一线接入智慧屏,经由星火大模型处理,转化成精准音源并为会议提供字幕。在会议结束以后,听见智慧屏不仅可以给出转写结果,而且可以对它进行整理并最终成稿,快速形成会议纪要。与会人员可以一键扫码便可获得会议纪要,实现了多模态的会议记录。
4、在公司经营上,目前,接入讯飞星火认知大模型的RPA商机机器人已投入运用。企业经营者只需要将业务需求和简述告知RPA商机机器人,它就能实现自动商机洞察,帮助公司销售自动查找、筛选新商机并给出合适的销售平台。
未来前景:
1、通过全面对标ChatGPT提出的48项任务,在5月6日发布后,讯飞星火在2023年年内定下持续升级关键里程碑:6月9日,突破开放式问答,多轮对话、逻辑和数学能力再升级;8月15日,突破代码能力,多模态交互再升级;10月24日,通用模型对标ChatGPT,实现中文超越、英文相当。
2、与开发者和生态伙伴共建“星火”生态
1)基于开发者团队超过400万家的讯飞人工智能开放平台,星火认知大模型开发接口开放,将七大维度能力、200+小助手对应能力全面开放给开发者,并且支持多端接入快速集成,支持私有化部署,与广大开发者共建生态。
2)科大讯飞也宣布联手北大、清华、中科大等首批22所全国重点高校,启动星火大模型场景创新赛、开展讯飞高校AI星火营,为产业未来培养通用人工智能时代的领军人才。未来,讯飞星火大模型还将赋能智慧城市、司法、金融等更多行业,带来全新产业机遇,提高全社会的工作和生产效率。