当前位置:首页 >> 新闻中心 >> 展会信息

同时读懂40种语言 人工智能助力跨语言交流

时间:2022-09-21   访问量:167

一段包含中文、英语、韩语、日语、阿拉伯语、越南语等40种语言的文字如何理解?大多数人做不到的事情,经过训练的人工智能机器却能做到。

在近日举办的世界权威多语言理解评测XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)中,哈工大讯飞联合实验室(HFL)团队以总平均分84.1位列榜首,刷新世界记录。

XTREME评测旨在全面考察模型的多语言理解与跨语言迁移能力。与以往单语言自然语言理解评测任务不同的是,XTREME中的每一个任务都覆盖了多种语言,并且包含句对分类、序列标注、阅读理解、句子检索赛道,共四大类九个任务。

那么,机器是如何做到多语言理解的?比赛负责人、哈工大讯飞联合实验室核心技术研究员杨子清介绍,他们通过自主研发的跨语言对比学习技术,利用知识蒸馏技术进行自监督学习和知识迁移,鼓励模型学习不同语言中的语义相似性,与此同时,还创新性地融入了细粒度的语言学特征,帮助模型克服训练不足的困难,解决低资源语言学习不充分的问题,同时使之适应不同语言的形态学特点。

“这就意味着,通过本土语言学习,机器可以在少量其他语言语料的情况下,通过类比学会这门语言,减少了收集语料、语音标注等大量工作。”杨子清补充解释。

除了多语言,科大讯飞还在少数民族语言处理方面推出了预训练模型CINO(Chinese mINOrity pre-trained language model)。

杨子清介绍,“少数民族语言处理是中文信息处理中不可缺少的一环,也是中文信息处理多样性的一种体现。这项技术的进步将极大改善我国少数民族语言学习问题。”

国内少数民族语言语料稀缺、获取难度大等原因,相关技术研究相对匮乏,而主流的多语言模型也无法很好地处理国内少数民族语言文字。“希望未来能够进一步促进业内少数民族语言相关的技术研究,推动少数民族语言相关技术的应用落地。未来支持各少数民族语言的多语言搜索引擎等文字应用工具或将成为可能。”杨子清说。

更多推荐:
  • 振奋精神 鼓足干劲 扎实推进全球先进制造业基地建设2022-09-29
  • 海外正在形成“够用就好”的新消费理念 二手手机需求量增长2022-09-29
  • 河北:在产业协同中精准发力2022-11-15
  • 汽车消费再获政策支持 新能源汽车推广进一步深化2022-10-04
  • 科技赋能农业生产 智慧农业助力春耕2022-10-27
  • “十四五”,我们这样开局起步:河南因地制宜推进流域生态建设2022-10-08
  • 购买快换夹具要考虑的几件事情?2022-10-19
  • 这些汽车消费的坑,你踩过哪些?2022-09-30
  • 特斯拉柏林工厂首批新车下月下线2022-11-14
  • 绿水青山是我家⑧最美茶园里的“科特派”2022-09-12
  • 今年1至7月,新能源汽车免征车购税406.8亿元2022-10-02
  • 奔驰(中国)汽车销售有限公司、北京奔驰汽车有限公司召回部分进口及国产汽车2022-09-30
  • 福建省成立首家中印尼产业合作研究中心2022-10-30
  • 5G会不会干扰飞机?民航局:国内“航空5G”与近期国外情况不同,创新不会牺牲安全2022-09-20
  • 三季度经济观察 | 国民经济恢复向好 积极因素累积增多2022-11-15
  • 苹果在华招聘汽车软件工程师,将大举进军汽车业?2022-09-28
  • 工信部等四部委:到2025年,建设一批技术水平高、示范作用显著的智能制造示范工厂2022-11-05
  • 一见·总书记看“共和国工业长子”,十年变迁强信心2022-09-26
  • 首尔市政府计划推进申办2036年夏季奥运会2022-11-04
  • 一见·总书记看“共和国工业长子”,十年变迁强信心2022-10-02
  • 地址:昆山开发区同丰东路1000-125号

    手机:18550883379

    电话:18550883379

    邮箱: ksgsck@163.com

    Copyright © 2022 All 昆山高实创科自动化技术有限公司 Reserved. 本站推荐:零点定位系统,零点定位,零点定位器,快换夹具,德国AMF,柔性夹具,液涨芯轴,自定心夹具,机外装夹,预调站

    苏ICP备2022026216号 XML地图