当前位置:首页 >> 新闻中心 >> 展会信息

同时读懂40种语言 人工智能助力跨语言交流

时间:2022-09-21   访问量:166

一段包含中文、英语、韩语、日语、阿拉伯语、越南语等40种语言的文字如何理解?大多数人做不到的事情,经过训练的人工智能机器却能做到。

在近日举办的世界权威多语言理解评测XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)中,哈工大讯飞联合实验室(HFL)团队以总平均分84.1位列榜首,刷新世界记录。

XTREME评测旨在全面考察模型的多语言理解与跨语言迁移能力。与以往单语言自然语言理解评测任务不同的是,XTREME中的每一个任务都覆盖了多种语言,并且包含句对分类、序列标注、阅读理解、句子检索赛道,共四大类九个任务。

那么,机器是如何做到多语言理解的?比赛负责人、哈工大讯飞联合实验室核心技术研究员杨子清介绍,他们通过自主研发的跨语言对比学习技术,利用知识蒸馏技术进行自监督学习和知识迁移,鼓励模型学习不同语言中的语义相似性,与此同时,还创新性地融入了细粒度的语言学特征,帮助模型克服训练不足的困难,解决低资源语言学习不充分的问题,同时使之适应不同语言的形态学特点。

“这就意味着,通过本土语言学习,机器可以在少量其他语言语料的情况下,通过类比学会这门语言,减少了收集语料、语音标注等大量工作。”杨子清补充解释。

除了多语言,科大讯飞还在少数民族语言处理方面推出了预训练模型CINO(Chinese mINOrity pre-trained language model)。

杨子清介绍,“少数民族语言处理是中文信息处理中不可缺少的一环,也是中文信息处理多样性的一种体现。这项技术的进步将极大改善我国少数民族语言学习问题。”

国内少数民族语言语料稀缺、获取难度大等原因,相关技术研究相对匮乏,而主流的多语言模型也无法很好地处理国内少数民族语言文字。“希望未来能够进一步促进业内少数民族语言相关的技术研究,推动少数民族语言相关技术的应用落地。未来支持各少数民族语言的多语言搜索引擎等文字应用工具或将成为可能。”杨子清说。

更多推荐:
  • 周伟代表——持续打造优势产业链2022-10-27
  • 再添国家级荣誉,索菲亚入选工信部“绿色工厂”,引领工业绿色转型2022-10-28
  • 智慧城市建设成时代发展刚需,CIM应用工程师站上人才市场新风口2022-09-22
  • 个人养老金制度来了,你会参加吗2022-11-04
  • QQ发布打击网络黑产公告千万谨慎“免费送皮肤”2022-09-15
  • 苏州吴江铁工投资:创新党史学习教育方式 不断汲取前进力量2022-11-05
  • 钢铁行业碳达峰方案将实施,实现“双碳”面临哪些挑战2022-10-07
  • 结构优化稳中提质 对外贸易连续迈上新台阶2022-10-29
  • 缺少相关许可 特斯拉柏林工厂建设或延期2022-11-06
  • 新华网“星火行动”中国行|探寻江苏民企高质量发展之道2022-10-07
  • 果农“看数生产” 数字化转型加速产业高质量发展2022-10-27
  • 在希望的田野上机械化作业成为“主力军” 助力秋粮颗粒归仓2022-09-18
  • 【奋进新征程 建功新时代·老区新貌】智慧物流串起现代供应链2022-11-06
  • 金秋十月丰收忙 各地秋收加速推进2022-11-08
  • 新能源车销量爆发式增长 前三甲几乎占据市场半壁江山2022-10-01
  • 政策加码驱动车市“挖潜” 下沉市场成扩内需重点2022-09-20
  • 快换工装有何意义?2023-04-26
  • 江西于都:一座红色之城的新长征路2022-10-04
  • 7月中国汽车经销商库存系数为1.45 处于合理范围内2022-10-08
  • 历代iPhone特殊配色回顾劝你别买暗夜紫2022-09-17
  • 地址:昆山开发区同丰东路1000-125号

    手机:18550883379

    电话:18550883379

    邮箱: ksgsck@163.com

    Copyright © 2022 All 昆山高实创科自动化技术有限公司 Reserved. 本站推荐:零点定位系统,零点定位,零点定位器,快换夹具,德国AMF,柔性夹具,液涨芯轴,自定心夹具,机外装夹,预调站

    苏ICP备2022026216号 XML地图