当前位置:首页 >> 新闻中心 >> 展会信息

同时读懂40种语言 人工智能助力跨语言交流

时间:2022-09-21   访问量:178

一段包含中文、英语、韩语、日语、阿拉伯语、越南语等40种语言的文字如何理解?大多数人做不到的事情,经过训练的人工智能机器却能做到。

在近日举办的世界权威多语言理解评测XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)中,哈工大讯飞联合实验室(HFL)团队以总平均分84.1位列榜首,刷新世界记录。

XTREME评测旨在全面考察模型的多语言理解与跨语言迁移能力。与以往单语言自然语言理解评测任务不同的是,XTREME中的每一个任务都覆盖了多种语言,并且包含句对分类、序列标注、阅读理解、句子检索赛道,共四大类九个任务。

那么,机器是如何做到多语言理解的?比赛负责人、哈工大讯飞联合实验室核心技术研究员杨子清介绍,他们通过自主研发的跨语言对比学习技术,利用知识蒸馏技术进行自监督学习和知识迁移,鼓励模型学习不同语言中的语义相似性,与此同时,还创新性地融入了细粒度的语言学特征,帮助模型克服训练不足的困难,解决低资源语言学习不充分的问题,同时使之适应不同语言的形态学特点。

“这就意味着,通过本土语言学习,机器可以在少量其他语言语料的情况下,通过类比学会这门语言,减少了收集语料、语音标注等大量工作。”杨子清补充解释。

除了多语言,科大讯飞还在少数民族语言处理方面推出了预训练模型CINO(Chinese mINOrity pre-trained language model)。

杨子清介绍,“少数民族语言处理是中文信息处理中不可缺少的一环,也是中文信息处理多样性的一种体现。这项技术的进步将极大改善我国少数民族语言学习问题。”

国内少数民族语言语料稀缺、获取难度大等原因,相关技术研究相对匮乏,而主流的多语言模型也无法很好地处理国内少数民族语言文字。“希望未来能够进一步促进业内少数民族语言相关的技术研究,推动少数民族语言相关技术的应用落地。未来支持各少数民族语言的多语言搜索引擎等文字应用工具或将成为可能。”杨子清说。

更多推荐:
  • 第22届中国国际投资贸易洽谈会今天开幕2022-10-31
  • 汽车流通追寻高质量发展 金钥匙2022-10-06
  • 山西永和10万亩梯田开启机械化耕种模式2022-09-18
  • 上海:汽车供应链抢抓发展窗口期2022-10-05
  • 税惠助力土豆“变身记”2022-10-05
  • 特斯拉汽车(北京)有限公司、特斯拉(上海)有限公司召回部分进口及国产Model 3高性能版电动汽车2022-09-30
  • 第四届中国—阿拉伯经贸投资高峰论坛在厦门召开2022-11-02
  • 果农“看数生产” 数字化转型加速产业高质量发展2022-10-27
  • 钢铁行业碳达峰方案将实施,实现“双碳”面临哪些挑战2022-10-07
  • 助力复工复产,上海金山推出一揽子“暖”企服务2022-10-07
  • 2020年我国5G建设飞速发展 新增58万个5G基站2022-09-21
  • 加快推进湘赣粤港澳中医药全产业链联盟落地 更好助推中医药产业高质量发展2022-10-27
  • 断供!停产!日均倒闭400家企业!这里按下暂停键…2022-10-05
  • 工信部:中国纺织产业链自主可控能力持续增强2022-10-28
  • 江西南昌:拥抱“VR+医疗”新时代 共创“智慧医疗”新未来2022-11-02
  • 智造时代 蓝领如何升级“换装”?2022-10-06
  • 推动营商环境改革 北京市去年新设市场主体25.8万户2022-10-26
  • 焦点访谈:汇智能 添动能2022-09-26
  • 织密防护网 点亮平安灯——全国公安机关夏季治安打击整治“百日行动”提升群众安全感2022-09-30
  • 前三季度新能源汽车出口增长 带动产业链发展2022-10-29
  • 地址:昆山开发区同丰东路1000-125号

    手机:18550883379

    电话:18550883379

    邮箱: ksgsck@163.com

    Copyright © 2022 All 昆山高实创科自动化技术有限公司 Reserved. 本站推荐:零点定位系统,零点定位,零点定位器,快换夹具,德国AMF,柔性夹具,液涨芯轴,自定心夹具,机外装夹,预调站

    苏ICP备2022026216号 XML地图