当前位置:首页 >> 新闻中心 >> 展会信息

同时读懂40种语言 人工智能助力跨语言交流

时间:2022-09-21   访问量:201

一段包含中文、英语、韩语、日语、阿拉伯语、越南语等40种语言的文字如何理解?大多数人做不到的事情,经过训练的人工智能机器却能做到。

在近日举办的世界权威多语言理解评测XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)中,哈工大讯飞联合实验室(HFL)团队以总平均分84.1位列榜首,刷新世界记录。

XTREME评测旨在全面考察模型的多语言理解与跨语言迁移能力。与以往单语言自然语言理解评测任务不同的是,XTREME中的每一个任务都覆盖了多种语言,并且包含句对分类、序列标注、阅读理解、句子检索赛道,共四大类九个任务。

那么,机器是如何做到多语言理解的?比赛负责人、哈工大讯飞联合实验室核心技术研究员杨子清介绍,他们通过自主研发的跨语言对比学习技术,利用知识蒸馏技术进行自监督学习和知识迁移,鼓励模型学习不同语言中的语义相似性,与此同时,还创新性地融入了细粒度的语言学特征,帮助模型克服训练不足的困难,解决低资源语言学习不充分的问题,同时使之适应不同语言的形态学特点。

“这就意味着,通过本土语言学习,机器可以在少量其他语言语料的情况下,通过类比学会这门语言,减少了收集语料、语音标注等大量工作。”杨子清补充解释。

除了多语言,科大讯飞还在少数民族语言处理方面推出了预训练模型CINO(Chinese mINOrity pre-trained language model)。

杨子清介绍,“少数民族语言处理是中文信息处理中不可缺少的一环,也是中文信息处理多样性的一种体现。这项技术的进步将极大改善我国少数民族语言学习问题。”

国内少数民族语言语料稀缺、获取难度大等原因,相关技术研究相对匮乏,而主流的多语言模型也无法很好地处理国内少数民族语言文字。“希望未来能够进一步促进业内少数民族语言相关的技术研究,推动少数民族语言相关技术的应用落地。未来支持各少数民族语言的多语言搜索引擎等文字应用工具或将成为可能。”杨子清说。

更多推荐:
  • 重点聚焦城市更新 上海静安32个重点项目集中开工2022-09-28
  • 投资中国就是投资未来2022-10-31
  • 推动文明养犬 共建文明城市2022-10-03
  • 浙江湖州长兴:打造新能源产业科创“研发+智造”高地2022-09-25
  • 进口液压夹具你选错了!2023-04-25
  • 大思政课在河北肃宁,看“新农人”逐梦乡村振兴2022-09-18
  • 滇中引水工程建设者——提速攻坚创佳绩(喜迎二十大)2022-09-18
  • 欧盟推出3000亿欧元投资计划:旨在摆脱对俄能源依赖2022-11-01
  • 第四届中国—阿拉伯经贸投资高峰论坛在厦门召开2022-11-02
  • 26个省会城市常住人口数据:8城超千万,这些城市增长迅猛2022-09-27
  • 【权威解读】有效投资精准发力 投资实现良好开局2022-11-02
  • 我在中国看二十大 | 格鲁吉亚记者:中国以开放的姿态面向世界2022-10-29
  • 奋力在新征程中创造新的辉煌(沿着总书记的足迹·广东篇)2022-09-28
  • 条式虎钳安装在旋转传动设备上的优点是什么?2022-10-19
  • 稳字当头抓落实丨培育200家智能制造示范工厂,支持政策出台提升消费品工业数字化水平2022-10-09
  • 《自然》:中国科研投资结出累累硕果2022-11-01
  • 奔驰(中国)汽车销售有限公司、北京奔驰汽车有限公司召回部分进口及国产汽车2022-09-30
  • 央视网超级工厂走进索菲亚,看定制家居企业如何“超前”发挥!2022-11-07
  • 《重庆市两化融合发展数据地图》发布2022-10-09
  • 重庆:科技赋能 智慧守护一江碧水2022-11-02
  • 地址:昆山开发区同丰东路1000-125号

    手机:18550883379

    电话:18550883379

    邮箱: ksgsck@163.com

    Copyright © 2022 All 昆山高实创科自动化技术有限公司 Reserved. 本站推荐:零点定位系统,零点定位,零点定位器,快换夹具,德国AMF,柔性夹具,液涨芯轴,自定心夹具,机外装夹,预调站

    苏ICP备2022026216号 XML地图