当前位置:首页 >> 新闻中心 >> 展会信息

同时读懂40种语言 人工智能助力跨语言交流

时间:2022-09-21   访问量:148

一段包含中文、英语、韩语、日语、阿拉伯语、越南语等40种语言的文字如何理解?大多数人做不到的事情,经过训练的人工智能机器却能做到。

在近日举办的世界权威多语言理解评测XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)中,哈工大讯飞联合实验室(HFL)团队以总平均分84.1位列榜首,刷新世界记录。

XTREME评测旨在全面考察模型的多语言理解与跨语言迁移能力。与以往单语言自然语言理解评测任务不同的是,XTREME中的每一个任务都覆盖了多种语言,并且包含句对分类、序列标注、阅读理解、句子检索赛道,共四大类九个任务。

那么,机器是如何做到多语言理解的?比赛负责人、哈工大讯飞联合实验室核心技术研究员杨子清介绍,他们通过自主研发的跨语言对比学习技术,利用知识蒸馏技术进行自监督学习和知识迁移,鼓励模型学习不同语言中的语义相似性,与此同时,还创新性地融入了细粒度的语言学特征,帮助模型克服训练不足的困难,解决低资源语言学习不充分的问题,同时使之适应不同语言的形态学特点。

“这就意味着,通过本土语言学习,机器可以在少量其他语言语料的情况下,通过类比学会这门语言,减少了收集语料、语音标注等大量工作。”杨子清补充解释。

除了多语言,科大讯飞还在少数民族语言处理方面推出了预训练模型CINO(Chinese mINOrity pre-trained language model)。

杨子清介绍,“少数民族语言处理是中文信息处理中不可缺少的一环,也是中文信息处理多样性的一种体现。这项技术的进步将极大改善我国少数民族语言学习问题。”

国内少数民族语言语料稀缺、获取难度大等原因,相关技术研究相对匮乏,而主流的多语言模型也无法很好地处理国内少数民族语言文字。“希望未来能够进一步促进业内少数民族语言相关的技术研究,推动少数民族语言相关技术的应用落地。未来支持各少数民族语言的多语言搜索引擎等文字应用工具或将成为可能。”杨子清说。

更多推荐:
  • 走进县城看发展 | 广东博罗 :交通发展壮产业 活力涌动气象新2022-09-29
  • 习近平出席上海合作组织成员国元首理事会第二十二次会议并发表重要讲话 强调秉持“上海精神” 加强团结合作 推动构建更加紧密的上海合作组织命运共同体2022-09-21
  • 今年前十个月 我国机械行业经济运行稳中向好2022-09-18
  • 央视网《超级工厂》走进卫龙放心工厂 探访卫龙“六大领先”背后的智造能力2022-11-05
  • 秋蚕迎丰收:河北内丘蚕桑产业“破茧成蝶”2022-11-07
  • 截至9月底 全国累计发电装机容量约24.8亿千瓦2022-11-05
  • 黑灯工厂、低碳工厂、会思考的工厂,记者带你去看未来工厂2022-10-29
  • 焦点访谈:新基建 新生活 智慧交通驶入快车道2022-11-03
  • 融合发展 打造自主可控的汽车芯片供应链体系2022-09-30
  • 国家发展改革委:4月份审批核准固定资产投资项目8个,总投资188亿元2022-11-15
  • 【数字十年】中国开放的大门越开越大2022-11-07
  • 江苏:南京建邺第二支政府主导产业投资基金备案落地2022-11-04
  • 截至2021年底 国家节水型城市已建成130个2022-10-06
  • 百余幅世界经典名画高清复刻作品亮相北京智慧长阳美术馆2022-11-03
  • 最高可飞1000米!小鹏飞行汽车出征迪拜2022-09-15
  • 推动绿色发展 建设美丽中国——“中国这十年”系列主题新闻发布会聚焦新时代生态文明建设成就2022-10-06
  • 故宫午门夜晚天空明亮星轨 北京空气质量改善真实写照2022-10-05
  • 今年全国固定资产投资实现良好开局(经济新方位)2022-11-06
  • 农业农村部加快推进种业科技自立自强、种源自主可控2022-09-15
  • 【社论】前进!向着光荣和梦想的新征程2022-11-03
  • 地址:昆山开发区同丰东路1000-125号

    手机:18550883379

    电话:18550883379

    邮箱: ksgsck@163.com

    Copyright © 2022 All 昆山高实创科自动化技术有限公司 Reserved. 本站推荐:零点定位系统,零点定位,零点定位器,快换夹具,德国AMF,柔性夹具,液涨芯轴,自定心夹具,机外装夹,预调站

    苏ICP备2022026216号 XML地图