正在为传承语言文化注入全新生命力。中国运营商发布首个支持30种方言混说语音大模型。
25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。
中国幅员辽阔,“百里不同俗,十里不同音”。各种方言语法语音特征各不相同,传统的方言研究依赖于调查者主观感知标注,人力工程量巨大且难以系统标注。而AI能够更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。
构建高质量方言数据库,是方言保护和研究的基础。中国电信人工智能研究院已构建超过30种、超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等层面均居于业内前列。
此外,中国电信研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
指尖办政务“长三角交政通”服务登陆交通银行APP
“你知道附近哪里有充电桩吗?”“您在我们手机银行APP上就可以查...
“电子竞技指导员”赋能电竞服务业创造就业新角色
5月21日,2023年英雄联盟季中冠军赛总决赛,上千万电竞粉丝关...
这是一个蹦跶着讲和听的故事会丨21读书汇·亲子悦
5月27日下午,在六一国际儿童节即将来临之际,“21读书汇·亲子...
重磅!兆驰晶显与诺瓦星云签署战略合作协议!
2023年5月29日,全球Mini/MicroLED显示新标杆企...
精检细修确保暑运安全
为确保雷雨天气及繁忙暑运铁路行车安全,电气化局运管公司上海维管处...
科技点亮童年安全相伴成长弘扬传统文化
长期以来,中国移动通信集团江苏有限公司宿迁分公司积极践行央企责任...