财经资讯

微软上线语音评测功能:基于Azure云构建,赋能口语学

发布日期:2020-06-27 06:13   来源:未知   

近年来,随着人工智能技术的不断成熟,企业数字化转型步伐的加快,AI的触角逐渐深入到各个场景,使人类的生产生活变得更加智慧化。在听觉方面,智能语音技术成为各大科技公司们攻坚的重要领域。

一家老牌科技巨头微软,在语音合成技术、语音识别技术上深耕多年,面向全球合作伙伴开放和落地其技术能力,提供多种智能语音解决方案。

5月20日,在2020微软Build开发者大会上,微软上线了语音评测功能,该功能基于Azure语音服务Speech-to-text(语音转文本)构建。用户可以上传跟读文本和音频对发音人的语音从准确度,流利度和完整度进行评测。在教育领域,尤其是口语学习方面,因具有高识别准确率、拟专家打分的高一致性,可以让口语学习的教和学更加高效方便。

近日,微软亚太研发集团智能语音团队接受了雷锋网等媒体的线上采访,对微软智能语音评测技术的优势和应用场景等内容进行了详细介绍。微软亚太研发集团云计算与人工智能事业部产品总监丁秉公、微软亚太研发集团云计算与人工智能事业部资深产品经理马莉莎参与了本次采访。

语音评测的四个维度:专业性、实时性、稳定性、可定制性

微软亚太研发集团云计算与人工智能事业部资深产品经理马莉莎表示,目前语音评测市场需求的考量方向主要有四个维度:

专业性。

实时性。

稳定性。

可定制性。

对于专业性,微软语音评测的每个语言从10万小时以上的母语大数据中学习当地语言纯正口音发音,针对各年龄段多维度精准打分,从文章??句子??词??音素四个环节,层层评估,拟专家团打分一致性高。

马莉莎提到,语音评测的专业性考量对比的是和母语专家评测的一致性。业内通用皮尔森相关系数来反映两个序列线性相关程度的统计量。范围在-1到1之间,1表示完全相关,-1表示完全相反,0表示乱序无关,数值越大表示相关度越高。微软语音评测在一致性上达到了0.75,与母语专家水平接近。