【博闻社】Quartz报道,微软研究院宣布其语音转录系统转录电话内容的错误率低于专业转录者,即使人类转录的内容经过了第二个人的二次检查。
这一成就被认为是语音识别技术的一个重要里程碑。
微软的团队并没有将该成就归于算法或数据方面的任何突破,而是对现有AI架构的细调。
在对相同音频样本的测试中,人类专业转录者在NIST eval 2000测试集CallHome和 Switchboard 部分的错误率分别为5.9%和11.3%,而微软系统的错误率分别是5.9% 和 11.1%。
研究报告(PDF)发表在预印本网站上。