![Conformer-2 Conformer-2](https://xbai.ai/wp-content/uploads/2023/08/WX20230804-103254@2x.png)
简介:
Conformer-2是一款专为自动语音识别(ASR)设计的尖端人工智能模型。它基于Conformer-1的成功,并在包含110万小时英语音频的广泛数据集上进行训练,从而实现了在语音识别方面的显著改进。
功能:
该模型的主要目标是增强对专有名词、字母数字和噪声鲁棒性的识别能力,通过关注这些关键领域,提高了准确转录语音内容的能力。Conformer-2采用了模型集成技术,不是依赖于单个教师模型的预测,而是从多个强大的教师中生成标签,以减少方差并提高性能。尽管模型尺寸有所增加,但在速度方面仍表现出改进,处理速度更快。
应用:
在实际应用中,Conformer-2展示了各种面向用户的指标的显着增强,包括字母数字方面的31.7%的提高,专有名词错误率方面的6.8%的提高以及噪声鲁棒性方面的12.0%的提高。
总之,Conformer-2被证明是专注于使用语音数据的生成式AI应用程序的理想选择,其卓越的语音到文本转录功能使其成为生成具有卓越精度和可靠性的准确转录的宝贵工具。
通义听悟是阿里云推出的基于大模型的工作学习AI助手,是通义家族第一个面向大众的AI产品。依托通义千问语言模型、音视频ai模型能力,为用户带来音频和视频内容记录和阅读的全新体验。