场景素材来源
YouTube CCTV中央电视台 官方频道
我们爬取了该频道新闻联播2019年全年视频内容。分12个月,每个月抽取2期,共计24期节目,并抽取音频,共计时长约12小时
场景特点
- 环境
- 主体为密闭录音棚,安静,无背景噪声
- 穿插少量会场、户外采访
- 拾音设备
- 专业高保真麦克风,等同于近场,声音质量极好
- 说话人
- 主体为专业播音员,穿插少量领导人讲话,记者及被采访对象
- 说话方式
- 主体为朗读式,中等语速,几乎无口误、重复、停顿等现象
- 方言
- 极标准普通话
- 内容领域
- 国家时政新闻
新闻联播场景的以上特点,接近语音识别的理想场景,基本可以代表现有的中文语音识别系统性能上限,因此我们选择该场景作为 TIOBE Benchmark 的第一个测试领域。
测试结果
请跳转至TIOBE 滚动测试页面, 该页面包含所有历史及最新性能数据。