“乐百家”可在全球采110多种语言(口音)的语音数据,覆盖亚洲、美洲、北非、欧洲等多70多个国家和地区,并随着对客户需求的不断满足,乐百家能提供的语言种类和数据采集种类还在不断的增多。
“乐百家”具有大量可授权使用的、多语种、大规模工程化语音语料库资源,请点击“乐百家数据中心-工程化语音数据库资源”查看;
或者,如果您需要适合于科研使用的语音语料库资源,请点击“乐百家数据中心-科研语音数据库资源”查看;
语音数据采集服务种类
“乐百家”提供多种类型的语音数据采集服务,其中包括:
语音合成数据采集:
- 语音合成数据采集(隐马算法)
- 语音合成数据采集(拼接算法)等
语音识别数据采集:
- 车载语音数据采集
- 电话语音数据采集(手机/固话)
- 自由对话语音数据采集
- 广播语音数据采集
- 桌面语音数据采集
- 情感语音数据采集等
以及其他特殊麦克风和嵌入式设备、多模态语音数据采集、歌曲哼唱数据采集等
应用领域
语音合成、语音识别、说话人识别、语音评测、情感识别、音乐检索等
覆盖语言
汉语(大陆中文、香港中文、台湾中文、各地方言和重口音)、藏语、蒙语、维吾尔族语、西班牙语(西班牙西班牙语,墨西哥西班牙语,美国西班牙语等)、法语(加拿大法语,法国法语等)、英语(美国英语,英国英语,澳大利亚英语,中国英语,日本英语等)、阿拉伯语等110多种语言。(点击“语言覆盖”了解更多)
语音数据采集服务的多种场景环境
- 专业录音室:录音棚,消声室,回声室等,适合于进行语音合成数据采集;
- 室内不同噪声环境:办公室,家庭,超市,咖啡厅,餐厅,商场等,适合于进行语音识别、发音人识别的数据采集;
- 室外不同噪声环境:街道,公园,公共汽车,地铁,广场等,适合于进行多种环境的下的语音识别、发音人识别的数据采集;
- 车载:停车,不同时速的城市道路驾驶,高速公路驾驶等,适合于进行车载语音识别数据采集;
- 其他特殊定义环境
平台系统
乐百家能提供基于电脑、平板、手机等多种设备、支持Android\Window\iOS 等多种OS系统采样率和录音通道的语音数据采集服务
采样率和录音通道
常用的有:8K,16Bit;16K,16Bit;22K,16Bit;44K,16Bit;48K, 16Bit
情景风格
朗读、自然语音、对话语音、会议语音、情感语音、演讲语音、歌曲哼唱、多模态语音等,脚本语音,引导性语音等多种语音数据采集服务
(点击“语音数据转写和标注”了解语音数据转写和标注业务)
