语音数据采集-语音数据采集流程-语音数据采集方法有哪些?

什么是语音数据采集?
如果你需要一款聊天机器人或者是智能语音系统,你会需要语音数据来训练算法模型。不同的语音产品需要不同程度的,量级的语音数据。语音数据又分为很多不同的类型,常见的类型有语音识别数据(ASR),和语音合成数据(TTS)。

数据标注行业的快速发展各方面的需求越来越多,这其中就包括各项目方对数据方面的大量需求,比如语音、图片、视频等多方面的需求。在当今社会快速发展的今天,信息量的海量爆发人们对个人信息的重视程度也越来越高,保护个人信息的不受非法利用的也越来越受到各方面的保护。今天我们主要就来目前项目需求量比较大的语音数据采集,因此语音数据采集业务由此诞生。

 

语音数据采集流程?

一、要考虑如何做到如何保护采集用户信息不被泄露。

二、要考虑到如何确保项目合作方做到采集来的语音数据不被泄露。

三、采集语音数据相关各方都 明确数据保护责任,制定客方详细避免数据不被外泄的保密合同条款。

四、做大量语音采集数据采集最好是能找像学校、工厂,社团,微信或者QQ客户群这种人员群体数量比较大的人群,有专门人员的负责,对这些人员对接,对接采集人员之前充分讲清楚要采集什么样的语音。他们的数据信息不被用于其它用途。被采集人员报酬,需要什么样的语音,具体什么标准。

五、对接好语音采集人员后,要明确采集的环境,噪音,场地,设备这些条件的责任。

六、采集结算周期一定要明确,该什么时间结算就一定要什么时间结算,信用问题其它也不需要多读,多家都应该懂得,承诺过的东西绝对不能以其它任何理由去克扣少支付,这样对以后项目的开始都是非常不利的。
 

语音数据采集-语音数据采集流程-语音数据采集方法有哪些?

语音识别数据的分类

语音识别数据可以分为:

  1. 受控:脚本语音数据
  2. 半控制:基于场景的语音数据
  3. 自然:无脚本或对话式语音数据

1. 脚本语音数据

脚本语音识别数据采集通常包括语音命令、唤醒词采集或两者的一种组合形式。参与数据采集的人员通常被要求阅读一组已经设置好的唤醒词或者语音命令语句。比如说:

  • “小爱,请调大音量”
  • “小爱,声音调大点”
  • “小爱,太轻了”

以上是表述同一个意思但不同说法的指令。这类型的数据通常被采集用来观察同一个命令的不同表达方式而不关注采集人员说的具体内容。

2. 基于场景的语音数据

基于场景的语音数据是说话人员根据特定场景所说的一组语音命令,用于自然语音采集。采集人员会被要求在指定场景下,说出一系列命令。比如场景是:询问A地图软件如何去陆家嘴。参与者可以说:

  • A,我怎么去陆家嘴
  • A,给我去陆家嘴的导航路线
  • 带我去陆家嘴,A

这类型的数据通常在针对同一场景的不同方式(命令意图)时被进行抽样采集。

3. 无脚本或对话式语音数据

无脚本或对话式语音数据是要求多个人进行对话的“自然”语音采集。采集人员可以坐在一起围绕某一话题进行讨论。比如话题是:建筑。

  • 参与者1: 今年的普里兹克奖你觉得会是哪个建筑师?
  • 参与者2: 我觉得可能是比较冷门的那些吧。
  • 参与者3: 中国的你们觉得有戏吗?
  • 参与者1: 我觉得希望不大,估计还是海外的概率大一点。

这类数据通常被应用于训练AI针对自然会话的多样性,训练聊天机器人等AI系统。

内容来源为互联网收集,如有侵犯您的权益,请联系客服删除。

转载注明出处:https://www.dudutalk.com/remen/1003.html