第24章-智能语音识别(3/3)
再敲下最后一个回车之后,罗辑长出了口🍸气。刚才用老大的心思编写的代码,是语音识别。与传统的语音识别相似的是,它依然是将声音矩阵转换为文本,将每一帧识别成状态,再将状态组合成音素,最后再把音素组合成词语。
不同的是,它不完全依靠于“声学模型”,更不需要构建状态网络,因为它具有一定的自我学习和推理能力,☄近似的元素完全可以自行🄑解决。
“应该叫智能语音识别!”
罗辑一遍检查着代码,一遍喃喃自语。现在市面上的语音系统,更多是🚄🐹🄯依📥🜿赖网络,因为人在发音的时候往往会存在口音不正、吐字不清的问题,要分析用户说的话必须建立在大数据的前提下,必须录入了足够多的音源。
这种模式不仅低端,而且效率低下,体感也不行。而罗辑编💎🐭写出来的这套,只需要一套最基本的音源,在差别率小于百分之五十的情况下,识别率更高达百分之九十五!
“95%?”罗辑自己都有些🌽🄦⛞不信,因为这些数据都是科技树上所记录的,在没有做出实物之前,的确让人怀疑。
没有九十五,也就九十吧?罗辑有这个信心🏋。
实践永远是最好的答案。想到这里🍾,罗辑便让小音自行在网上收集语音库,短时间将所有的语音🇱收集完肯定是不现实的,但是可以先弄一些常用语。
罗辑决定在常用音源下载完毕之后,立刻着手语音录入功能,他可不想每次🔱🄜下指令还要输入文本,那显的多lo啊?这就是罗辑的思维,一个智能核🔡心他还觉得低端,甚至语音都只是起步!
不得不说,懒是人类进步的阶梯。
在小音提🜌⛪示搜索完毕之♾🍿后,罗辑就开始了下一步工作,导入音源。听着这些字正⛽腔圆的播报音,罗辑有些感叹,小音的智能程度越来越高了,她都是在正规且专业化的网站收集的,并且还会进行筛选。
在转移到了服务器之后,罗辑再次让小音开🏋始了学习,这次的语音收集不过是个检验。
分🐷解音源,罗辑从🎻🖔中提取了很多音素和状态,剩下的工作就是小音的事了。人工录入是一个繁琐的过程,这绝不是罗🍪辑一个人能够完成的工作,好在有了小音。
工作起来的罗辑是忘记时间⛀🗒🛇的,有了服务器的强大🀞♠计算能力支持,罗辑感觉自己的事根本做不完。
趁着小音还在处理数据的时候,🖬罗辑便开始准备文本转换为语音的工作,未雨绸缪早晚都🇼🝻🐙要用到。手机用户请访问http:🙸🏌😬//.
不同的是,它不完全依靠于“声学模型”,更不需要构建状态网络,因为它具有一定的自我学习和推理能力,☄近似的元素完全可以自行🄑解决。
“应该叫智能语音识别!”
罗辑一遍检查着代码,一遍喃喃自语。现在市面上的语音系统,更多是🚄🐹🄯依📥🜿赖网络,因为人在发音的时候往往会存在口音不正、吐字不清的问题,要分析用户说的话必须建立在大数据的前提下,必须录入了足够多的音源。
这种模式不仅低端,而且效率低下,体感也不行。而罗辑编💎🐭写出来的这套,只需要一套最基本的音源,在差别率小于百分之五十的情况下,识别率更高达百分之九十五!
“95%?”罗辑自己都有些🌽🄦⛞不信,因为这些数据都是科技树上所记录的,在没有做出实物之前,的确让人怀疑。
没有九十五,也就九十吧?罗辑有这个信心🏋。
实践永远是最好的答案。想到这里🍾,罗辑便让小音自行在网上收集语音库,短时间将所有的语音🇱收集完肯定是不现实的,但是可以先弄一些常用语。
罗辑决定在常用音源下载完毕之后,立刻着手语音录入功能,他可不想每次🔱🄜下指令还要输入文本,那显的多lo啊?这就是罗辑的思维,一个智能核🔡心他还觉得低端,甚至语音都只是起步!
不得不说,懒是人类进步的阶梯。
在小音提🜌⛪示搜索完毕之♾🍿后,罗辑就开始了下一步工作,导入音源。听着这些字正⛽腔圆的播报音,罗辑有些感叹,小音的智能程度越来越高了,她都是在正规且专业化的网站收集的,并且还会进行筛选。
在转移到了服务器之后,罗辑再次让小音开🏋始了学习,这次的语音收集不过是个检验。
分🐷解音源,罗辑从🎻🖔中提取了很多音素和状态,剩下的工作就是小音的事了。人工录入是一个繁琐的过程,这绝不是罗🍪辑一个人能够完成的工作,好在有了小音。
工作起来的罗辑是忘记时间⛀🗒🛇的,有了服务器的强大🀞♠计算能力支持,罗辑感觉自己的事根本做不完。
趁着小音还在处理数据的时候,🖬罗辑便开始准备文本转换为语音的工作,未雨绸缪早晚都🇼🝻🐙要用到。手机用户请访问http:🙸🏌😬//.