作者:于洋
链接:https://www.zhihu.com/question/59482470/answer/166797151
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
不好意思,我觉得想要更好的帮助你,依然需要先以提问题作为开端,但并不是真的需要你回答,只是起个引导或者侧面帮助的作用吧,也辅助你进一步完善你的问题描述。
1 你对linux操作系统的熟悉程度如何? 你将要进行的大部分工作应该都需要在linux下完成。
2 你的英文水平如何?虽然中文的教程和经验网上也应该能找到不少,但是有很多具体问题,可能还是需要在英文的资料里面才能得到答案。
3 这个问题你已经开始思考两三天了,现在是否对语音识别的框架有了初步的了解了?
4 上面三个问题其实还不是最重要的,最重要问题还是你为什么要搭建这个语音识别器。 你的描述是导师给了你这个任务。我觉得还是要讲清楚,这个任务和你的将来的研究是什么关系。 你是从事语音识别这个方向的研究,从一个简单的识别器开始不断地深入下去;还是这个任务只能算作你的一个小项目,希望能在很短的时间内,把它完成就可以了。
最后也附上一些,我根据对你掌握程度的推测,现在可以做的步骤。(我默认你不是想要特别深入研究语音识别)
1 安装linux系统,如果不熟悉的话,我推荐你就网上寻找如何安装ubuntu,这个的能够找到的资源最多最全面。
2 安装kaldi
3 学会如何跑通 thchs30 , 同时继续学习语音识别的框架
4 阅读thchs30训练用的脚本,看看能不能把脚本 和 学习到的语音识别的框架 对应起来
5 确定自己想要搭建的语音识别的输入和输出是什么,形式是什么样子的。 比如你想识别的语句是有限的,或者遵从某种语法的;还是想要识别任意中文语句。确定好之后,思考如何对脚本进行修改可以达到目的。
6我想到这个步骤,应该就能独立思考 或者提出一些更具体的语音识别的问题了。
我觉得前两个步骤,如果是新手的话,需要1-2周来完成。第三个步骤我不清楚,我的猜测也是需要1周以上。 后面的就全都靠你的储备知识和学习知识的能力了。当然上面这几条完全不能保证你能完成你所描述的,识别“日常”的“几句话”。 只能说是个起始点吧。从第四条开始,难度应该是陡升。