语音识别框架搭建思路

分类：04 技术开发 /

更新：2023-08-14 09:49:22 / 创建：2023-08-04 16:06:49

作者：于洋
链接：https://www.zhihu.com/question/59482470/answer/166797151
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

不好意思，我觉得想要更好的帮助你，依然需要先以提问题作为开端，但并不是真的需要你回答，只是起个引导或者侧面帮助的作用吧，也辅助你进一步完善你的问题描述。
1 你对linux操作系统的熟悉程度如何？你将要进行的大部分工作应该都需要在linux下完成。
2 你的英文水平如何？虽然中文的教程和经验网上也应该能找到不少，但是有很多具体问题，可能还是需要在英文的资料里面才能得到答案。
3 这个问题你已经开始思考两三天了，现在是否对语音识别的框架有了初步的了解了？
4 上面三个问题其实还不是最重要的，最重要问题还是你为什么要搭建这个语音识别器。你的描述是导师给了你这个任务。我觉得还是要讲清楚，这个任务和你的将来的研究是什么关系。你是从事语音识别这个方向的研究，从一个简单的识别器开始不断地深入下去；还是这个任务只能算作你的一个小项目，希望能在很短的时间内，把它完成就可以了。

最后也附上一些，我根据对你掌握程度的推测，现在可以做的步骤。（我默认你不是想要特别深入研究语音识别）
1 安装linux系统，如果不熟悉的话，我推荐你就网上寻找如何安装ubuntu，这个的能够找到的资源最多最全面。
2 安装kaldi
3 学会如何跑通 thchs30 ，同时继续学习语音识别的框架
4 阅读thchs30训练用的脚本，看看能不能把脚本和学习到的语音识别的框架对应起来
5 确定自己想要搭建的语音识别的输入和输出是什么，形式是什么样子的。比如你想识别的语句是有限的，或者遵从某种语法的；还是想要识别任意中文语句。确定好之后，思考如何对脚本进行修改可以达到目的。
6我想到这个步骤，应该就能独立思考或者提出一些更具体的语音识别的问题了。

我觉得前两个步骤，如果是新手的话，需要1-2周来完成。第三个步骤我不清楚，我的猜测也是需要1周以上。后面的就全都靠你的储备知识和学习知识的能力了。当然上面这几条完全不能保证你能完成你所描述的，识别“日常”的“几句话”。只能说是个起始点吧。从第四条开始，难度应该是陡升。

东始生我心自空，罪福无主。

语音识别框架搭建思路

分类：04 技术开发 /

更新：2023-08-14 09:49:22 / 创建：2023-08-04 16:06:49

是日已过，命亦随减，如少水魚，斯有何乐？

东始生 我心自空，罪福无主。

语音识别框架搭建思路

分类：04 技术开发 /

更新：2023-08-14 09:49:22 / 创建：2023-08-04 16:06:49

是日已过，命亦随减，如少水魚，斯有何乐？

东始生我心自空，罪福无主。