语音系统有哪些功能?这篇文章带你全面了解!

tmyb

大家今天跟大家伙儿聊聊我最近捣鼓的这个语音系统实践过程,还挺有意思的。

我就是想弄个能听懂人话的玩意儿。你知道,就像电影里那种,对着它说句话,它就能帮你干活,多酷!所以我就开始琢磨这事儿。

第一步:让它能听见

语音系统有哪些功能?这篇文章带你全面了解!

得让这系统能“听见”声音?我一开始想得简单,直接拿麦克风录音不就完?结果发现没那么容易。录下来的声音,电脑可不认识,它只认识数字。得把声音变成数字,这叫啥来着?对,好像叫“语音识别”!

我找些资料,发现这玩意儿还挺复杂的,得用啥“模块”来处理。我找个现成的,叫ASR,据说是“自动语音识别”的缩写。管它,能用就行!

  • 我把麦克风接上电脑。
  • 然后用这个ASR模块把声音录下来。
  • 你猜怎么着?它真把声音变成文字!
  • 语音系统有哪些功能?这篇文章带你全面了解!

第二步:让它能听懂

能“听见”还不够,还得让它“听懂”。这就像你跟人说话,他听见,但不明白是啥意思,那不白搭嘛

这一步更麻烦。我发现得用啥“自然语言处理”,简称NLP。听着就头大!不过没关系,咱有的是耐心。我找个开源的NLP库,开始研究。

我试着给它输入一些简单的句子,比如“开灯”、“关灯”之类的。然后,我得告诉它,这些句子是啥意思。这过程有点像教小孩说话,得一遍一遍地教。

    语音系统有哪些功能?这篇文章带你全面了解!

  • 我输入“开灯”。
  • 我告诉系统,这是“打开”的意思,并且要操作“灯”。
  • 我输入“关灯”。
  • 我告诉系统,这是“关闭”的意思,并且要操作“灯”。

慢慢地,它就能明白一些简单的指令。

语音系统有哪些功能?这篇文章带你全面了解!

第三步:让它能干活

光听懂还不行,得让它能干点实事儿!

我琢磨着,先弄个简单的,就控制个灯。我买个智能灯泡,可以用程序控制。然后,我把NLP处理的结果和控制灯泡的程序连起来。

  • 我对麦克风说:“开灯”。
  • ASR模块把它变成文字“开灯”。
  • 语音系统有哪些功能?这篇文章带你全面了解!

  • NLP模块分析出这是“打开”+“灯”的意思。
  • 程序控制智能灯泡,灯亮!

哈哈,成功!虽然只是个简单的例子,但起码能用!

总结一下

这回实践,我算是对语音系统有个初步的解。从一开始的啥也不懂,到能控制个灯,还挺有成就感的。

语音系统有哪些功能?这篇文章带你全面了解!

当然这中间也遇到很多问题 比如我的口音有时候重点,它就听不清楚等很多问题需要我去调整与适应。不过这不就是学习的乐趣嘛

以后我还想继续研究,让它能听懂更复杂的指令,能做更多的事情。等我有新的进展,再来跟大家分享!