如何在Python中将语音转换为文本

语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力。那么如何在Python中将语音转换为文本?如何使用SpeechRecognition 库在Python中将语音转换为文本?我们不需要从头开始构建任何机器学习模型,该库为我们提供了各种著名的公共语音识别API的便捷包装。

如何在Python中将语音转换为文本_业界动态_数字化

 使用pip安装库:

pip3 install SpeechRecognition

Okey,打开一个新的Python文件并导入它:

import speech_recognition as sr

 从文件读取

确保当前目录中有一个包含英语语音的音频文件(如果您想跟我一起学习,请在此处获取音频文件):

filename = "speech.wav"

该文件是从 LibriSpeech 数据集中获取的,但是您可以带上任何想要的东西,只需更改文件名,就可以初始化语音识别器:

# initialize the recognizer

r = sr.Recognizer()

以下代码负责加载音频文件,并使用Google Speech Recognition将语音转换为文本:

# open the filewith sr.AudioFile(filename) as source:

# listen for the data (load audio to memory)

audio_data = r.record(source)

# recognize (convert from speech to text)

text = r.recognize_google(audio_data)

print(text)

这需要几秒钟才能完成,因为它将文件上传到Google并获取了输出,这是我的结果:

I believe you're just talking nonsense

 从麦克风读取

这需要在您的计算机中安装PyAudio,以下是取决于您的操作系统的安装过程:

 视窗

您可以点安装它:

pip3 install pyaudio的Linux

您需要首先安装依赖项:

sudo apt-get install python-pyaudio python3-pyaudio

pip3 install pyaudio

 苹果系统

您需要先安装portaudio,然后才可以点安装它:

brew install portaudio

pip3 install pyaudio

现在,让我们使用麦克风转换语音:

with sr.Microphone() as source:

# read the audio data from the default microphone

audio_data = r.record(source, duration=5)

print("Recognizing...")

# convert speech to text

text = r.recognize_google(audio_data)

print(text)

这会从您的麦克风听到5秒钟,然后尝试将该语音转换为文本!

它与先前的代码非常相似,但是我们在这里使用Microphone()对象从默认麦克风读取音频,然后在record()函数中使用duration参数在5秒后停止读取,然后上传音频数据向Google获取输出文本。

您还可以在record()函数中使用offset参数在偏移几秒钟后开始记录。

另外,您可以通过将语言参数传递给accept_google()函数来识别不同的语言。例如,如果您想识别西班牙语语音,则可以使用:

text = r.recognize_google(audio_data, language="es-ES")

在此stackoverflow答案中查看支持的语言 。

通过上述介绍,如何在Python中将语音转换为文本相信大家已经清楚了吧,想了解更多关于Python的信息,请继续关注。

2
158
0
24

相关资讯

  1. 1、看懂90后肥宅一族:“9000岁”的宅不止于WIFI配外卖1674
  2. 2、四张图读懂移动互联时代企业该如何立足3487
  3. 3、“中国式SaaS”是怎样的?3269
  4. 4、生鲜:物流库存成本太大?SKU结构设计优化非常重要407
  5. 5、很多年轻人,并不爱银行3699
  6. 6、【创意锦囊】如何调动全民,发起互联网的病毒式营销?2608
  7. 7、高考后,知乎要开始和B站抢夺用户了?224
  8. 8、“暗网”有多“暗”?有人说,那里是网络世界的罪恶天堂4152
  9. 9、产品运营:理财产品的价值点设计要素2739
  10. 10、推荐算法模型应用——活动运营沙盘/促活引擎3633
全部评论(0)
我也有话说
0
收藏
点赞
顶部