90块一个小时的音频转文字软件？这也太坑了！六行代码轻松实现！ - 好文

前几天工作中遇到需要把音频转为文字稿的任务，顺便学了个新词语：扒词。

扒词：根据视频信息获得文字信息，即根据录音或者台词，然后转字幕。

拿音频找导演联系扒词，结果导演居然说视频扒词可以，音频就算了吧，算了吧……！

……天下没有免费的午餐。

感谢万能的知乎！让我找到了IBM 爸爸的Speech to text！

第一步

点击首页紫色的那个「Star for free in IBM Cloud」按钮，注册IBM Cloud并登陆（注册不了的亲，记得科♂学上网）。

第二步

添加服务（因为我已经加了服务，没法给大家截图了，自己找找吧），添加后是这样的：

点击现有服务，找到已有的服务。

点击服务名称查看详情。

出现下面这行字说明装好了。

第四步

打开Jupyter Notebook开始写代码啦！

import speech_recognition as sr #加载包

r = sr.Recognizer() with sr.WavFile("E://1.mp3") as source: #请把引号内改成你自己的音频文件路径

audio = r.record(source)

运行这一步发现报错了。

原来要wav格式。推荐一个好用的神器：格式工厂。音频视频文件转格式我都用它，方便小巧。

嗯……虽然准确率没有100%，但也已经比较可观了！！

它支持多种语言，只需要把language变量改成以下这些就可以实现不同语言的转换：

* ar-AR 阿根廷语
* en-UK 英式英语
* en-US 美式英语
* es-ES 西班牙语
* fr-FR 法语
* ja-JP 日语
* pt-BR 巴西葡萄牙语
* zh-CN 中文
每个免费账户每个月可使用100分钟，30天不活跃服务将删除。

6行代码轻松音频转文字，你学会了嘛？

终于不用花冤枉钱了！进群：125240963 即可获取数十套PDF哦！私信小编需要源码即可获取源码！

热门工具换一换