macos – 在Mac OS X Mavericks中是否有API(或任何黑客)访问增强型听写?

我试图找到一种简单的方法将音频文件转录为文本(CMU Sphinx,Julius等对于不了解语音识别,配置语言模型,声学模型等的人来说很难).

我想知道是否有办法将我的音频文件传输到Mac OS 10.9 Mavericks的“Enhanced Dictation”功能,该功能允许本地,离线语音听写.

当我从耳机插孔中拨上一根跳线到我的线路时,我以为我很聪明,但不幸的是,当你开始口述时,它会使所有其他音频播放静音(有关如何禁用此静音的任何建议都会得到我的正确答案) ).

最佳答案 我还没有找到直接的方法.但是,您可以使用Soundflower作为解决方法.

例如,您可以在VLC中为您的输出选择Audio-> Audio Device-> Soundflower(2ch).然后在系统偏好设置 – >听写&语音 – >听写 – > Soundflower(2ch)[下拉麦克风图标下方].然后你可以在VLC中开始播放,并开始听写听(例如在TextEdit中)你应该看到转录出现.这种方法的缺点是它很慢(仅限于〜实时播放音频),并且不太有利于自动化工作流程.

注意:您必须在切换到TextEdit并启动ED之前开始播放音频.

点赞