我正在尝试研究可用的语音识别引擎和SDK,用于开发支持 Windows CE语音的应用程序.我遇到了Nuance,但没有看到任何其他的东西.如果可能的话,我更喜欢.Net SDK,但我想大多数都是C/C++.我很感激任何…
标签:speech-recognition
语音识别 – 如何使用Codename One的Google Speech API?
我想从手机录制音频,然后将其发送到谷歌语音非流媒体API.我可以使用Capture.captureAudio()进行录制,但后来我不知道什么是音频编码和采样率,因为它们需要 for the api request. 如何…
语音识别 – 正确配置Pocketsphinx
我一直在运行Debian Squeeze的VM上安装Pocketsphinx0.7.这工作正常,我可以尝试识别文件中的语音.为此,我已经构建了一些 python脚本,它们识别我得到的一堆文件,然后估计单词错误率.这些使用…
语音识别 – 从音频(语音)文件中提取音素
我正在寻找一个工具包/库,允许我从音频文件中提取音素.我在CMU Sphinx网站上看到sphinx3可以用来输出音素,但是我还没能在我的 windows box上成功构建它. 除了图书馆,建立自己的最佳方式是什么? 最…
语音识别 – 语音生成过程
我正在学习Rabiner的书中的语音识别.在这本书中,作者提出了一个问题,解释用于产生浊音,清音和爆音的独特语音制作过程作者说:当声带拉紧时,气流然后发出声音当声带松弛时,气流就会发出清音但没有任何说法爆炸性的声音,是的…
语音识别 – 使用CMU的sphinx4转录非数字数据
我最近正致力于使用CMU的sphinx4进行转录并最终强制对齐,即将音频与其转录本对齐. 我发现了一个名为AutoCap的项目基本上是我想要开发的.所以,我安装了它,但它没有用.我试过调整它,但我获得的是不正确的时间戳.…
语音识别 – 有没有人知道在SAPI中以编程方式创建和/或选择语音配置文件的方法?
我需要为用户提供一种简单的方法,无需进入控制面板,即可选择语音配置文件. 我发现: Acoustic training using SAPI 5.3 Speech API 但没有例子,信息不完整. 我真的可以用一个例子,…
twilio – 通过Twillio录制的电话进行实时语音识别
我目前正在使用Twilio拨打电话,我想添加语音识别元素,这样如果用户说出特定的短语,我的后端就可以采取特定的行动.如果你熟悉Twilio,类似于Gather动词.它需要是实时的,因为如果存在识别问题,将提示用户澄清. …