c# – 关于.NET中语音识别类的问题

2023年10月17日 220次阅读

是否可以使用.NET语音识别类构建应用程序并传入WAV文件以使其通过并创建它的文本表示.例如,这就是我想要做的：

我们办公室有一个QA部门,他们每天都要听几百个电话,这是不可能的,没有足够的人听一切跟上.我想要做的是将音频文件上传到我们的服务器,并让服务器解析它并创建它的记录.如果它不完美无关紧要,但只是一个基础,比通过听2小时录音更容易浏览几十行文本.

根据保存的记录,我可以在数据库中实现全文搜索,如果有人说的是虚假陈述,也可以对成绩单进行检查.

那么,是否可以使用.NET语音识别类创建一个应用程序,只需将WAV文件传递给它,它就会吐出粗略的文字记录？

在思考这个想法时,我简单地在语音课上挖了MSDN,所以如果可以的话,我没有那么多的知识.

如果可能的话,我会很感激C#中的任何例子.主题1055347类似于我所拥有的问题,并提供了链接,其中最具体的是C语言.我不是C开发人员,我也没有去过学校进行编程,我只是自己通过C#,所以我想保留我所熟悉的语言.

提前致谢！

最佳答案这听起来像你有一个呼叫中心类型的应用程序.
Microsoft Speech Server具有针对电话优化的SR引擎(8000 Hz采样率),这将产生比桌面SR引擎更好的识别.然而,引擎并非真正设计用于转录(尽管它可以做到),并且在进一步处理之前肯定需要检查转录. Microsoft Exchange统一通信使用SR引擎生成语音邮件的脚本,虽然它总比没有好,但它通常会产生有趣的废话.