我想知道是否有任何示例原子示例用于将音频从iPhone传输到服务器.我对电话或SIP风格的解决方案不感兴趣,只是一个简单的套接字流来发送音频片段,格式为.wav格式,正在录制.我对谷歌或其他明显的途径没有太多运气,尽管似乎有很多例子反过来这样做. 最佳答案 我无法弄清楚如何注册我最初发布的未注册帐户.
无论如何,我对目前的音频格式并不感兴趣,只是流媒体方面.我想拿麦克风输入,然后从iphone流到服务器.我目前不关心传输速率,因为最初只是从wifi连接测试,而不是3g设置.我无法缓存它的原因是因为我有兴趣为我的本科毕业论文尝试一些开源语音识别的东西.缓存然后发送录音是可能的,但是将语音数据传送到服务器需要相当长的时间.如果我可以在开始录制后立即开始发送数据,那么响应时间会大大提高,因为大部分数据在我放开录制按钮时已经到达服务器.此外,如果我可以从iphone获得此流媒体功能,那么在服务器端,我也可以在第一位音频通过后立即启动语音识别器.再次,这应该大大超出了从用户角度看交易的最终时间.
colin barrett提到了手机和电话网络,但这些对于asr来说实际上是一个非常不理想的解决方案,主要是因为它们没有提供从错误中恢复的好方法 – 在voip对话中这样做是一种可怕的体验.然而,iphone,特别是触摸屏提供了一种很好的方式,通过使用ime或nbest列表为其他识别候选人.
如果我能找出流式传输音频的基本架构,那么我就可以开始考虑进行flac编码或者降低所需的传输速率.甚至可能是特征提取,尽管这限制了后来使用录音重新训练系统的能力.