python – 字符识别的最佳算法

2019年7月20日 262次阅读

我正在尝试从视频中创建一个硬编码的字幕开膛手.

到目前为止,我已经做了一些预处理.

>获取字幕框架
>裁剪字幕行
>单独的字幕行
>单独的字符.

字符识别的主要部分仍未完成.我尝试使用tesseract,但准确率约为60％.此外,我尝试训练角色图像,然后比较它们.但是当我运行不同分辨率的视频时,它失败了.

以下是迄今为止的结果. (原始图像,阈值,文本增强,分隔字符)

我确实经历了K Means并使用Structural Similarity比较图像.但在我的情况下没有任何效果.如您所见,图像文字非常清晰.

编辑：

问题：我希望将准确度提高到95％或更高,因为所有视频中的文字相似,我能够获得如上所示的明文或字符.在我的案例中,哪种方法最好？

P.S：语言是克罗地亚语

最佳答案我建议两件事：

>使用图像清理进行更多操作
>获得更好的OCR. Tesseract是免费的,但不是最好的.如果您的预算允许,您可以查看一些纪念性的.例如：OCRSDK.com这个有一些免费识别,至少足以发挥,看看它是否适合你.

我在demo page尝试了你的最新照片(一次洗完后),它被认为几乎完全正确 – 见下文.比60％的错误要好得多.我相信通过更好的图像预处理,您可以进一步提高准确性.

免责声明：我为ABBYY工作.