本地化 – gettext套件中的工具,用于模糊源匹配的模糊匹配？

2019年8月4日 254次阅读

有没有办法利用gettext套件中的工具来做一些像模糊匹配一个PO文件中的源字符串以找到几乎相同的字符串？这似乎是一个有用的质量检查,以改善来源.例：

#: my_file
msgid "Sorry, something went wrong"
msgstr ""

#: some_other_file
msgid "Sorry, something went wrong."
msgstr ""

#: yet_another_file
msgid "Sorry, something is wrong"
msgstr ""

这些字符串实际上是相同的,并且可能更改源代码以在每个实例中使用相同的消息.这将减少l10n工作并使UI更加连贯.在我看来,msgmerge中的模糊匹配算法应该已经非常适合识别这些实例.然而,我找不到一个明显的方法来做到这一点.

最佳答案没有人的监督,你不想做任何折叠.

大多数翻译工具都有这个功能,但是人类应该验证这种折叠.

由于上下文,您甚至无法为完全相同的字符串执行此操作.

为什么：

>按钮(“命令”)通常与标签和标题(“描述”)的翻译方式不同
示例：“打印”被翻译为法语为“Imprimer”(按钮)或“印象”(标题)
>性别,数量,案例,将改变翻译.
示例：将“新”按钮翻译成西班牙语可以为您提供“Nuovo”(男性,单数),“Nuevos”(男性,复数),“Nueva”(女性,单数)“Nuevas”(女性,复数)
>如果具有不同的含义,则可以对同一个词进行不同的翻译.
示例：如果扫描磁盘(用于病毒)或扫描一张纸,“扫描”将有不同的翻译.

所以,如果价格较低的翻译质量,你不想“神奇地合并字符串”以节省几美分.