原生Java文档解析器和基于转换器库/ linux的文档转换器

我正在寻找一个可以执行以下操作的
Java库:

解析* .eml或* .msg格式的电子邮件,用于DOC,DOCX,JPEG,PNG,GIF,TXT,XLS,XLSX,PPT,PDF类型的附件,并将附件转换为TIFF格式.

它可以是开源的,也可以是商业图书馆.或者我正在寻找linux的命令行工具.我们已经尝试过开放式办公室,但是某些文档格式存在太多问题.

更新:

到目前为止我通过研究发现了什么:

对于解析电子邮件和提取附件,JavaMail(http://www.oracle.com/technetwork/java/javamail/index.html)是一个不错的选择.

对于转换文档,JodConverter(http://code.google.com/p/jodconverter/)是一个舒适的库.然而,它只是开放式办公室的包装器,所以如果开放式办公室存在问题(我确实经常遇到openoffice问题)转换文档,你也可以使用JodConcerter.

总而言之,我没有运气(到现在为止)找到在本机java中实现的任何文档转换库,它存在所有常见的文档格式,既不是开源的,也不是商业的.这似乎是一个真正的市场差距.

最佳答案
RainbowPDF可能适合:它是一个基于商业服务器的转换工具,带有Java API.

如果您有Windows服务器,请查看NEEVIA Document Converter Pro.它具有一些邮件功能.

Apace POI是一个读取Microsoft Office文档内容的界面.您必须自己编写图像生成和布局组件.但它仍然读取Outlook MSG格式.

点赞