java – 如何计算多列(colspan)HTML表的宽度?

我正在尝试在我编写的
Java程序中将HTML表解析为LaTeX代码(使用longtabu,因为它支持自定义列宽设置).我的代码运行得相当稳定,输出似乎还不错,直到现在.我必须支持表的colspan-feature(我现在正在跳过rowspan),这就是问题所在.导致问题的表看起来像这样:

<table>
<tr>
    <td width="385" colspan="3">
        Content
    </td>
    <td width="359" colspan="3">
        Content
    </td>
    <td width="151">
        Content
    </td>
</tr>
<tr>
    <td width="24">
        Content
    </td>
    <td width="361" colspan="2">
        Content
    </td>
    <td width="359" colspan="3">
        Content
    </td>
    <td width="151">
        Content
    </td>
</tr>
<tr>
    <td width="24">
        Content
    </td>
    <td width="276">
        Content
    </td>
    <td width="85">
        Content
    </td>
    <td width="198" colspan="2">
        Content
    </td>
    <td width="161">
        Content
    </td>
    <td width="151">
        Content
    </td>
</tr>

我发现问题在于,没有任何表行定义所有列宽.

在我的理解中,我需要一个线性方程组来解决单列宽度的计算……我是对的还是我错过了什么?

在Java中解决这种方程式系统的最佳方法是什么?

最佳答案 假设源表没有过度约束,欠约束,也没有不一致约束,我建议:

>定义一个事实表,列出确定后每列的已知宽度
>为每个colspan条目定义一个Constraint对象集合,指定起始列,列跨度和总宽度.
>传递整个表定义,收集事实和约束.
>然后对事实表进行传递,对于未定义的每个列,运行所有约束,并查看是否对定义了所有其他列的一组列存在约束.这样的约束将为当前考虑的列生成一个值.
>每次发现新列值时,都会从事实表的开头开始,扫描未知列,并为每次扫描再次设置整个约束.

这是一个n平方(或更差)算法,但只要表没有一万行或一列就应该没问题.如果表格被正确约束,您将到达定义所有列宽度的点.像这样的强力算法的优点是它相对容易调试并且应该是稳定的.

如果表格约束不足,则会到达您进行传递的点,并且仍有未计算的列宽.如果要处理此问题,则添加另一个传递,这次采用涉及未计算表列的任意约束,该列也必须包含一个或多个其他未计算的表列,并在所有未计算的列中均等地分配剩余空间.约束.由于这是一个任意约束,你可能会在不同的运行中获得不同的答案……但是表格受到限制……这有关系吗?

完成后,您将拥有一个包含所有列宽的完整事实表,然后您可以生成包含指定的所有表列的LaTeX代码.

点赞