要对文本文件的进行比较的时候,可以考虑使用google-diff-match-patch算法,它可以对文本文件进行比较、匹配和生成补丁的操作。
他的官网是:http://code.google.com/p/google-diff-match-patch/
CSDN下载:http://download.csdn.net/detail/modern1314/5323399
使用google diff的话,这个差异就是从左边的字符串变成右边的字符串所需要的最少的步骤,每个步骤只能做“保持不变”、“插入”或者“删除”操作。
这里举个简单的例子:
我们把一个字符串文本Text 和基本字符串对比生成补丁后,然后拿着补丁和基本字符串恢复 字符串Text。
public void testDiff(){
String commonStr = "I am jack";
String text1 ="I am a coder";
LinkedList<Diff> diffs = dmp.diff_main(commonStr, text1);
for(Diff diff : diffs){
System.out.println(diff.toString());
}
LinkedList<Patch> patches = dmp.patch_make(diffs);
String patchesStr = dmp.patch_toText(patches);
patches = (LinkedList<Patch>)dmp.patch_fromText(patchesStr);
Object[] results = dmp.patch_apply(patches, commonStr);
System.out.println("result = " + results[0]);
}
单测结果如下: