背景如下: 1.Char1是一个由各种字母组成的字符串 2.Char2是另外一个相对较短的字符串 问题: 什么方法能最快的查出是否所有小字符串里的字母在大字符串里都有?
例如: Char1:ASQWERTYZXCVBPLK Char2:AKSECTYP
方法1:对于这种操作一种幼稚的做法是轮询第二个字符串里的每个字母,看它是否同在第一个字符串里。从算法上来讲,这需要O(n*m)次操作,其中n是Char1的长度,m是Char2的长度。就拿上面的例子来说,最坏的情况下将会有 16 * 8 = 128 次操作。
方法2:一个稍微好一点的方案是先对这两个字符串的字母进行排序,然后再同时对两个字符串依次轮询。两个字符串的排序需要 (m log m)+(n log n)次操作,之后的线性扫描需要(m + n)次操作。同样拿上面的字符串做例子,将会需要 16 * 4 + 8 * 3 = 88 加上对两个字符串线性扫描的16 + 8 = 24 的操作。
方法3:一个更好的方法就是,对第一个字符串进行轮询,把其中的每个字母都放入一个Hashtable里(成本是O(n) 即16次操作)。然后轮询第二个字符串,在Hashtable里查询每个字母,看能否找到。如果找不到,说明没有匹配成功。这将消耗掉8次操作。也就是说,这种方法需要 16 + 8 = 24 次操作。
看到这里,很多人可能已经觉得方法3是最优解了,是吗?然后我们再来瞧下另外一种方法:
假设我们有一个一定个数的字母组成的字符串,给每个字母分配一个素数,从2开始,往后类推,这样A将会是2,B将会是3,C将会是5,等等。现在遍历第一个字符串,把每个字母代表的素数相乘。你最终会得到一个很大的整数。然后,轮询第二个字符串,用每个字母除它。如果除的结果有余数,这说明有不匹配的字母。如果整个过程中没有余数,它就是第一个字符串的子集。