Substring with Concatenation of All Words
You are given a string, s, and a list of words, words, that are all of the same length. Find all starting indices of substring(s) in s that is a concatenation of each word in words exactly once and without any intervening characters.
For example, given: s:
"barfoothefoobarman"
words:["foo", "bar"]
You should return the indices:
[0,9]
.(order does not matter).
哈希表计数法
复杂度
时间 O(NK) 空间 O(M)
思路
由于数组中所有单词的长度都是一样的,我们可以像Longest Substring with At Most Two Distinct Characters中一样,把每个词当作一个字母来看待,但是要遍历K次,K是单词的长度,因为我们要分别统计从下标0开头,从下标1开头。。。直到下标K-1开头的字符串。举例来说foobarfoo
,给定数组是[foo, bar]
,那我们要对foo|bar|foo
搜索一次,对oob|arf|oo
搜索一次,对oba|rfo|o
搜索一次,我们不用再对bar|foo
搜索,因为其已经包含在第一种里面了。每次搜索中,我们通过哈希表维护一个窗口,比如foo|bar|foo
中,我们先拿出foo
。如果foo
都不在数组中,那说明根本不能拼进去,则哈希表全部清零,从下一个词开始重新匹配。但是foo
是在数组中的,所以给当前搜索的哈希表计数器加上1,如果发现当前搜索中foo
出现的次数已经比给定数组中foo
出现的次数多了,我们就要把上一次出现foo
之前的所有词都从窗口中去掉,如果没有更多,则看下一个词bar
,不过在这之前,我们还要看看窗口中有多少个词了,如果词的个数等于数组中词的个数,说明我们找到了一个结果。
注意
先判断输入是否为空,为空直接返回空结果
代码
public class Solution {
public List<Integer> findSubstring(String s, String[] words) {
List<Integer> res = new LinkedList<Integer>();
if(words == null || words.length == 0 || s == null || s.equals("")) return res;
HashMap<String, Integer> freq = new HashMap<String, Integer>();
// 统计数组中每个词出现的次数,放入哈希表中待用
for(String word : words){
freq.put(word, freq.containsKey(word) ? freq.get(word) + 1 : 1);
}
// 得到每个词的长度
int len = words[0].length();
// 错开位来统计
for(int i = 0; i < len; i++){
// 建一个新的哈希表,记录本轮搜索中窗口内单词出现次数
HashMap<String, Integer> currFreq = new HashMap<String, Integer>();
// start是窗口的开始,count表明窗口内有多少词
int start = i, count = 0;
for(int j = i; j <= s.length() - len; j += len){
String sub = s.substring(j, j + len);
// 看下一个词是否是给定数组中的
if(freq.containsKey(sub)){
// 窗口中单词出现次数加1
currFreq.put(sub, currFreq.containsKey(sub) ? currFreq.get(sub) + 1 : 1);
count++;
// 如果该单词出现次数已经超过给定数组中的次数了,说明多来了一个该单词,所以要把窗口中该单词上次出现的位置及之前所有单词给去掉
while(currFreq.get(sub) > freq.get(sub)){
String leftMost = s.substring(start, start + len);
currFreq.put(leftMost, currFreq.get(leftMost) - 1);
start = start + len;
count--;
}
// 如果窗口内单词数和总单词数一样,则找到结果
if(count == words.length){
String leftMost = s.substring(start, start + len);
currFreq.put(leftMost, currFreq.get(leftMost) - 1);
res.add(start);
start = start + len;
count--;
}
// 如果截出来的单词都不在数组中,前功尽弃,重新开始
} else {
currFreq.clear();
start = j + len;
count = 0;
}
}
}
return res;
}
}