package structure;
import java.util.Arrays;
import java.util.HashMap;
import java.util.Map;
/**
*
* 最短摘要的生成: 给定一段产品的英文描述,包含M个英文字母,每个英文单词以空格分隔,无其他标点符号;再给定N个英文单词关键字,
* 请说明思路并编程实现方法String extractSummary(String description,String[] key words),
* 目标是找出此产品描述中包含N个关键字(每个关键词至少出现一次)的长度最短的子串,作为产品简介输出
* 思路:在w1,w2,q1,w3,w4,w5,q2,w6,w7,q1,w8,w9,w10 找出最包含关键字最短的信息,关键字为 q1,q2
* 方法1就是从目标中第一个开始查找,与关键字的第一个进行匹配,如果成功则两者都后移,否则将目标后移,如果全部匹配后给最短的那个比较,然后更新
*/
public class ShortestSummary {
String[] text; // = "hello world tst sepring sun flower hello";
String[] keywords;// = { "hello", "world" };
Map<String, Integer> map = new HashMap<String, Integer>();
int[] count;
public ShortestSummary(String[] text, String[] keywords) {
this.text = text;
this.keywords = keywords;
count = new int[keywords.length];
for (int i = 0, len = keywords.length; i < len; i++)
map.put(keywords[i], i);
}
/**
* 此方法是遍历 每个 text[]进行扫描,以每个为起点,直接包含所以的关键字为结点,进行所有的比较,取最小的
* 上面的方法进行多次无用的比较,如: text[] = {a a a b c d a} key {b d }
* 我们在第一次找的包含的为:(从第一个元素开始){a a a b c d }长度为 6
* 进行第二次查找包含为(从第二个元素开始){a a b c d } 长度为5
* 进行第三次查找(从第三个元素开始) {a b c d } 长度为4
* 进行第四次查找(从第四个元素开始){b c d } 长度为3
* 前三次查找的第几个字符都不在关键字之内,我们可以不对其进行查找
* 如果我们第一次找到了全部包含关键字的序列,如果 {a a a b c d},from 为第一个字符,to 为最后一个,from-to包含所有关键字,我们知道,如果 from 指向的不为关键字,
* 那么 [from+1 ,to] 一定比 [from,to] 要短,而且包含所有关键字,如果 from包含为关键字,[from+1,to] 则不包含所有的关键字,我们就向后移动to 的值,直接到找包含所有
* 那么再拿现在的 from,to 与最小的值比较,直接找到最小的那一个
*/
/*+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++分割线++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++=*/
public void execute() {
int start = 0, len = text.length, min = len;
for (int i = 0; i < len; i++) {
int t = exec(i, len - 1);
if (t > -1)
if (min > t) {
min = t;
start = i;
}
}
for (int i = start; i <= start + min; i++)
System.out.print(text[i] + " ");
}
private int exec(int from, int to) {
count = new int[keywords.length];
int start = from;
while (from <= to && !isAllgeted()) {
Integer i = map.get(text[from]);
if (i != null) {
count[i]++;
}
from++;
}
if (isAllgeted())
return from - start - 1;
return -1;
}
private boolean isAllgeted() {
for (int i = 0, len = count.length; i < len; i++)
if (count[i] == 0)
return false;
return true;
}
/*+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++分割线++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++=*/
// 第二种方法,相当于滑动窗口
void execute2(){
int start = 0,end=0,min = text.length,len = text.length,targetStart = 0,targetEnd = len;
while(true){
while(end<len && !isAllgeted()){
Integer t = map.get(text[end]);
if(t !=null)
count[t]++;
end++;
} // 包含所有,将小空间
while(isAllgeted() && start<=end){
if(end-start<min){
min = end-start;
targetStart = start;
targetEnd = end;
}
Integer t = map.get(text[start]);
if(t !=null)
count[t]--;
start ++ ;
}
if(end>=len)break;
}
for(int i=targetStart;i<targetEnd;i++)
System.out.print(text[i]+" ");
}
public static void main(String args[]) {
String[] text = "hello software hello test world spring sun flower hello".split(" ");
String[] keys = {"hello","world"};
ShortestSummary s = new ShortestSummary(text, keys);
s.execute2();
}
}
编程之美--最短摘要的生成
原文作者:BOY
原文地址: https://blog.csdn.net/jiang_bing/article/details/8114523
本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
原文地址: https://blog.csdn.net/jiang_bing/article/details/8114523
本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。