HDU 3746 KMP的运用。【求字符串添加几个字符,可以成有循环节字符串】

比如

a,添加一个a变为aa,循环节为a

abcab添加一个c,变为[abc][abc]循环节为abc

abcxxxa 添加bcxxx变为abcxxxabcxxx,循环节为abcxxx

做法:

next数组的实际含义是, s[0] …..s[next[i] – 1] 的字符串,与s[i – next[i]]…s[i]这两段字符串是完全相同的。

《HDU 3746 KMP的运用。【求字符串添加几个字符,可以成有循环节字符串】》

显然,对于next[len],如果相同的两串字符串和上图一样是红色的部分,那么循环节一定是绿色的部分。

原因是,如果有更短的,无论如何,最后红色的部分一定有一部分是循环节的一部分。如果循环节更短的话,(右边的绿色向左边移动一些),那么右边红色部分作为一个循环的起点显然是不够的…… 所以这就是最小的循环节了。

《HDU 3746 KMP的运用。【求字符串添加几个字符,可以成有循环节字符串】》

如果利用next[i]得到的两个相同的区域,是上图蓝色的区域(有重叠部分),那么循环节一定是绿色的部分。

(我的图错啦!!绿色应该框左边的绿色,不是右边的!)

嗯,你想象绿色在左边……(因为我不想画图了)

首先简单说明为什么这样是对的。

《HDU 3746 KMP的运用。【求字符串添加几个字符,可以成有循环节字符串】》

左边两块绿色是完全相同的。(因为两个串的首部一定是相同的)

然后第二个绿色方框,不仅是第二个串的前缀,还是第一个串的一部分。把两个方框看为一个整体,视为第一个串的一部分的话。可以得到

《HDU 3746 KMP的运用。【求字符串添加几个字符,可以成有循环节字符串】》

三个绿色方框的字符都是相同的……

最终可以证明出,绿色方框是循环串的一部分。

但是为啥绿色就是最小的?

假设绿色方框变小一点点……变为下图红色的那样

《HDU 3746 KMP的运用。【求字符串添加几个字符,可以成有循环节字符串】》

至少说,我们不能保证这2个红色串是相同的……

【假设】两个红色部分是相同的,假设这是一个合法情况,那么会出现什么情况呢?

对,情况就是,蓝色部分一定是画错了…… 第二个蓝色部分的开始位置一定是图中2个红色方框结合的位置……

所以我们可以得到一个循环节长度的公式:

cir = len – next[len]   (公式由上2个图得到,化简后结果为这个。一个式子满足上述2个图的情况,所有下标为从0开始。 KMP程序采用前面我的程序模板)

特判1:整个串为 abcd的情况(没有重复部分)

特判2:整个串为a一个字母的情况(需要整体复制一份……)

然后这题就做完了。

/*
#include <bits/stdc++.h>
#include <ext/pb_ds/priority_queue.hpp>
#include <tr1/unordered_map>
#include <ctime>
using std::tr1::unordered_map;
*/

#include <iostream>
#include <cstring>
#include <queue>
#include <algorithm>
#include <cstdio>
#include <map>
using namespace std;

/*
using std::sort;
using std::bitset;
using std::max;
using std::cout;
using std::stack;
using std::cin;
using std::endl;
using std::swap;
using std::pair;
using std::vector;
using std::set;
using std::map;
using std::multiset;
using std::queue;
using std::greater;
using std::string;
using std::priority_queue;
using std::max_element;
using std::min_element;

using __gnu_pbds::pairing_heap_tag;
__gnu_pbds::priority_queue<int, greater<int>, pairing_heap_tag> heap;
#define Hash unordered_map
*/
#define pr(x) cout<<#x<<" = "<<x<<" "
#define prln(x)    cout<<#x<<" = "<<x<<endl

#define lson o*2, L, M
#define rson o*2+1, M + 1,R

#define MAXN 1000010


//pattern为模板串,从0下标,长度为len。 返回next数组
template<typename T>
void kmp_pre(T pattern[], int len, int next[])
{
	next[0] = next[1] = 0;
	for(int i = 1 ; i < len ; i++)
	{ 
		int j = next[i];
		while(j && pattern[i] != pattern[j])
			j = next[j];
		next[i+1] = pattern[i] == pattern[j] ? j+1 : 0;
	}
}

//text为匹配串,lenT为其长度。pattern为模板串,lenP为其长度,next为上面得到的next数组。
//返回一个vector,表示所有匹配成功的在text的下标(从0开始)
//还返回一个true/false表示是否有匹配成功的
template<typename T>
bool find(T text[], int lenT, T pattern[], int lenP, int next[], vector<int> &ret)//下标皆为从0开始
{  
	ret.clear();
	int j = 0; //初始化在模式串第一个位置
	for (int i = 0; i < lenT; ++ i)
	{
		while (j && pattern[j] != text[i])	j = next[j];
		if (pattern[j] == text[i]) j++;
		if (j == lenP)
		{
			ret.push_back(i-lenP+1);
		}
	}
	return ret.size();
}
vector<int>ans;
int nxt[1000010];
char pattern[1000010], text[1000010];

void doit()
{
	int lenP = strlen(pattern);
	int pos = nxt[lenP];
	int cir = lenP - pos;
	if (cir == lenP)	cout<< cir <<endl;
	else if (lenP % cir == 0)	cout << 0 << endl;
	else 
	{
		cout << cir - lenP % cir << endl;
	
	}
}

int main()
{
	int T;
	scanf("%d\n", &T);
	while (T--)
	{
		gets(pattern);
		//gets(text);
		int lenP = strlen(pattern);
		//int lenT = strlen(text);
		kmp_pre(pattern, lenP, nxt);
		//find(text, lenT, pattern, lenP, nxt, ans);
		doit();
	}
	return 0;
}

    原文作者:KMP算法
    原文地址: https://blog.csdn.net/baidu_23081367/article/details/52249527
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞