BZOJ 2434 浅谈Trie树构建Fail树DFS离线线段树查询

《BZOJ 2434 浅谈Trie树构建Fail树DFS离线线段树查询》
(此图乃呕心沥血之作)
世界真的很大
这道题从开始做算起已经过了3天了,一直没有什么比较集中的时间来调
实在是没想到今天这么快就调出来了
所以说这道题代码感觉很长却并不是很难调
由于我不会树状数组,就只能用线段树来代替了233
但代码好像实在是长了点。。。

看题先:

description:

 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有28个按键,分别印有26个小写英文字母和'B''P'两个字母。

经阿狸研究发现,这个打字机是这样工作的:

l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。

l 按一下印有'B'的按键,打字机凹槽中最后一个字母会消失。

l 按一下印有'P'的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。

例如,阿狸输入aPaPBbP,纸上被打印的字符如下:

a

aa

ab

我们把纸上打印出来的字符串从1开始顺序编号,一直到n。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数(x,y)(其中1≤x,y≤n),打字机会显示第x个打印的字符串在第y个打印的字符串中出现了多少次。

阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?

input:

输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。

第二行包含一个整数m,表示询问个数。

接下来m行描述所有由小键盘输入的询问。其中第i行包含两个整数x, y,表示第i个询问为(x, y)。

output:

 输出m行,其中第i行包含一个整数,表示第i个询问的答案。

这道题分为两个部分,首先是由给出的字符串得出所有的字符串,然后读入n组询问,得出所有询问的答案

对于第一个部分,我们会发现其实非常的简单,直接暴力按照题目所给出要求去模拟,很容易得出所有的字符串

考虑到,理论上来讲,所有字符串的总长应该是n^2的,数据范围决定了不可能把所有的字符串完全保存下来,而考虑我们在查询的时候不可能不知道查询的字符串是什么吧?而这么大的数据量,应该能想到trie树,而重新去看一下题面,这不正好是建trie树的过程吗

那么此时第一步就处理好了,现在考虑处理第二部分
一个字符串在另一个字符串出现了几次,一般想来就是KMP,但这个不用说肯定是不能接受的
忽然想到trie树是字符串的前缀树
那么考虑一个串作为子串在另一个串里面出现过,一定是作为一个前缀的一个后缀出现的。
考虑trie树上在构建AC自动机时的fail指针,指的就是这个字符串的最长后缀,那么对于y串的每一个前缀,只要其的后缀有x串,等价于从某个前缀开始跳fail指针能够跳到x串,就说明x串在y串里面出现了一次,而且由于末端点不同,就绝对不会相同

这就是fail树的基本原理

考虑在trie树上,每个点的fail指针向这个店连边,由于每个点只有一个fail,所以最后构造出来的一定是一种树形结构,叫fail树
而对于一个点,其在fail树上的子树里的所有点,必然是在trie树上跳fail最后能跳到这个点在trie树上的对应点的
而如果一个点在trie树里通过跳fail能跳到另一个点那里,等价于另一个点在trie树上对应的字符串是这个点的对应的字符串的后缀
而在fail树上,一个点的子树里全部都是能够跳fail跳到这个点的点,等价于这个点是其子树里面所有点的后缀。

考虑求解x这个字符串在y里面出现了多少次,就是说x是y的多少个前缀的后缀,就是求x在trie树里面的子树里面有多少是y的前缀。

现在考虑怎么快速的得到x的子树里面有多少个y的前缀
那么我们就想到,把y的所有前缀在fail树里面打上标记,然后统计x的子树里面有多少个标记
这一点我们可以用线段树来做到

但是我们每一次查询如果都取把所有y的前缀都打上标记,这显然是不得行的。尽管查询的时候很优,但是修改的时候时间成本耗费太大,这是由于在fail树上y的所有前缀并不是连续的,所以只能一个一个的改
但是前缀在fail树上却是连续的
那我们考虑把询问离线掉,按照一开始建fail树的步骤取遍历一遍trie树,每到一个点,就把这个点在fail树上的对应位置+1,离开时就-1,这样在查询一个点的时候,他的所有前缀都+1的了
这样的话就直接可以查询x个字符串的对应点的子树里面有多少个为1的点了。
由于fail树是一颗树,而树的一个点的一个子树里面的点的dfs序一定是连在一起的,所以子树查询可以用线段树来做到

完整代码:

#include<stdio.h>
#include<cstring>
#include<algorithm>
#include<string.h>
using namespace std; 
struct node
{
    node *fail,*fa;
    node *nxt[26];
    int cnt,mrk,book;
}*state[200010],pool[200010],*tail=pool,*root;

struct edge
{
    int v,last;
}ed[200010];

struct Node
{
    int sum;
    Node *ls,*rs;
    void update()
    {
        sum=ls->sum+rs->sum;
    }
}ppool[200010],*ttail=ppool,*rot;

struct question
{
    int x,y,ans,id;
}q[200010];

char ss[100010];
int len,n,num=0,idx=0,tot=0,head[200010],in[200010],out[200010],rev[100010],inc=0;

void add(int u,int v)
{
    num++;
    ed[num].v=v;
    ed[num].last=head[u];
    head[u]=num;
}

bool cmp1(const question &a,const question &b)
{
    return a.y<b.y;
}

bool cmp2(const question &a,const question &b)
{
    return a.id<b.id;
}
node* newnode()
{
    node *nd=++tail;
    nd->fail=nd->fa=0;
    nd->mrk=nd->book=-1;
    memset(nd->nxt,0,sizeof(nd->nxt));
    nd->cnt=0;
    return nd;
}

void ACbuild()
{
    root=newnode();
    root->fa=root;
    node *p=root;
    root->mrk=tot;
    len=strlen(ss);
    for(int i=0;i<len;i++)
    {
        if(ss[i]=='P')
        {
            p->cnt++;
            p->book=++inc;
            rev[p->book]=p->mrk;
        }   
        else if(ss[i]=='B')
            p=p->fa;
        else
        {
            int k=ss[i]-'a';
            if(!p->nxt[k])
            {
                p->nxt[k]=newnode();
                p->nxt[k]->fa=p;
                p->nxt[k]->mrk=++tot;
            }
            p=p->nxt[k];
        }
    }
}

void build()
{
    int h=0,t=0;
    state[t]=root;
    root->fail=0;
    while(h<=t)
    {
        node* tmp=state[h++];
        node* p=0;
        for(int i=0;i<26;i++)
        if(tmp->nxt[i])
        {
            if(tmp==root) 
                tmp->nxt[i]->fail=root;
            else
            {
                p=tmp->fail;
                while(p)
                {
                    if(p->nxt[i])
                    {
                        tmp->nxt[i]->fail=p->nxt[i];
                        break ;
                    }
                    p=p->fail;
                }
                if(!p) 
                    tmp->nxt[i]->fail=root;
            }
            add(tmp->nxt[i]->fail->mrk,tmp->nxt[i]->mrk);
            state[++t]=tmp->nxt[i];
        }
    }
}

Node* build(int lf,int rg)
{
    Node *nd=++ttail;
    if(lf==rg)
    {
        nd->sum=0;
        nd->ls=nd->rs=0;
        return nd;
    }
    int mid=(lf+rg)>>1;
    nd->ls=build(lf,mid);
    nd->rs=build(mid+1,rg);
    nd->update();
    return nd;
}

void dfs(int u)
{
    in[u]=++idx;
    for(int i=head[u];i;i=ed[i].last)
    {
        int v=ed[i].v;
        dfs(v);
    }
    out[u]=idx;
}

void modify(Node *nd,int lf,int rg,int pos,int delta)
{
    if(lf==rg)
    {
        nd->sum+=delta;
        return ;
    }
    int mid=(lf+rg)>>1;
    if(pos<=mid) modify(nd->ls,lf,mid,pos,delta);
    else modify(nd->rs,mid+1,rg,pos,delta);
    nd->update();
}

int query(Node *nd,int lf,int rg,int L,int R)
{
    if(L<=lf && rg<=R)
        return nd->sum;
    int mid=(lf+rg)>>1,rt=0;
    nd->update();
    if(L<=mid) rt+=query(nd->ls,lf,mid,L,R);
    if(R>mid) rt+=query(nd->rs,mid+1,rg,L,R);
    nd->update();
    return rt;
}

void solve()
{
    node *p=root;
    int now=1;
    for(int i=0;i<len;i++)
    {
        int k=ss[i]-'a';
        if(ss[i]=='P' && p->cnt)
        {
            while(q[now].y==p->book && now<=n)
                q[now].ans=query(rot,1,idx,in[rev[q[now].x]],out[rev[q[now].x]]),now++;
            if(now>n) return ;
        }
        else if(ss[i]=='B') 
            modify(rot,1,idx,in[p->mrk],-1),p=p->fa;
        else
            p=p->nxt[k],modify(rot,1,idx,in[p->mrk],1);
    }
}

int main()
{
    scanf("%s",ss);
    ACbuild();
    build();
    dfs(root->mrk);
    scanf("%d",&n);
    for(int i=1;i<=n;i++)
        scanf("%d%d",&q[i].x,&q[i].y),q[i].id=i;
    sort(q+1,q+n+1,cmp1);
    rot=build(1,idx);
    solve();
    sort(q+1,q+n+1,cmp2);
    for(int i=1;i<=n;i++)
        printf("%d\n",q[i].ans);
    return 0;
}
/*
EL PSY CONGROO
*/

嗯,就是这样

    原文作者:Trie树
    原文地址: https://blog.csdn.net/berrykanry/article/details/78017525
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞