hihoCoder 1014 Trie树(字典树入门)

题目链接:http://hihocoder.com/problemset/problem/1014(此题附入门讲解)

题面:

#1014 : Trie树

时间限制:
10000ms 单点时限:
1000ms 内存限制:
256MB

描述

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?

身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?

小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了…

小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一:Trie树的建立

“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。

“唔…一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

提示二:如何使用Trie树

提示三:在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

输入

输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

在20%的数据中n, m<=10,词典的字母表大小<=2.

在60%的数据中n, m<=1000,词典的字母表大小<=5.

在100%的数据中n, m<=100000,词典的字母表大小<=26.

本题按通过的数据量排名哦~

输出

对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

样例输入

5
babaab
babbbaaaa
abba
aaaaabaa
babaababb
5
babb
baabaaa
bab
bb
bbabbaab

样例输出

1
0
3
0
0

题目大意:

    题目意思很简单,就是求在给定的字符串中,以每次询问的字符串为前缀的字符串数量。

解题:

    因为多校有一道字典树,所以就先练习了这道入门的字典树。

    之前也看过hiho的这道题,感觉大概懂了,也没敲,发现用过了和只是理解概念还是相距甚远啊。

     这道题我是参照白书代码实现的,白书上的代码如下:

struct Trie
{
	int ch[maxnode][sigma_size];
	int val[maxnode],sz;
	Trie()
	{
		sz=1;
		memset(ch[0],0,sizeof(ch[0]));
	}
	void insert(char *s,int v)
	{
		int u=0,len=strlen(s);
		for(int i=0;i<len;i++)
		{
			int c=(s[i]-'a');
			if(!ch[u][c])
			{
				memset(ch[sz],0,sizeof(ch[sz]));
				val[sz]=0;
				ch[u][c]=sz++;
			}
			u=ch[u][c];
		}
		val[u]=v;
	}
	//query函数需根据具体需求编写,大致与insert函数相同
};

     这道题与一般题目稍有不同,一般题目都是将尾节点设置为一个非0值,表示结尾,此题是求前缀,故每经过一个节点,该节点对应计数值加一,询问的时候,只要移动到前缀的最后一个位置,返回该位置的数量即可。

代码:

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
struct Trie
{
	//ch数组存储每个节点的26个字母分别对应节点编号,没有为0,根节点为0
	//(加大写52,加数字62,空间消耗大)
	int ch[1000005][26];
	//val数组一般用来存储权值,视题目灵活运用,sz是当前节点数量
	int val[1000005],sz;
	//初始化
	void init()
	{
		sz=1;
		memset(ch[0],0,sizeof(ch[0]));
	}
	//插入一条单词
	void insert(char *s)
	{
		//u是节点编号,并不是层数
		int u=0,len=strlen(s);
		for(int i=0;i<len;i++)
		{
			//取下标
			int c=(s[i]-'a');
			//如果该节点不存在,创建该节点
			if(!ch[u][c])
			{
				//真的是相当的省
				memset(ch[sz],0,sizeof(ch[sz]));
				//因为刚创建所以为1
				val[sz]=1;
				//给该节点分配编号
				ch[u][c]=sz++;
				//下移
				u=ch[u][c];
			}
			//已经存在了
			else
			{
			  //下移,并计数值加一
			  u=ch[u][c];
		      val[u]++;
			}
		}
	}
	//查询前缀
	int query(char *s)
	{
		int len=strlen(s),u=0,c;
		//不断下移,直至移到给定的前缀的最后一个单词
		for(int i=0;i<len;i++)
		{
		   c=s[i]-'a';
		   if(ch[u][c])
           u=ch[u][c];
		   //匹配不上,直接返回0
		   else return 0;
		}
		return val[u];
	}
};
Trie T;
int main()
{
    int n,m;
	char ss[12];
	//读入
	while(~scanf("%d",&n))
	{
		//初始化
		T.init();
        for(int i=0;i<n;i++)
		{
			getchar();
			scanf("%s",ss);
			//插入
			T.insert(ss);
		}
		scanf("%d",&m);
		for(int i=0;i<m;i++)
		{
			getchar();
			scanf("%s",ss);
			//查询
			printf("%d\n",T.query(ss));
		}
	}
	return 0;
}
    原文作者:Trie树
    原文地址: https://blog.csdn.net/david_jett/article/details/47679859
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞