ACM #1014 : Trie树

#1014 : Trie树

时间限制:10000ms
单点时限:1000ms
内存限制:256MB

描述

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?

身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?

小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了…

小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一:Trie树的建立

“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。

“唔…一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

提示二:如何使用Trie树

提示三:在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

输入

输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

在20%的数据中n, m<=10,词典的字母表大小<=2.

在60%的数据中n, m<=1000,词典的字母表大小<=5.

在100%的数据中n, m<=100000,词典的字母表大小<=26.

输出

对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

分析:

Trie树是一棵字典树,根节点不存储字母,其余所有节点存储一个字母,所以它最多是一棵26叉树;从根节点到某个节点的一次遍历就是一个单词,这样的数据结构很适合用来字符串查找或者前缀匹配。

 因为之前看《算法导论》红黑树那部分的时候有这样一章第14章:数据结构的扩张,其中讲到一种顺序统计树的数据结构,该结构就是一棵红黑树,只是在每个节点中额外增加了一个size属性来记录以该节点为根节点的树子树的节点个数。利用这种数据结构可以在O(lgn)时间复杂度内找到第i小的关键字,真是太伟大了。

  所以借着这一章的思路,我很快有了本题的解题思路。给Trie树的每个节点增加一个size属性,用来表示所有以从根节点到该节点构成的字符串为前缀的单词的个数。

于是就建立Trie树:

typedef struct TrieNode
{
	int size; //以该节点为根节点子树的数量(以到该节点构成的字符串的为前缀的的单词的个数)
	struct TrieNode *next[MAX]; //子树分支
}Trie, *Tree;


接着是将单词插入到树中,最后才是查找。

完整代码为:

#include <stdio.h>
#include <iostream>
#include <cstdlib>
#include <string>
using namespace std;

#define MAX 26

typedef struct TrieNode
{
	int size; //以该节点为根节点子树的数量(以到该节点构成的字符串的为前缀的的单词的个数)
	struct TrieNode *next[MAX]; //子树分支
}Trie, *Tree;

//初始化字典树节点
void initTree(Tree *t)
{
	*t = new Trie;
	(*t)->size = 0;
	for (int i = 0; i < MAX; i++)
	{
		(*t)->next[i] = NULL;
	}
}

//将字符串str插入树中
void insertNode(Tree root, const string str)
{
	int str_size = str.size();
	Tree p = root;
	for (int i = 0; i < str_size; i++)
	{
		if ((p->next[str[i] - 'a']) == NULL)
		{
			Tree temp = NULL;
			initTree(&temp);
			temp -> size++;
			p -> next[str[i]-'a'] = temp;
			p = p -> next[str[i] - 'a'];
		} else {
			p = p->next[str[i]-'a'];
			p -> size++;
		}
	}
}

//查找以s为前缀的单词个数
int search(Tree root, const string str)
{
	int str_size = str.size();
	Tree p = root;
	int i = 0, sum = 0;
	for (i = 0; i < str_size; i++)
	{
		if (p->next[str[i] - 'a'] != NULL)
		{
			p = p->next[str[i]- 'a'];
		}
		else
		{
			break;
		}
	}

	if (i == str_size)
	{
		sum = p->size;
		return sum;
	}
	else 
		return 0;

}

int main()
{
	int n; //表示词典的大小
	cin >> n;
	string str;
	Tree root = NULL;
	initTree(&root);

	while(n--)
	{
		cin >> str;
		insertNode(root, str);
	}

	int m; //表示询问的字符串个数
	cin >> m;

	while(m--)
	{
		cin >> str;
		int sum = search(root, str);
		cout << sum << endl;
	}

	return 0;
}

    原文作者:Trie树
    原文地址: https://blog.csdn.net/lsh199196/article/details/43410105
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞