Trie树的常见应用大总结（面试+附代码实现）

2019年3月16日 329次阅读来源: Trie树

（一）Trie的简介

Trie树，又称字典树，单词查找树或者前缀树，是一种用于快速检索的多叉树结构，如英文字母的字典树是一个26叉树，数字的字典树是一个10叉树。他的核心思想是空间换时间，空间消耗大但是插入和查询有着很优秀的时间复杂度。

（二）Trie的定义

Trie树的键不是直接保存在节点中，而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀（prefix）,从根节点到当前结点的路径上的所有字母组成当前位置的字符串，结点可以保存当前字符串、出现次数、指针数组(指向子树)以及是否是结尾标志等等。

[cpp]
view plain
copy

typedef struct Trie_Node
{
char count[15]; //单词前缀出现的次数
struct Trie_Node* next[MAXN]; //指向各个子树的指针
bool exist; //标记结点处是否构成单词
}Trie;

Trie树可以利用字符串的公共前缀来节约存储空间，如下图所示：

《Trie树的常见应用大总结（面试+附代码实现）》

它有3个基本性质：
(1) 根节点不包含字符，除根节点外每一个节点都只包含一个字符。
(2) 从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
(3) 每个节点的所有子节点包含的字符都不相同。
（三）Trie树的基本操作
（1）插入操作
按下标索引逐个插入字母，若当前字母存在则继续下一个，否则new出当前字母的结点，所以插入的时间复杂度只和字符串的长度n有关，为O(n)。

[cpp]
view plain
copy

void Insert(Trie *root, char* s,char *add)
{
Trie *p=root;
while(*s!=‘\0’)
{
if(p->next[*s-‘a’]==NULL)
{
p->next[*s-‘a’]=createNode();
}
p=p->next[*s-‘a’];
// p->count=add;
++s;
}
p->exist=true;
strcpy(p->count,add);
}

（2）查询操作

和插入操作相仿，若查询途中某一个结点并不存在，则直接就return返回。否则继续下去，当字符串结束时，trie树上也有结束标志，那么证明此字符串存在，return true；

[cpp]
view plain
copy

int Search(Trie* root,const char* s)
{
Trie *p=root;
while(*s!=‘\0’)
{
p=p->next[*s-‘a’];
if(p==NULL)
return 0;
++s;
}
return p->count;
}

（3）删除操作

一般来说，对Trie单个结点的删除操作不常见，所以我在这里也只提供递归删除整个树的操作

[cpp]
view plain
copy

void del(Trie *root)
{
for(int i=0;i<MAXN;i++)
{
if(root->next[i]!=NULL)
{
del(root->next[i]);
}
}
// free(root);
delete root;
}

（4）遍历操作

如果我们想要将trie中的字符串排序输出，直接先序遍历即可。

[cpp]
view plain
copy

void Print(Trie *root)
{
Trie *p=root;
if(p->exist)
cout<<p->name<<“: “<<p->count<<endl;
for(int i=0;i<26;i++)
{
if(p->next[i]!=NULL){
Print(p->next[i]);
}
}
}

（四）Trie树的具体应用

（1）统计前缀出现的次数

这是Trie最基本的应用，每个结点的字母使用count记录出现的次数即可。

这里提供一道题目，hdu 1251供大家练习。

[cpp]
view plain
copy

（2）翻译（密码，明文）

给定一组字符串s，k我们输入k则需要翻译成s，也就是说两者是映射关系。接下来我们给出一段话，让你翻译出正常的文章。用map固然简便，但是Trie的效率更加高。只需要在k的结尾结点出记录下s即可。

这里也提供一道题目，hdu 1075。(被注释的是我原来的程序，wa了，有大神看出来麻烦告诉我一下，谢谢)。

[cpp]
view plain
copy

（3）实现搜索引擎的热门搜索排名

我的初步想法是和(1)类似，对（1）中的trie进行先序遍历，将字符串和出现次数存进一个结构体，最后对这个数组进行快速排序，时间复杂度为O(nlogn),看网上说可以利用分治+trie

+最小堆，我还没有仔细搞清楚，以后研究完在添加。

（4）输入自动补全

其实原理都差不多，把字符串结尾处的结点当作root，进行先序遍历，即可得出所有以输入的字符串为前缀的答案。

[cpp]
view plain
copy

原文地址： http://blog.csdn.net/nk_test/article/details/47836119

    原文作者：Trie树
    原文地址: https://blog.csdn.net/omnispace/article/details/50837679
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。