近来准备在hihocoder上面多练习练习编程,一边写一边总结经验吧。以下是hihocoder上面的LV2题目,Trie树 主要考察的知识点是 Trie树的建立和使用。
下面先贴上原题:
时间限制:
10000ms 单点时限:
1000ms 内存限制:
256MB
描述
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。
这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?”
身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?”
小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”
小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了…
小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”
小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”
小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”
小Ho摇摇头表示自己不清楚。
“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。
“唔…一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。
“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”
“那么现在!赶紧去用代码实现吧!”小Hi如是说道
输入
输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。
在20%的数据中n, m<=10,词典的字母表大小<=2.
在60%的数据中n, m<=1000,词典的字母表大小<=5.
在100%的数据中n, m<=100000,词典的字母表大小<=26.
本题按通过的数据量排名哦~
输出
对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。
样例输入
5 babaab babbbaaaa abba aaaaabaa babaababb 5 babb baabaaa bab bb bbabbaab
样例输出
1 0 3 0 0
从题目分析,程序流程是:接收输入字典数据->生成字典树->输入查询参数->执行查询->输出数据。
解题的关键在于字典树的构建和查询。楼主构建字典树的想法主要是创建两个类,一个是字典树类一个是节点类。
字典树类中包含一个节点成员数据root以及两个成员函数用来添加数据和查询数据。
节点类中有成员子节点集合和节点数据值(这里是一个char) ,所以楼主使用vector来存放子节点,一个char来存放数据值。
类代码如下:
class Node
{
public:
Node();
~Node();
vector<Node*> Child;
char m_Value;
int m_iPass;
};
Node::Node()
{
m_iPass = 1;
m_Value = 0;
Child.clear();
}
Node::~Node()
{
}
class Trie
{
public:
Trie();
~Trie();
void addData(const string strData);
void findData(const string strData, int & iNum) const;
Node * root;
};
Trie::Trie()
{
root = new Node;
}
Trie::~Trie()
{
}
大家也许注意到,节点类成员数据中多了个m_iPass。这是由于开始楼主提交代码借故偶一直是输出错误,仔细分析发现对于两条数据,其中一条开头是另一条的子串的时候,无法使用vector的大小来区分,所以在每一个新数据添加进来时,使用m_iPass自增来记录下每一个节点被数据“通过”的次数,最后查询时也可以直接返回这个次数得到所求的字符串的出现频度。
添加数据和查询数据函数的实现:
void Trie::addData(const string strData)
{
const char * pData = strData.data();
int iLen = strData.length();
Node * pCurNode = root;
for (size_t i = 0; i < iLen; i++)
{
char chValue = *(pData + i);
if (pCurNode->Child.size() == 0 )
{
Node * pNode= new Node;
pCurNode->Child.push_back(pNode);
pNode->m_Value = chValue;
pCurNode = pNode;
}
else
{
Node * pNode = NULL;
bool bFind = false;
for (size_t j = 0; j < pCurNode->Child.size(); j++)
{
pNode = pCurNode->Child[j];
if (pNode!=NULL && pNode->m_Value == chValue)
{
pNode->m_iPass++;
pCurNode = pNode;
bFind = true;
break;
}
}
if (!bFind)
{
pNode = new Node;
pCurNode->Child.push_back(pNode);
pNode->m_Value = chValue;
pCurNode = pNode;
}
}
}
}
void Trie::findData(const string strData, int & iNum) const
{
const char * pData = strData.data();
int iLen = strData.length();
iNum = 0;
Node * pCurNode = root;
for (size_t i = 0; i < iLen; i++)
{
char chValue = *(pData + i);
Node * pNode = NULL;
bool bFind = false;
for (size_t j = 0; j < pCurNode->Child.size(); j++)
{
pNode = pCurNode->Child[j];
if (pNode->m_Value == chValue)
{
pCurNode = pNode;
bFind = true;
break;
}
}
if (!bFind)
{
return;
}
}
iNum = pCurNode->m_iPass;
}
楼主的思路是:添加一条数据,先得到它的长度,然后执行循环,一次拿出一个字符开始对比,如果这个字符能找到包含同样字符的节点,则将这个节点的m_iPass加一,然后对比下一个字符和该节点的子节点,如果找不到节点就在相应位置创建一个节点并放入父节点的子节点集合中。
对于 查找一条数据,先得到长度,然后循环,一次拿出一个字符和节点字符对比,如果在循环时有一个字符找不到匹配的节点,则返回0;如果循环结束时,每一个字符都找到了相应的节点,则返回最后一个节点的m_iPass的值。
最后就是把这一系列的值输出就行了。
int main()
{
Trie trieTree;
int iTotal, iNum;
cin >> iTotal;
for (int i = 0; i < iTotal; i++)
{
string strValue;
cin >> strValue;
trieTree.addData(strValue);
}
cin >> iNum;
int * iOut = new int[iNum];
for (int j = 0; j < iNum; j++)
{
int iFre;
string strSearch;
cin >> strSearch;
trieTree.findData(strSearch, iFre);
*(iOut + j) = iFre;
}
for (int i = 0; i < iNum; i++)
{
cout << *(iOut + i) << endl;
}
return 0;
}
最后附上提交结果图吧。