Trie树的建立—查找字典中以特定字符串开头的单词数量(java实现)

Trie树的定义

在计算机科学中,trie,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值。

Trie这个术语来自于retrieval。根据词源学,trie的发明者Edward Fredkin把它读作/ˈtriː/ “tree”。但是,其他作者把它读作/ˈtraɪ/ “try”。

《Trie树的建立—查找字典中以特定字符串开头的单词数量(java实现)》

i)根节点不包含字符,除根节点外的每一个子节点都包含一个字符。
ii)从根节点到某一个节点,路径上经过的字符连接起来,为该节点对应的字符串。
iii)每个节点的所有子节点包含的字符互不相同。

优缺点

优点:插入和查询的效率很高,都为O(m),其中 m 是待插入/查询的字符串的长度。
缺点:空间复杂度高。

应用举例

词频统计:
输入
输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成。
输出
对于每一个询问,输出一个整数Ans,表示词典中以给出的字符串为前缀的单词的个数。

public class p1014 {

  public static void main(String args[]){
    Scanner sc = new Scanner(System.in);
    int m = Integer.parseInt(sc.nextLine());
    List<String> question = new ArrayList<String>();
    for(int i=0;i < m;i++){
      question.add(sc.nextLine());
    }
    int n = Integer.parseInt(sc.nextLine());
    List<String> answer = new ArrayList<String>();
    for(int j = 0; j < n; j++){
      answer.add(sc.nextLine());
    }

    List<Integer> res = new ArrayList<Integer>();
    TrieTree tree = new TrieTree();

    for(int j=0;j<question.size();j++){
      tree.insert(question.get(j));
    }

    for(int i=0;i<answer.size();i++){
      String ans = answer.get(i);
      int r = tree.findStartWith(ans);
      res.add(r);
    }
    for(int i=0;i<res.size();i++){
      System.out.println(res.get(i));
    }
  }
}

class TrieTree{
  private class TrieNode{
    TrieNode[] children = new TrieNode[26];
    boolean isLeaf;
    char val;
    int prefixNum;
    public TrieNode(char val){
      this.val = val;
      this.isLeaf = false;
      this.prefixNum = 0;
    }
  }

  TrieNode root;
  public TrieTree(){
    root = new TrieNode(' ');
  }

  public void insert(String word){
    TrieNode cur = root;
    char[] data = word.toLowerCase().toCharArray();
    for(int i=0;i<data.length;i++){
      int index = data[i] - 'a';
      if(cur.children[index]==null){
        cur.children[index] = new TrieNode(data[i]);
      }
      cur = cur.children[index];
      cur.prefixNum++;
    }
    cur.isLeaf = true;
  }

  public int findStartWith(String s){
    TrieNode cur = root;
    char[] data = s.toLowerCase().toCharArray();
    for(int i = 0;i<data.length;i++){
      int index = data[i] - 'a';
      if(cur.children[index]==null){
        return 0;
      }
      cur = cur.children[index];
    }
    return cur.prefixNum;
  }

}
    原文作者:Trie树
    原文地址: https://blog.csdn.net/springlustre/article/details/71156075
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞