Uva1401 Remember the Word 字典树trie

题意翻译

Uva1401 Remember the Word (记单词) 翻译

题目描述

  • Neal 对有关组合的问题很感兴趣,现在他有一个关于单词的有趣问题要解决:

  • 他知道大佬Ray的记忆力像存储器一样好,这样的问题肯定难不倒他,于是Neal把问题给了蒟蒻Jiejie。Jiejie经常记不住数字,他就用火柴棒来帮助自己记忆。Jiejie最多只能用20071027根火柴棒(因为他只有那么多),所以Jiejie数出来的数量需要关于20071027取模

  • 问题如下: 一个长单词需要被分割成几个小单词(当然小单词都在字典当中)。比如有包含4个单词的字典:{a, b, cd, ab},则长单词abcd有两种分解方法: a+b+cd和ab+cd。

  • 现给定一个由s个不同单词组成的字典和一个长字符串,Jiejie需要把这个长字符串按字典分解成若干个单词,问有多少种分解方法

输入

  • 每个输入文件中有多组测试数据,对于每组测试数据:

  • 第一行是长单词,单词的长度不会超过300,000

  • 第二行是整数s,1≤s≤4000。

  • 接下来的s行,每行是字典中的一个单词,每个单词长度不超过100,所有单词字母都是小写的,且不会有相同单词

  • 每组测试数据间都会有一个空行

  • 你的程序必须处理到文件结束(即EOF)为止

输出

  • 对于每组测试数据,输出总数对20071027取模后的值,格式参考样例。

样例输入

abcd
4
a
b
cd
ab

样例输出

Case 1: 2

原题链接 pdf

感谢@dasxxx 提供的翻译

题目描述

PDF

输入输出格式

输入格式:

 

输出格式:

 

输入输出样例

暂无测试点

算法分析:

题意:

        给你一个由N个单词组成的词典和一个字符串S。问你S由N中的单词组成的方法有多少种?字典中的单词可以重复使用但是不可重叠。

比如,

abcd
4
a
b
cd
ab

答案:a+b+cd  ab+cd

参考:刘汝佳《算法入门经典》+博客:https://blog.csdn.net/u013480600/article/details/23111031

分析:

     首先,我们能想到递推法,       

      dp[i]表示S串的后缀[i,len-1]串有多少种构成方式,则dp[i]=sum(  d[i+len(x)]  ) 单词x是S[i…L]的前缀且仅当[i,i+len(x)-1]区间的字符正好是字典中的一个单词时

        如果枚举x,时间肯定超时。

        然后初值d[L]=1,其他所有d值初始为0,然后从L-1一直递推到0,最终结果就是d[0].

当我们递推d[i]的时候,我们先用串[i,L-1]去查询字典树,如果查询到了一个长5的单词,那说明d[i] += d[i+5],如果查询到另一个长8的单词,那说明d[i] +=d[i+8].

        另外要说明的是:字典树中的v值保存的是该节点单词的长度,如果该节点不是单词,那么v=0.

代码实现:

#include<cstdio>
#include<iostream>
#include<fstream>
#include<algorithm>
#include<functional>
#include<cstring>
#include<string>
#include<cstdlib>
#include<iomanip>
#include<numeric>
#include<cctype>
#include<cmath>
#include<ctime>
#include<queue>
#include<stack>
#include<list>
#include<set>
#include<map>
using namespace std;
#define N 300000+5
#define MAX 26

typedef long long ll;

const int MOD = 20071027;
const int maxnode=4000*100+100;//预计字典树最大节点数目
const int sigma_size=26;       //每个节点的最多儿子数
 
struct Trie
{
    int ch[maxnode][sigma_size];//ch[i][j]==k表示第i个节点的第j个儿子是节点k
    int val[maxnode];//val[i]==x表示第i个节点的权值为x
    int sz;//字典树一共有sz个节点,从0到sz-1标号
 
    //初始化
    void clear()
    {
        sz=1;
        memset(ch[0],0,sizeof(ch[0]));//ch值为0表示没有儿子
    }
 
    //在字典树中插入单词s,但是如果已经存在s单词会重复插入且覆盖权值
    //所以insert前需要判断一下是否已经存在s单词了
    void insert(string s)
    { 
		int u=0,n=s.length();
        for(int i=0;i<n;i++)///建立字典树
        {
            int id=s[i]-'a';
            if(ch[u][id]==0)//无该儿子
            {
                ch[u][id]=sz;
                memset(ch[sz],0,sizeof(ch[sz]));
                val[sz++]=0;
            }
            u=ch[u][id];
        }
        val[u]=n;
    }
 
    //在字典树中查找单词s
    bool find(string s,vector<int> &v)
    {
        int n=s.length(),u=0;
        for(int i=0;i<n;i++)
        {
            int id=s[i]-'a';
            if(ch[u][id]==0)
                return false;
            u=ch[u][id];
            if(val[u]) v.push_back(val[u]);
        }
        return val[u];
    }
};
Trie trie;
ll dp[N];
int main()
{
	string s;
	int n;
	int kase=1;
	while(cin>>s)
	{
		
		trie.clear();
		memset(dp,0,sizeof(dp));
		
		scanf("%d",&n);
		for(int i=1;i<=n;i++)
		{
			string word;
			cin.get();
	        cin>>word;
			trie.insert(word);
		}
		int len=s.length();
		dp[len]=1;
		for(int i=len-1;i>=0;i--)
		{
			vector<int>v;//储存s[i...len]中的前缀在字典中单词的长度
			//cout<<s.substr(i,len)<<endl;
			trie.find(s.substr(i,len),v);
			for(int j=0;j<v.size();j++)
			 dp[i]=(dp[i]+dp[i+v[j]])%MOD;
		}
		printf("Case %d: %d\n", kase++, dp[0]);
	}
	
}

 

    原文作者:Trie树
    原文地址: https://blog.csdn.net/sdz20172133/article/details/84201793
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞