NKOJ 2406 翻译密码子
时间限制 : 10000 MS 空间限制 : 65536 KB
问题描述
DNA是一切细胞生物的遗传物质。它能指导蛋白质的合成,从而控制细胞的新陈代谢和生物的性状。
中心法则(genetic central dogma) 是所有有细胞结构的生物所遵循的法则,它的主要内容是遗传信息从DNA传递给mRNA,再从mRNA传递给蛋白质的转录和翻译的过程。
mRNA是由许多核糖核苷酸组成的链状分子,但这些核糖核苷酸不外乎4种:腺嘌呤核糖核苷酸(A),鸟嘌呤核糖核苷酸(G),胞嘧啶核糖核苷酸(C)和尿嘧啶核糖核苷酸(U)。
mRNA上三个相邻的核糖核苷酸序列叫做密码子,一个密码子可以翻译成一个氨基酸,密码子不重叠。
一条mRNA只能翻译成若干种氨基酸,并且知道决定这些氨基酸的密码子。
给出一条mRNA的核糖核苷酸序列,请你计算出它最多能翻译成多少氨基酸。
输入格式
第一行,字符串,长度不超过10000,表示核糖核苷酸序列。
接下来若干行,每行一个密码子,只有这些密码子能够翻译成氨基酸。相同的密码子不重复出现。
输入数据仅由A、G、C、U四个大写字母组成。
输出格式
一行,表示给出的核糖核苷酸序列组成的mRNA最多能翻译成氨基酸的数目。
样例输入
样例输入1:
ACACGAUC
CAC
AUC
CGA
样例输入2:
AAAAA
AAA
样例输入3:
AUCUCUCUCU
AUC
UCU
样例输出
样例输出1:
2
样例输出2:
1
样例输入3:
3
思路:
先读懂题….
阶段:从左到右讨论序列的每一位
状态:f[i]表示第i+2位能取得的最多数目(+2的原因是密码子长度为3位)
决策:当第i位到i+2位的三位能翻译时,选还是不选
方程:f[i]=max(f[i-3]+1,f[i-1]) (第i位能匹配时)
f[i]=f[i-1] (第i位不能匹配时)
边界条件(0<=i<=n-2)
怎样判断第i位能否匹配呢?
KMP
代码:
#include<cstdio>
#include<iostream>
using namespace std;
int fail[5],n,cnt[10005],f[10005];
bool r[10005];
string a;
void ang(string b)
{
int m=3;
int j,biao;
fail[0]=j=-1;
for(int i=1;i<m;i++)
{
while(j>-1&&b[j+1]!=b[i]) j=fail[j];
if(b[j+1]==b[i]) j++;
fail[i]=j;
}
j=-1;
for(int i=0;i<n;i++)
{
while(j>-1&&b[j+1]!=a[i])
j=fail[j];
if(b[j+1]==a[i]) j++;
if(j==2)
{
biao=i-m+1;
r[biao]=true;
j=fail[j];
}
}
}
int main()
{
//freopen("a.txt","r",stdin);
cin>>a;
n=a.length();
string b;
while(cin.eof()!=true)
{
cin>>b;
ang(b);
}
if(r[0]) f[0]=1;
f[1]=r[1]?1:f[0];
f[2]=r[2]?1:f[1];
for(int i=3;i<=n-3;i++)
{
if(r[i]) f[i]=max(f[i-1],f[i-3]+1);
else f[i]=f[i-1];
}
printf("%d",f[n-3]);
}