0615 哈夫曼树:下表给出的,是某文本档案中的词汇出现的频度。假设文本档案中只有这些词,请给出各个单词的哈夫曼编码,求出平均查找长度。
然后将各个树枝上的编号确定各个单词的哈弗曼编码
The: 10;
of 001
a 011 ;
to 111
and 0001
in 0101
that 00001
he 01001
is 01000
at 11011
on 11010
for 11001
His 11000
are 000001
be 000000
平均长度=(各个编码长度*权值)之和
=1192*2+677*3+541*3+518*3+462*4+450*4+242*5+195*5+190*5+181*5+157*5+174*5+138*5+124*6+123*6=19107
如果用等长的编码平均每位需要4位。(共有15个单词)而如果用哈夫曼树进行编码平均每位只需19107/5364=3.562
此题得解。