哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。
链表查找的时间效率为O(N),二分法为log2N,B+ Tree为log2N,但Hash链表查找的时间效率为O(1)。
设计高效算法往往需要使用Hash链表,常数级的查找速度是任何别的算法无法比拟的,Hash链表的构造和冲突的不同实现方法对效率当然有一定的影响,然 而Hash函数是Hash链表最核心的部分,下面是几款经典软件中使用到的字符串Hash函数实现,通过阅读这些代码,我们可以在Hash算法的执行效率、离散性、空间利用率等方面有比较深刻的了解。
下面分别介绍几个经典软件中出现的字符串Hash函数。
●PHP中出现的字符串Hash函数
static unsigned long hashpjw(char *arKey, unsigned int nKeyLength)
{ unsigned long h = 0, g;
char*arEnd=arKey+nKeyLength;
while (arKey < arEnd)
{ h = (h << 4) + *arKey++;
if ((g = (h & 0xF0000000)))
{ h = h ^ (g >> 24); h = h ^ g;}}
return h;
}
●OpenSSL中出现的字符串Hash函数
unsigned long lh_strhash(char *str){int i,l; unsigned long ret=0; unsigned short *s; if (str == NULL) return(0); l=(strlen(str)+1)/2; s=(unsigned short *)str; for (i=0; i ret^=(s[i]<<(i&0×0f));return(ret);} unsigned long lh_strhash(constchar *c){ unsigned long ret=0;long n; unsigned longv;int r; if ((c == NULL) || (*c == '\0′))return(ret); n=0×100; while (*c){ v=n|(*c); n+=0×100; r= (int)((v>>2)^v)&0×0f; ret=(ret(32-r)); ret&=0xFFFFFFFFL; ret^=v*v; c++;}return((ret>>16)^ret);}
●MySql中出现的字符串Hash函数
#ifndef NEW_HASH_FUNCTION staticuint calc_hashnr(constbyte *key,uint length){ register uint nr=1, nr2=4; while (length–) { nr^= (((nr & 63)+nr2)*((uint) (uchar) *key++))+ (nr << 8); nr2+=3;}return((uint) nr);} staticuint calc_hashnr_caseup(constbyte *key,uint length){ register uint nr=1, nr2=4; while (length–) { nr^= (((nr & 63)+nr2)*((uint) (uchar) toupper(*key++)))+ (nr << 8); nr2+=3;} return((uint) nr);}#elseuint calc_hashnr(constbyte *key, uint len){constbyte*end=key+len;uint hash; for (hash = 0; key < end; key++){ hash *= 16777619; hash ^= (uint) *(uchar*) key;} return (hash);} uint calc_hashnr_caseup(constbyte *key, uint len){constbyte*end=key+len;uint hash; for (hash = 0; key < end; key++){ hash *= 16777619; hash ^= (uint) (uchar) toupper(*key);} return (hash);}#endif
Mysql中对字符串Hash函数还区分了大小写
●另一个经典字符串Hash函数
unsigned int hash(char *str){ register unsigned int h; register unsigned char *p; for(h=0, p = (unsigned char *)str; *p ; p++) h = 31 * h + *p; return h;}