Hash Table(散列表)

  这篇主要是基础的数据结构学习,写的时候才明白了书上说到的一些问题,由于该篇仅仅只是对这种数据结构进行一个理解,所以很基础,关于h(x)函数也只是简单的运用了除法散列,然后为了应对冲突,我用的是链接法。

  下面说说散列表和我对散列表的理解:

  1.什么是散列表?

  散列表就是一个关键值映射的地址组成的表,这里的地址是数组的下标…至于映射,学过数学就应该要知道这个概念并不难理解,就是自己设计一个优秀的映射(函数),一个好的映射可以很优秀的避免空间的浪费和冲突的发生,由于我比较菜233,自己设计不出并且也暂时没时间研究一个这样的函数,所以,我用的就是简单的关键值取余,写成数学函数就是 h(key) = key mod N(其中key为关键值,N为散列表的大小),显然,可以看到这个函数设计得并不好,很多关键值都可能被映射到同一个位置上去,然后就发生了冲突,并且还有一些表的空间可能一直都没有值映射到,就造成了空间的浪费。但这也是一个方案,至少让我们有了踏出第一步的勇气去探索更好的方法,或者说还能让初学者更快的、更明了的理解什么是散列表和冲突,基本上这就是什么是散列表了。

  2.什么是链接法?

  上面多次提到了冲突(也叫碰撞,collision),按照我们的映射的设计,很大可能会出现不同的两个关键值映射到了同一个地址上去,这样的行为就被称为冲突或者碰撞,所以,为了保证数据都可以保存在表中,而且不会被覆盖、丢失等,解决这个问题的一个方法就是链接法(也称拉链法,Chaining),即,将散列到同一个槽(地址)的关键值用链表的方法保存,这样说可能还是想像不出是什么样的情形,那我更细节一点说就是,把所有具有相同地址的数据用链表来保存,并把该链表的头节点保存到散列表中的对应的地址中,这样就可以避免冲突,而且分好了同类,只要输入的关键值被映射到这个地址,那么就遍历这个地址中的链表,添加到尾部(我认为链表可以换成栈或者队列,然后就实现了一个其他的数据结构,比如散列栈、散列队列233…不过不知道用处?),从这里我们也就可以知道,查找、删除和添加的最坏时间复杂度为O(N)了,N是散列表的大小,这种情况就是所有的数据全被散列到同一个地址上了…然后就是一个链表…

  好了,说得也差不多了,我再说一下昨晚一直烦恼的几个小问题,最大的问题就是开始写的时候,我的链表是没有头结点的…然后,大家知道没有头结点进行删除是有很大问题的,会删除的是删除对象的后一个节点,其实添加一个头结点就问题都解决了,但…我又感觉添加一个头结点改着麻烦,由于我太菜也没其他的解决办法,最后受不了了,睡觉。。。今天早上还是默默的添加了头结点,问题解决。。。另一个问题就是查找…..就是:假如我插入了几个具有相同地址的数据,也就是这个地址有了链表,然后我又删除其中一个以后,再查找删除的这个数据就会导致程序崩溃…因为,查找用的也是相同的散列函数,这样的话就因为这个位置保存的是地址相同的链表,删除一个,这里的链表还是存在,但没有了这个数据,我再查找删除的这个数据时,首先被映射到了这个链表头,然后会在里面找…结果已经被删除了,是不可能找得到的,但偏偏又要返回一个值…这个问题其实要解决也不难,把返回值改一下就好了,但我不想那么做…那么可能就需要再写个判断存在的函数,也感觉麻烦,于是就一直拖着了…然后就想着算了…嘛,之后再说吧,我有心情了再解决吧,还有个问题就是我本来想写一个输出散列表中的所有数据,结果接受不了一个地址一个地址的检查是否为NIL,但也没有其他好办法,嫌麻烦233。。。于是改成了输出某个地址的所有数据。。。可能还有其他地方也有些问题…暂时没发现,主要是测试得并不多~

——————-update 16:06:37—————

  上面说的问题以及一些之前没注意到的BUG也都在午休以后全部解决了,应该没有问题了。

  下面给出我的实现方法:

/**
 *     Hash table(散列表)
 *
 *		链接法(chaining)
 */
#include <stdio.h>
#include <stdlib.h>
#include <conio.h>

#define bool int
#define true  1
#define false 0

#define ListSize 10

typedef struct LinkedList {
	struct LinkedList* next;		//当发生冲突时申请额外节点来存放冲突值
	int key;		//key-value
	int count;		//list个数
}HashChain;			//链接法

struct HashList {
	HashChain* Node;
}hashlist[ListSize];	//建立hashlist-LiseSize

/* 定义全部函数 */
HashChain* initHashtable();
bool ListEmpty();
bool ListFull();
int GetListCount();
static int Hashmap();
static bool HashCollision();
bool InsertList();
HashChain* FindListKey();
bool DeleteList();

/**
 *	初始化hashlist的每一个位置的节点与个数
 */
HashChain* initHashtable(void)
{
	HashChain* table;
	int i;

	for(i = 0; i < ListSize; i++)
	{
		hashlist[i].Node = NULL;
	}

	table = (HashChain*)malloc(sizeof(HashChain));
	table->count = 0;
	table->next = NULL;

	return table;
}

/**
 *	判断hash表是否为空
 */
bool ListEmpty(HashChain* table)
{
	return table->count == 0;
}

/**
 *	判断hash表是否满
 */
bool ListFull(HashChain* table)
{
	return table->count == ListSize;
}

/**
 *	当前散列表中的数据个数
 */
int GetListCount(HashChain* table)
{
	return table->count;
}

/**
 *	哈希函数-映射,将value映射为hash table中的一个地址
 */
static int Hashmap(int val)
{
	return val % ListSize;
}

/**
 *	判断映射地址是否发生了冲突
 */
static bool HashCollision(int val)
{
	if(hashlist[Hashmap(val)].Node != NULL )	//检查val的映射地址的第一个节点是否存在,存在则说明冲突。时间复杂度O(1)
		return false;

	return true;
}

/**
 *		插入数据
 */
bool InsertList(HashChain* table, int X)
{
	HashChain* list, * temp;

	if(ListFull(table))		//如果list满了
	{
		fprintf(stderr, "HashList is full!\n");
		return false;		//提前退出
	}
	else if(HashCollision(X))		//如果没冲突
	{
		hashlist[Hashmap(X)].Node = (HashChain*)malloc(sizeof(HashChain));		//对该地址申请一个节点,把节点保存到list中
		temp = (HashChain*)malloc(sizeof(HashChain));
		temp->key = X;
		temp->next = NULL;
		hashlist[Hashmap(X)].Node->next = temp;
	}
	else if(!HashCollision(X))		//如果冲突
	{
		list = hashlist[Hashmap(X)].Node;	//为了防止改变冲突的原地址的节点,把地址赋给一个hash结构变量,让它来完成查找插入的位置的任务
		while(list->next != NULL)	//链表的线性查找,使得新插入的值插入到该地址中的链表的尾部
		{
			list = list->next;
		}
		temp = (HashChain*)malloc(sizeof(HashChain));
		temp->key = X;
		list -> next = temp;
		temp -> next = NULL;
	}
	++table->count;	//计数

	return true;
}

/**
 *		查找数据
 */
HashChain* FindListKey(HashChain* table, int X)
{
	HashChain* list;

	if(ListEmpty(table))		//如果表为空,节省一点查找的时间
	{
		fprintf(stderr, "HashList is empty!\n");
		return NULL;
	}
	else if(HashCollision(X))		//如果没有冲突,说明表中不存在该数据
	{
		fprintf(stderr, "The data does not exist!\n");
		return NULL;
	}
	else		//如果冲突,则从该地址中的链表的第一个节点开始比较查找,查找的平均时间复杂度为O(1+n),n为链表的节点个数,最坏情况为O(ListSize),最好情况为O(1)
	{
		list = hashlist[Hashmap(X)].Node;
		while(list->next != NULL)
		{
			list = list->next;
		}
		return list;
	}
}

/**
 *		删除数据
 */
bool DeleteList(HashChain* table, int X)
{
	HashChain* list, * temp;
	int flag;

	if(ListEmpty(table))		//如果表为空,提前退出节省一点查找的时间
	{
		fprintf(stderr, "HashList is empty!\n");
		return false;
	}
	else if(HashCollision(X))		//如果没有冲突,说明表中不存在该数据
	{
		fprintf(stderr, "The data does not exist!\n");
		return false;
	}
	else if(!HashCollision(X))		//如果冲突有两种情况,1.删除的数据的映射地址和该地址相同,但数据不存在,2.删除的数据存在
	{
		list = hashlist[Hashmap(X)].Node;
		while(list->next != NULL)
		{
			temp = list;
			list = list->next;		//放在判断的前面是因为头结点没有数据
			if(list->key != X)
				flag = 0;
			else
				flag = 1;
		}
		if(flag)		//存在则删除
		{
			temp = list->next;
			list->next = list->next->next;
			free(temp);
			temp = NULL;		//防止野指针
		}
		else
		{
			fprintf(stderr, "The data does not exist!\n");
			return false;
		}
	}
	--table->count;

	return true;
}

int main(void)
{
	HashChain* table, * PrintKey;
	int val;
	char c;

	table = initHashtable();
	puts("1) 添加		2) 删除");
	puts("3) 查找		4) 关键值个数");
	puts("5) 显示指定地址中的所有关键值");
	puts("6) 退出");

	while((c = getch()) != '6')
	{
		switch(c)
		{
		case '1' :	printf("\n添加数据:");
					scanf("%d", &val);
					InsertList(table, val);
				break;
		case '2' :	printf("\n删除数据:");
					scanf("%d", &val);
					DeleteList(table, val);
				break;
		case '3' :	printf("\n查找数据:");
					scanf("%d", &val);
					if(FindListKey(table, val)->key == val)
						printf("您查找的数据为:%d\n", FindListKey(table, val)->key);
					else
						printf("The data does not exist!\n");
				break;
		case '4' :	printf("\n当前关键值个数为: %d\n", GetListCount(table));
				break;
		case '5' :	printf("输入地址:");
					scanf("%d", &val);

					printf("显示数据:");
					if(hashlist[val].Node != NULL && val < ListSize)
					{
						PrintKey = hashlist[val].Node;
						while(PrintKey->next != NULL)
						{
							PrintKey = PrintKey->next;
							printf("%d ", PrintKey->key);
						}
						printf("\n");
					}
					else
						printf("The address does not exist!\n");
				break;
		}
	}
	free(table);
	table = NULL;

	return 0;
}

  等自己学到更多姿势了,把其他解决冲突的办法和更好的映射方法再补充上。。。

    原文作者:darkchii
    原文地址: https://www.cnblogs.com/darkchii/p/7640557.html
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞