最近在学习linux内核的主要模块,遇到了红黑树数据结构,在经过了很长时间的一头雾水后,终于明白一点了。把自己的体会写下来和大家分享,同时欢迎指正。
1、 初识红黑树
从网上搜索了许多红黑树的介绍,这些文章中主要介绍了红黑树的性质,然后就是红黑树的旋转如下示意图。
左旋、右旋,旋转过程中爸爸变成了儿子,兄弟变成了孙子;红的变成黑的,黑的变成红的。经过一系列的旋转,就把我旋转的晕头转向了,脑子里搅成了一团浆糊。相信,没有学过二叉树的同学肯定会遇到和我一样窘况。
2、 曙光乍现
一天,顶着一头圈圈的我(是头晕的圈圈, 可不是天使头上美丽的光环,呵呵)看到了一棵用数字表示的红黑树,如下
尝试着用旋转规则进行旋转,惊奇的发现,按照无论怎么旋转,结果都是使得从任何一个节点开始,左下方的数比本节点数值小,右下方的数比本节点大。我立刻想到了这种数据结构的好处,查找一个数非常方便(有点像二分法,只是不是中分)。总结:[比如我需要插入一个数据9:先找根节点13,9《13所有找左边的8;9》8所以找右边的11;9《11所以找左边的NULL;所以将9插入到11左边。]
[查找/插入/删除数据]
另外,从资料上看到,红黑树放松了平衡二叉树的某些要求,插入和删除操作中的平衡处理只发生在局部,据有资料介绍,最多经过3次左右旋转就可以达到平衡,插入和删除的效率非常高。因为红黑树也是二叉查找树,因此红黑树上的查找操作与普通二叉查找树上的查找操作相同,以O(log2 n)的时间复杂度进行搜索。红黑树真是太神奇了,发明人真是天才!!!在此向发明人致敬!
3、 linux内核模块中对红黑树的应用
如果只是为了理解linux内核进程调度和内存管理中的红黑树应用的话,只要记住下面即可
A、红黑树是一个二叉搜索树(从任何一个节点开始,左下方的数比本节点数值小,右下方的数比本节点大)。
B、插入过程中按照key值大小插入到树中适当的位置。
C、搜索、插入和删除效率很高。
至于如何调整平衡,该旋转哪个节点、左旋还是右旋、该如何改变颜色,那是研究算法人员的事(就是这些让我头晕晕的,呵呵),我们只要知道搜索、插入和删除等函数的名称和用法就可以了,呵呵
在linux进程调度中,准确地说是非实时进程的CFS调度中用到了红黑树,每个进程都有一个虚拟运行时间,进程运行一段时间后其虚拟运行时间会增加,优先级高的进程的虚拟时间增加的慢,如优先级高的进程运行10ms后,虚拟运行时间增加1vms(vms 为虚拟毫秒,我自己给他定义的,为了区别真是的时间),优先级低的进程运行10ms后,虚拟运行时间增加1000vms。所有非实时可运行进程都以虚拟运行时间为key值挂在一棵红黑树上,在CFS调度中总是选择虚拟运行时间小的进程进行调度运行,这样每个进程都有运行机会,只是在一定的时期内,优先级高的进程实际运行的累计时间长。CFS调度的可以参考《linux内核之CFS调度和组调度》的文章,后续整理了分享给大家。
在内存管理中,在内核管理某个进程的内存时使用了红黑树,见下面数据结构(只保留和内存管理相关的成员),每个进程都有一个active_mm的成员用于管理该进程的虚拟内存空间。struct mm_struct中的成员mm_rb是红黑树的根,该进程的所有虚拟空间块(虚拟地址不连续)都以起始虚拟地址为key值挂在该红黑树上。该进程新申请的虚拟内存区间会插入到这棵树上,当然插入过程中可能会合并相邻的虚拟区域。删除时会从该树上摘除相应的node。可参考《linux内核之内存管理》的文章,后续整理了分享给大家。
struct task_struct{
struct mm_struct *mm, *active_mm;
}
struct mm_struct{
struct vm_area_struct * mmap; /* 不知目前是否使用了该成员? */
struct rb_root mm_rb; 指向一棵红黑树
struct vm_area_struct * mmap_cache; /* last find_vma result */指向最近找到的虚拟存储区域
int map_count; /* number of VMAs */ 虚拟区间的个数
pgd_t * pgd; 是否指向页转换表?????
}
struct vm_area_struct{
struct mm_struct * vm_mm; /* The address space we belong to. */
unsigned long vm_start; /* Our start address within vm_mm. */
unsigned long vm_end; /* The first byte after our end address within vm_mm. */
/* linked list of VM areas per task, sorted by address */
struct vm_area_struct *vm_next;
struct rb_node vm_rb; 这个虚拟区域对应的红黑树的节点,该节点会挂接到mm_struct 的mm_rb指定的红黑树上
}