很多时候性能问题总是发生在一些不起眼的地方。最近做一个性能问题分析的时候发现,一个函数里面使用由于字符串拼接产生的临时字符串导致内存上涨了40%(120G 内存的机器),而这些临时字符串给 GC 也带来了非常大的负担,成…
标签:hash
SQL索引hash和B-tree的解读
索引原理 HASH Hash 索引仅仅能满足”=”,”IN”和”<=>”查询,不能使用范围查询。 由于 Hash 索引比较的是进行 Ha…
我为什么要使用哈希
什么是哈希(Hash) 本来这里不应该出现这一节的,因为实际上大家应该都知道什么是哈希。不过有时候为了文章的完整性,我这里就稍微教条性地说明一下吧。ヽ(́◕◞౪◟◕‵)ノ 散列(英语:Hashing),通常音译作哈希,是…
几种流行的hash函数
A comprehensive collection of hash functions, a hash visualiser and some test results [see Mckenzie et al. Sel…
二维哈希
“`perl $hash{“chr01”}{“NAT”}=300; $hash{“chr02”}{“lincRNA̶…
Perl 模块 Hash::Merge
简介 把两个任意深度的hash合并成一个。 使用方式如下: use Hash::Merge qw( merge ); my %a = ( 'foo' => 1, 'bar' => [ qw( a b e ) …
Hive笔记-bucket介绍
hive-bucket介绍 http://blog.csdn.net/yfkiss/article/details/7816916 Buckets 对指定列计算 hash,根据 hash 值切分数据,目的是为了并行,每一…
memcached客户端应该具备的功能
memcached 只是一个服务,为了更好的使用它,必须从客户端的角度来审视它,很多客户端实现了很多 memcached 本身不具备的功能,优秀的 memcached 客户端应该具备哪些功能呢? 本篇文章从 PHP me…
redis中hash和string的使用场景
redis 中存数据时,到底什么时候用 hset 相比于 set 存数据时又有什么不一样? set 就是普通的已key-value 方式存储数据,可以设置过期时间。时间复杂度为 O(1),没多执行一个 set…
Spark Sort Based Shuffle内存分析
分布式系统里的Shuffle 阶段往往是非常复杂的,而且分支条件也多,我只能按着我关注的线去描述。肯定会有不少谬误之处,我会根据自己理解的深入,不断更新这篇文章。 前言 借用和董神的一段对话说下背景: shuffle共有…
Hash 算法、hashMap、hashTable
数组的特点是:寻址容易,插入和删除困难;而链表的特点是:寻址困难,插入和删除容易。那么我们能不能综合两者的特性,做出一种寻址容易,插入删除也容易 的数据结构?答案是肯定的,这就是我们要提起的哈希表 哈希表是根据设定的哈希…
perl – 将自定义环境变量设置为psgi hash plack
当我向dumper $env请求时,我得到了enviromment hash psgi的所有数据,在这个例子中 sub { my $env = shift; return [ 200, [], [ $env->{R…