阿里云自研大规模分布式NoSQL系统-表格存储招聘

表格存储(TableStore)于阿里云建立之初的2009年立项开发,对标Google 三驾马车(GFS, BigTable, Map-Reduce)中的BigTable。经过8年的打磨,表格存储已经在阿里巴巴集团内部获得了广泛的使用,涵盖电商、金融、日志、互联网社交、物联网等业务领域,支撑着阿里巴巴集团的许多基础应用,包括邮箱和钉钉等。随着公有云的兴起,表格存储在2013年正式对开发者提供服务,开发者丰富的场景进一步打磨了表格存储的易用性,稳定性和性能。随着阿里云全球化的业务扩展,表格存储作为基础产品之一也完成了全球部署,在阿里云全球每一个数据中心,用户都可以开通表格存储服务。

要做好一款数据库,除了由衷的热爱,更需要数年持续不断的学习和改进。

过去的几年,我们一方面专注打磨存储引擎,在架构和工程方面做了一系列优化:索引文件格式的优化来降低内存的需求;细致的数据编码来降低存储成本;数据收发零拷贝;小对象序列化和反序列化的性能优化;无锁的数据结构来减少冲突和线程切换;run2complete来减少context switch的开销等。第二方面,在分布式存储,多租户的支持,自动分裂和负载均衡方面积累了大量的创新,提供了性能和容量的水平扩展,实现自动的负载调度和均衡,提供多租户的隔离,和多集群(同城、异地)之间的复制等。第三方面,紧贴业务需求,满足互联网应用和cloud-native应用的高并发和高吞吐的需求,推出了一系列赋能客户应用和架构的功能,PK列串行自增功能,极大地简化了钉钉架构和互联网IM应用的架构;多版本和TTL功能,简化用户数据的管理和减少存储成本;Stream功能,增量修改的实时导出,与批量和实时计算系统的无缝连接;基于主键前缀的事务,方便用户更好的完成业务逻辑等等。

当下,表格存储挑战无处不在。随着人工智能和物联网的兴起,数据的价值被更广泛的挖掘。第一,数据量指数级的增长,容灾,全球访问等需求凸显出来,我们需要打造一个跨地域的分布式表格存储。第二,数据模型的多样化和访问的多样化,Key-value,Document,多级索引,SQL查询等,我们需要打造一个支持多种数据模型和查询方式的表格存储。第三,数据价值的挖掘,对接多样化的AI和计算平台,我们需要打造一个开放生态的表格存储。

欢迎加入,一起打造表格存储2.0,这里将是一个展现你实力的舞台。

工作地点:杭州、北京、上海

简历/咨询可以发至shiquany at http://gmail.com 或者站内私信

技能要求:

  1. 良好的C/C++编程能力,写过大型系统更佳

  2. 熟悉NoSQL数据库或者关系型数据库存储底层原理,阅读过开源代码更佳

  3. 熟悉数据库事务/一致性协议/SQL引擎优化,阅读/实现过相关功能更佳

  4. 基本功过硬(算法、数据结构、代码能力),热爱编程,即使没有相关经验,也非常欢迎

[1]. 表格存储介绍:表格存储_海量数据存储-阿里云

[2]. 图片来自网络,侵删。

    原文作者:杨东东
    原文地址: https://zhuanlan.zhihu.com/p/26938784
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞