[译] 解密 Uber 数据部门的数据可视化最好实践

《[译] 解密 Uber 数据部门的数据可视化最好实践》

概述

在2015年终,我们在Uber规划了一个官方的数据科学团队。这个主张的缘起是:经由历程可视化数据探究东西从Uber的数据中发明洞见。天天,Uber 治理上亿级别的GPS位置信息。每分钟,我们的平台处置惩罚上百万的挪动事宜。每次我们不必手艺剖析就直观地晓得这是一个我们错过相识我们营业的好机会。

自成立以来,这个数据可视化团队就不断生长壮大,从我和别的一个工程师两个人生长到了如今的15人的全栈团队。数据可视化手艺专家席卷了从计算机图形学到信息设想、封面创意手艺以及 Web 平台开辟。我们团队专注于从视觉剖析到舆图绘制以及从框架开辟到面向民众的数据可视化的全部历程。

让我们看看都做了哪些事情:

可视化剖析:加强数据可操纵性

《[译] 解密 Uber 数据部门的数据可视化最好实践》

AB测试平台的表格和置信区间可视化

可视化剖析主要都是由笼统数据可视化组成的。这个触及到可视化事情的数据是没有内涵的地舆构造。与之相反的是科学可视化,这类可视化从物理天下(舆图、3D物理构造等等)的角度形貌了数据。大多数有用的可视化剖析在这类状况下都是关于报告、仪表盘、实时剖析的图标和收集图。我们的团队在大多数贸易洞见应用和贸易数据探究上加强了可视化图层。其他地区的同事用我们的可视化东西加强了包含我们的AB测试平台和内部的大规模机械进修平台的可视化结果。

我们团队强调建立像我们建立这个应用相似的可复用组件。我们近来开源了react-vis,这是一个 React 和加强版的D3 可视化库,它供应了 基于JSX的语法,专用的言语来构造图表的坐标、图标范例以及其他一些可视化元素。它支撑开辟人员以声明的体式格局在他们的数据集用 React- 和 JSX-友爱型的情势来塑造他们想的可视化结果。

在舆图绘制上我们也在做相似的事情。

舆图绘制:大数据探究

基于舆图的信息是我们在Uber最大最雄厚的资产。然则,一方面,天天我们的平台实时收集上亿的GPS点。另一方面,我们必须在浏览器内完成数据麋集可视化。这些都对实时舆图可视化作出了极大应战。

《[译] 解密 Uber 数据部门的数据可视化最好实践》

在给定半径区域内拖动鼠标将可以实时看到Uber的目的地散布状况

我们为差别主顾量身定制多种舆图应用。个中一类主顾是在Uber运营的400多个都市内的总经理和都市运营团队。这个普通人须要有一个当前供求散布的实时信息。他们也须要猎取聚合数据来明白都市的市场以便于进一步的谋划市场营销运动。另一类用户是数据科学团队,他们须要雄厚的数据探究界面来操纵多维数据(经由历程产物、时候、地舆数据来向下钻取)。我们为其他团队构建可以分块和切片的应用以便于从数据中取得洞见。

关于这些应用,我们的手艺栈是由一些我们之前开辟而且开源的库组成的。react-map-gl 供应一个在MapboxGL基础上与React相似的图层。这个MapboxGL是一个我们在Uber普遍应用的从Mapbox引入的库。deck.gl供应了一个建立WebGL加强图层的应用,它可以放在舆图的最上层或许单独用来建立一个笼统的数据可视层。

《[译] 解密 Uber 数据部门的数据可视化最好实践》

deck.gl 和 react-map-gl 供应了 WebGL 界面来建立数据麋集型的舆图应用

然则一切这些手艺都可以以一种创造性的体式格局被应用。数据可视化最主要的部份实际上是数据故事叙说和数据艺术化显现。

面向民众:报告数据故事

用数据可视化报告Uber的故事的要领有很多种。我们可以缭绕诸如平安、效力、流量、政策等话题在大众传播收集中睁开可视化叙说。

近来,我们最先了一个探究uberPool是怎样让都市交通变得更高效的数据可视化项目。在 Travis Kalanick 的TED演讲以后,你将看到我们制造的数据可视化显现每一个没有应用uberPOOL的街区流量状况,这表明了 POOL可以经由历程削减流量让都市变得越发智能化。

《[译] 解密 Uber 数据部门的数据可视化最好实践》

左图: SF 在没有uberPOOL时交通拥堵的城区。右图:POOL用一种智慧的方法平衡了交通流量。

我们继承做一同其他的可视化叙说。这个事情领域风趣的融会了数据作家和数据艺术化显现所带来的应战。数据处置惩罚和我们我们内部可视化探究的数据剖析产物一样充溢应战。然则这时候,以人为本的美学设想和通俗易懂的解释性是比高效的信息设想手艺来得更主要的。

比方,我们最先和设想团队合作。为了动态舆图可以显现天天每辆车的Uber路程,我们拿到了品牌视频。这里的殊效就是用WebGL应用为每一帧动效都在服务端衬着举行衬着然后编译到视频里构成的。这个应用关注从数据猎取(经由历程Hive)到视频离线衬着输出手艺的每一个环节。

一个设身处地的 3D 动画舆图匿名展现了一整天的Uber之旅:

三藩市:

《[译] 解密 Uber 数据部门的数据可视化最好实践》

洛杉矶:

《[译] 解密 Uber 数据部门的数据可视化最好实践》

关于如许的事情我们也开辟了一套叫做luma.gl的框架,这套框架专注于基于WebGL的可视化应用。它依据一些诸如ES6、WebGL 2.0、组件化平台的当代手艺而设想。这使得luma.gl可以和其他诸如stack.gl那样的盛行的库一同互操纵。

想晓得更多吗?

在Uber,数据使我们最大的财产。我们用可视化探究数据剖析东西经由历程数据来发明洞见,而且我们营业矩阵的数据探究也可以让我们Uber一切都市的治理者做出越发有用的贸易决议计划。
假如你对和我们的Uber工程团队一同面临这些应战感兴趣,你可以检察我们的数据可视化工程的开放职位列表,然后联络data-viz@uber.com。我们期待你的到场。

原作者: NICOLAS GARCIA BELMONTE 译者:Harryzhu

英文原文地点:
https://eng.uber.com/data-viz…

作为分享主义者(sharism),本人一切互联网宣布的图文均顺从CC版权,转载请保存作者信息并说明作者 Harry Zhu 的 FinanceR专栏:https://segmentfault.com/blog…,假如触及源代码请说明GitHub地点:https://github.com/harryprince。微信号: harryzhustudio
贸易应用请联络作者。

    原文作者:HarryZhu
    原文地址: https://segmentfault.com/a/1190000005154321
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞