这里面创业公司太多了,包含提供商务数据分析,可视化报表,大数据平台,数据存储,挖掘应用等,我就简单说一些我感兴趣的,它们大多在硅谷,其他的可以参考。更新到2015年6月8日,92家。
Palantir:融资:9.5亿美元。150亿美金估值,已经是超级独角兽单独列出来。Peter Thiel创办大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,并发现趋势、 关系和异常,包括预测分析。
##############
Database
MemSQL: 号称最快的内存数据库。
GraphSQL:高效、大容量的图形数据库和分析平台,创始人是国人。
MongoDB: 融资:3.11亿美元。细分行业:面向文档数据库采集。它灵活的存储方式非常受青睐。
DataStax:融资:1.9亿美元。细分行业:基于Apache Cassandra的数据库支持平台。客户包括eBay、Adobe、Netflix等
Couchbase: 文档型数据库,高性能,在LinkedIn运维也推荐使用
FoundationDB: 兼容事务处理的NoSQL
RethinkDB: open-source, scalable database that makes building realtime apps dramatically easier.
RocksDB: FB旗下的开源数据库类似LevelDB.org设计
Presto:FB旗下分布式SQL查询引擎
Hadoop
Hadoop 三剑客其中 Hortonworks 已经上市
Cloudrea:融资:10.4亿美元。细分行业:大数据分析软件、服务与培训。今年,这家大数据巨头企业即将进入中国市场。
MapR:融资:1.74亿美元。细分行业:大数据分析软件、服务与培训。它的创始团队来自Facebook、Google和Yahoo等公司
Altiscale: 提供的Hadoop作为一种服务(HAAS)
Qubole:Hadoop服务提供商,一些创业公司如Pinterest也是它的客户
Splice Machine: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP 和OLAP 应用进行实时优化处理
Continuuity: a Hadoop-based big data application hosting platform.
Platfora: Provide a big data analytics solution that transforms raw data in Hadoop into interactive, in-memory business intelligence.
Xplenty: Provide HaaS.
Nuevora: Provide Big Data analytics applications.
机器学习
Everstring:通过不断地主动挖掘和分析全网在线企业信息,结合每家企业内部的客户关系管理系统,利用机器学习自动建立量化客户模型预测谁是下一个客户。
Luminoso:自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题
Dato:GraphLab提供了一个完整的平台,从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。
Paxata:应用机器学习技术处理大数据难题
0xdata:H2O 的算法是面向业务流程——欺诈或趋势预测
Numenta:developed a cohesive theory, core software technology, and numerous applications all based on principles of the neocortex
PredictionIO:开源的机器学习服务器
Alpine Data Labs: 大数据预测分析
Zementis: 预测分析决策管理平台
Trifacta:人机交互数据分析平台
Metamind: 提供相当完美的人工智能解决方案,这种解决方案主要由“深度学习(DL)”支持
RapidMiner:数据挖掘工具
FiscalNote: 数据挖掘软件和人工智能手艺预测立法机构的投票成果,从而判断某些议案可否通过。
BI工具和其他
Looker:一个基于Web的BI平台,目前已以与Amazon Redshift、 Teradata Aster、HP Vertica、Greenplum、Impala、 BigQuery以及Spark等数据源进行集成;定制和复用数据可视化体验。
Confluent:Kafka初创公司。
Databricks:主要开发Spark。
Elasticsearch:分布式搜索引擎,基于Lucene开发
Tachyon Nexus: 主要开发Tachyon。
Snowplow Analytics:开放代码的分析平台,特别是基于AWS的分析。
Datameer:开源的数据处理系统,用于构建强大的超级计算机廉价服务器集群。
DataSift:社交数据分析公司
Datadog:数据监控
Sumo logic:日志管理过滤
Ginger.io: 为研究人员、物理学家和医疗保健人员提供相应的行为分析能力
Birst :从事商业智能和数据分析,利用云计算来颠覆传统的IT服务模式
Interana:自助分析数据平台
gridgain: 基于内存的大数据实时处理系统
Lucidworks:Solr企业版
DataTorrent :可以将数据处理速度从实时提高至“现在时”
WibiData:专业大数据软件包
Dataguise:大数据安全公司
Aerospike:开源NoSQL数据库,支持近实时数据分析
Accumulo:可靠的、可伸缩的、高性能的排序分布式的Key-Value 存储解决方案,基于单元访问控制以及可定制的服务器端处理
Pentaho:以工作流为核心的、强调面向解决方案而非工具组件的BI
Metamarkets:可视化分析,帮助在线媒体公司分析高流量的流媒体数据
Pivotal:一个以数据为核心的企业级PaaS平台
Pachyderm:Dockerized MapReduce
Premise:走众包数据采集途径向金融机构提供数据
Domo:融资:2.5亿美元。细分行业:云商务智能。它的主要服务客户是企业用户,其数据库可以帮助企业维持日常的运转。
SumAll:social media analytics and business dashboard
Tintri:“智能混合闪存”,混合了闪存和计算机硬盘驱动器
Datarella:Big Data Strategy & Product Development
Snowflake:云数据仓库
GoodData:融资:1.01亿美元。细分行业:云商务智能。GoodData向SaaS供应商提供技术集成服务,在平台内获得分析数据。
Amplitude:BI分析软件
Mu Sigma: 融资:1.95亿美元。细分行业:大数据科学服务。这是一家向企业客户提供数据分析和决策支持服务的研究公司。
Mixpanel:有web和移动分析平台,其提供的服务可以分析监测用户活动
DataHero:打着“你的数据你做主”的口号,试图弥合大数据同普通用户之间的鸿沟,即帮你分析跟你密切相关的数据
Opera Solutions融资:1.22亿美元。细分行业:大数据科学服务。其提供的大数据服务可以一次性采集数十亿条数据。
Guavus 融资:1.07亿美元。细分行业:智能解决方案平台。它的主要投资方是英特尔。
Kissmetrics:分析服务公司
treasuredata: 提供大数据存储,查询,分析云服务
Quantcast: 大数据广告公司
Spagobi: BI 开源工具
Zoomdata: 大数据可视化展示
Birst:商业智能和数据分析,安全性隔离性
Clearstory:大数据分析服务商,帮助企业和客户收集、处理、分析数据
Actian:深藏不露的数据库公司。目前其年收入大约为1.5 亿美元。对 ParAccel 的收购已经是过去5 个月中Actian 进行的第四笔收购
Eclipse BIRT: Eclipse旗下数据可视化
Netezza Analytics: IBM 旗下数据仓库
DataGravity: software-based company engaged in the IT industry and is focused on providing data management services.
Zipfian Academy:Data Science Bootcamp
Civis Analytics:big data analytics firm that helps companies, non-profits, and campaigns leverage their data to develop smarter strategy.
Quid: Business Analytics Software
inPowered:discover the most engaging content written about them and turn them into native ads that are promoted across the web, mobile apps
Cask.co:helps developers and organizations deliver Hadoop solutions more quickly and effectively with the open source
Tamr:quickly, efficiently and cost-effectively connects and enriches all of your internal or external data sources
ScalingData/Rocana: building software for large scale machine data (logs, metrics, etc.) and event management, specifically in the domain.
Ayasdi: use mathematics theory to find potential patterns in data and visualize them as geometric shapes
bloomreach:采用数据学分析让用户手机变得与促销密切相关
roambi:向任何iPad用户发布和传播动态宣传册、报告和介绍.
airtable:easy but powerful organizational tool that works exactly the way you want. It’s as fast and flexible as a spreadsheet, but offers a refreshingly clean
databox:Mobile Business Intelligence Platform
下面是来自Bo Yang的总结
从对美国大数据市场的调研来看,我们可以得到一些启示:
美国的数据分析市场非常大,容纳超过百家公司,这得益于美国信息化的高度发达。
虽然有很多公司,但是大家很少有重复竞争,每一家都有自己的特色,在自己的领域内发展,这也符合美国公司注重差异化相关。
传统的商务数据分析公司在维持旧有客户和平台的情况下,在积极向大数据技术扩展。
新兴的大数据技术发展非常快,但是目前还没有到成熟阶段,除了Hadoop之外,没有其他统一的技术被各家公司采用。
新的大数据技术趋势是快速响应,开始追求数据的实时处理和快速查询。
相对于美国市场,中国的大数据市场还处于非常初期的阶段,这可能跟中国的信息化程度相关。做长期展望预测,如果中国的信息化发展到美国的阶段,并且公司普遍采用基于数据的量化决策机制,将会迎来一个大数据发展的爆发式增长。