NLP创业公司概览

最近闲来无事,想通过NLP相关的创业公司,了解一下NLP落地的实际情况和趋势,同时也可以追踪工业界的动态。我直接根据CB Insights在2017和2018公布的AI100榜单,筛选出一些和NLP比较相关的公司(一定程度上,NLP是作为该公司的核心技术,而不是辅助技术),然后对这些公司业务作个简单的介绍,再根据他们所属的领域分类。按照惯例,CB Insights应该会在近期公布2019的榜单,到时候再进行补充。

PS. 我本身对这些公司的业务没有深入的了解,信息仅来源于CB Insights的报告和各公司官网。本文只是探索NLP应用的场景,不对其他问题形成参考和建议(说得好像有人会信了我的邪,手动狗头)。CB Insights报告里面已被收购或上市的公司就没列出来了,像百度的Kitt.ai(个性化唤醒词),思科的MindMeld(对话AI),微软的Semantic Machines(对话AI),有兴趣的可以搜搜看(其实我就是懒)。另外,公司成立时间、地点、员工数等基本信息来源于Crunchbase。

AlphaSense

《NLP创业公司概览》

AlphaSense通过从大量数据源,包括公司文件、文稿、新闻、华尔街研报,为客户高效地整理有价值的讯息。该公司的业务主要是针对企业客户以及投资者,帮助他们从多源信息中提炼关键信息,指导决策和投资,即,信息优势是该公司给客户带来的核心利益。

Automat

《NLP创业公司概览》

  • 成立时间:2016.1
  • 地点:加拿大蒙特利尔
  • 员工数:11-50
  • 融资情况:A轮
  • 总融资额:10.9M美元
  • 网址:https://www.automat.ai/

相对于传统的邮件营销(就是你收到的各类产品广告邮件),Automat提出了对话营销(Conversation Marketing)的概念。基本思想就是提供商家与每个客户一对一交流、有针对性地推销产品的能力。通过他们提供的对话即服务(Conversation as a Service),商家可以方便地将这种服务和当前流行的即时通讯聊天APP(WhatsApp,Line,微信等)进行对接,以触及更多的用户。他们提供了与欧莱雅合作的案例,该服务为欧莱雅的营销带来了显著增长。

Chorus

《NLP创业公司概览》

  • 成立时间:2015
  • 地点:美国旧金山
  • 员工数:51-100
  • 融资情况:B轮
  • 总融资额:55.3M美元
  • 网址:https://www.chorus.ai

Chorus旨在理解并加强人们沟通的效率。其通过实时地记录、总结、存储人们的交流过程,以可视化的方式展现对整个交流过程分析的结果,帮助客户了解哪些内容会影响沟通交流的结果以改进沟通的方式。一个典型的场景就是电话销售,该公司团队分析了三百多万个通话记录(大部分是销售电话),将他们的分析结果公布在公司的博客上,主要是介绍一些电话销售的技巧,比如如何让整个销售流程顺利进行。

《NLP创业公司概览》
《NLP创业公司概览》

CloudMedx

《NLP创业公司概览》

CloudMedx是一家提供医疗分析的公司。公司的业务流程,先是从穿戴设备、电子病例多个和病人相关的数据源收集收据,然后利用NLP和机器学习技术,结合AI模型生成诊断结果和后续操作建议,提升病人风险评估和诊断文档整理的效率。他们的平台是构建于一个全面的,且规模不断增长的医学知识图谱之上的。知识和本体的引入,增强了整个系统的能力。

http://Cortical.io

《NLP创业公司概览》

  • 成立时间:2011.11.1
  • 地点:奥地利维也纳
  • 员工数:11-50
  • 总融资额:6.3M美元
  • 网址:https://www.cortical.io/

这个公司和NLP的关系更直接,他们提供一系列NLU解决方案。受到近期关于大脑如何处理信息的研究的启发,Cortical开发了Retina引擎,其能够将语言转为语义指纹(其实就是信息指纹,只不过是能够显式地捕获文本语义的信息指纹)。通过计算指纹之间的重合度来比较两段文本之间的语义相关度。他们声称,该NLU系统有别于现在主流的AI,其能够轻松地完成任何语言、领域的定制化。而算法内在的差别使得Cortical可以解决许多开放的NLU问题,比如在TB级别非结构化数据上完成基于含义的过滤,社交媒体实时话题检测,以及,在百万文档规模上进行跨语言的语义搜索。个人感觉这个公司挺有意思的,可以深入了解一下他们的业务和技术。官网提供了一些demo,也可以申请免费的API试用。

Digital Reasoning

《NLP创业公司概览》

  • 成立时间:2000(老牌啊)
  • 地点:美国富兰克林
  • 员工数:101-250
  • 融资情况:D轮
  • 总融资额:104M美元
  • 网址:https://digitalreasoning.com/

Digital Reasoning(DR)在认知计算方面是个领导者。业务有点类似AlphaSense,主要为国防情报机构、司法机构、金融机构和医疗保健组织提供服务。和AlphaSense不同的是,DR利用人的书面和口语形式的沟通交流数据,来挖掘有价值的信息,也就是Human-centric Insights,为客户找到潜在的风险或者机会。更具体地形式是对各类实体,比如人、地点,和他们之间的关系进行建模和挖掘。

Insight Engines

《NLP创业公司概览》

  • 成立时间:2015
  • 地点:美国旧金山
  • 员工数:11-50
  • 融资情况:A轮
  • 总融资额:15.8M美元
  • 网址:https://insightengines.com/

这家公司的业务面向企业客户,提供智能搜索助手(Insight Engines也称之为natural language search engine)。有点类似QA系统,用户以自然语言形式的问题作为输入,该系统以客户公司内部数据(machine generated data)作为搜索源,将处理得到的答案返回给用户(不仅仅是文本答案,还包括图表之类的可视化展示)。通过这种方式,来提高企业客户分析海量数据的效率。官网给出了该产品的介绍视频

《NLP创业公司概览》
《NLP创业公司概览》

Kasisto

《NLP创业公司概览》

  • 成立时间:2013
  • 地点:美国纽约
  • 员工数:51-100
  • 融资情况:B轮
  • 总融资额:28.5M美元
  • 网址:https://kasisto.com/

Kasisto为金融领域的客户提供一个名为KAI的AI对话平台(主要为银行及其客户提供服务)。该Bot可以对个人的支付、交易及个人财务进行管理。Bot在交流过程中可以处理非正式用语、话题快速转变以及打断等情况。官网首页有demo示例。

《NLP创业公司概览》
《NLP创业公司概览》

Kyndi

《NLP创业公司概览》

  • 成立时间:2014.6.5
  • 地点:美国加州
  • 员工数:11-50
  • 融资情况:B轮
  • 总融资额:9.6M美元
  • 网址:https://kyndi.com/

Kyndi旨在为政府部门、金融机构和医疗保健机构搭建可解释的AI平台,辅助上述机构人员进行决策。Kyndi指出可解释性是他们产品和解决方案的核心。Kyndi也顺便怼了一把DL,DL是个黑盒子,不能用于上述等受管辖行业。因为这些组织的任何决策必须是可解释的。不过,他们应该说的是,这个最终的决策是可解释或者可理解的。因为他们自己也提到,利用NLP来做词性标注,语法树生成,命名实体识别,语义相似度计算还有关系抽取,然后用知识图谱将这些数据组织起来,所以,按照现在NLP的发展趋势,肯定是绕不开DL的。

Mobvoi(出门问问)

《NLP创业公司概览》

出门问问融资快赶上之前介绍的公司的总和(CB Insights 两次上榜)。出门问问主要以语音交互为主,是个软硬结合的公司。它的实体产品包括智能手表、智能耳机、智能后视镜、智能音箱等。出门问问的核心技术涉及高识别率的中文ASR,语义分析、垂直搜索、语音合成。虽说是谷歌大佬直接投资的公司,但不知道产品到底怎么样,貌似还和小米有合作。

mya

《NLP创业公司概览》

  • 成立时间:2011
  • 地点:美国旧金山
  • 员工数:11-50
  • 融资情况:B轮
  • 总融资额:32.4M美元
  • 网址:https://hiremya.com/

mya的业务是利用对话AI来帮助企业进行招聘工作。通过匹配和预测模型从海量候选人中进行筛选,自动地安排面试,让招聘人员优先面试最可能成功的候选人。mya系统通过语义解析、命名实体识别和多意图分类来从候选人对话中获取有意义的信息,并利用动态对话管理技术来维护对话过程或者引导对话。mya的解决方案提升了企业招聘的效率。

Narrative Science

《NLP创业公司概览》

这家公司比较意思,为企业提供NLG服务,简直“企如其名”(CB Insights 两次上榜)。具体来说,就是通过对多源数据进行分析,找到有价值和意义的信息,然后将其转为人类可理解的书面语言。单纯从技术上而言,有点类似多文档摘要。但核心问题是如何抽取用户关心的信息,并以流畅的语言正确传递这些信息。

Snips

《NLP创业公司概览》

  • 成立时间:2013
  • 地点:法国巴黎
  • 员工数:51-100
  • 总融资额:24.7M美元
  • 网址:https://snips.ai/

Snips为客户提供可运行于各种设备及各种平台上的语音助手。该语音助手完全是在本地运行(不需要网络连接),没有服务器(用户数据都在本地)。也就是说,Snips提供语音助手SDK,其支持语音或文本自然语言查询、鲁棒的查询理解,也包含多种语言下多领域预训练模型。个人觉得就是智能音箱的定制化解决方案了,很多特性是用你自己的数据进行训练,按照他们的说法,也不会收集你的数据。所以,技术涉及比较广,整个流程,包含从个性化唤醒词(Wake Word),ASR,NLU,到TTS等等。CB Insights在报告中收录这个公司的时候,他们一共有41个人,其中18个人搞机器学习,14个人负责工程实现。

《NLP创业公司概览》https://www.zhihu.com/video/1060497701027876864

Textio

《NLP创业公司概览》

  • 成立时间:2014.9.25
  • 地点:美国西雅图
  • 员工数:51-100
  • 融资情况:B轮
  • 总融资额:29.5M美元
  • 网址:https://textio.com/

这家公司的业务一个词就可以总结了:Polish。再具体一点就是polish your writing。Textio为客户提供文笔润色的服务(CB Insights 两次上榜)。有点类似Grammarly,不过Grammarly的功能主要是指出文章中的语法问题。Textio目前主要关注招聘领域,和上面介绍的mya一样。简单来说,就是帮助企业调整JD内容,以吸引更多符合要求的应聘者。单是这么细分的一个业务就能融到近三千万美金。。。真是。。。很有想象空间了。。

《NLP创业公司概览》
《NLP创业公司概览》

Twiggle

《NLP创业公司概览》

  • 成立时间:2014
  • 地点:以色列特拉维夫
  • 员工数:11-50
  • 融资情况:B轮
  • 总融资额:35M美元
  • 网址:https://twiggle.com/

Twiggle利用ML、NLP、Data Mining等技术为电商所面临的一些重大挑战提供解决方案。Twiggle旨在改变人们搜索商品和购物的方式。看了一下官网的demo,他们能够支持用户以自然语言的方式,在多个维度下进行搜索,比如“500块以下的带有长袖的黑色短裙”。个人觉得,相对于语义解析,难点更多在于如何构建健全的商品属性信息,以及怎么把语义元素和商品属性元素进行更好的匹配。根据Twiggle发布的高级NLP工程师招聘JD,发现他们的系统是由知识图谱来进行支撑。其实也比较好理解,在电商垂直领域,天然地适合用KG来进行商品建模和管理。淘宝也有自己的商品知识图谱,我随手在淘宝试了一下,搜索“500块以下的带有长袖的黑色短裙”,根据搜索结果来看,淘宝貌似是支持这种搜索模式的。我又试着搜索“男的穿的,800块以下的,白色大码羽绒服”,返回“没有找到相关宝贝”,但列出了与查询所包含的关键词相关的一些商品。虽然不知道淘宝到底有没有利用类似Twiggle的技术,但个人认为这是一个很好的探索方向。毕竟淘宝的商品知识图谱已经建立起来了,通过语义解析和商品匹配等手段,为消费者提供更细致化的商品搜索服务,让消费者高效率地剁手,何乐而不为呢?

将上述公司按照业务领域进行分类:

  • 跨行业应用:AlphaSense、Narrative Science、出门问问、Kyndi、Insight Engines、http://Cortical.io、Digital Reasoning、Snips
  • 销售:Automat、Chorus
  • 医疗健康:CloudMedx
  • 金融科技:Kasisto
  • 人力资源技术:mya、Textio
  • 商业:Twiggle

必须承认,这次调研十分粗略,数据来源局限于CB Insights的年度报告。不过考虑到很多媒体都引用CB Insights的报告,那么我就假设上榜的企业具有相当的代表性,可以在一定程度上反映NLP工业落地的现状和趋势。另外,这次调研并没有覆盖CB Insights报告中所有NLP相关的企业,一方面,我筛选的方式比较粗暴(直接看介绍是否包含language关键词,再排除),并没有细看所有上榜的企业;另一方面,上面罗列的企业大致能概括NLP落地的场景和领域。

上面2/3(10/15)的公司是在2012年后成立的,整体比较符合DL发展的趋势。新技术的出现、成熟必定会催生出一批企业。2012年之前成立的企业,尤其是2000年成立的Digital Reasoning,也许侧面反映了行业的真实需求,并不是由于AI的热潮,大家一拍脑袋,没有需求创造需求也要上,而是市场本身存在这样的需求或者说行业痛点。当然,我也不是说后面新生的业务是扯蛋。受限于技术,以前很多场景不能被满足,但随着技术的发展和成熟,诞生新的业务也很正常,这也是开拓者干的事。至于效果到底如何,只有交给时间来检验了。

最后提一句,Crunchbase这个网站确实好用,企业的基本信息全不说,还能通过关键词来搜索公司。比如,你可以指定NLP来查找相关企业。不过这是高级功能,要会员才能用,348刀一年。如果想比较全面地了解一个行业,或者某种技术的落地情况,这应该是个不错的工具。

    原文作者:SimmerChan
    原文地址: https://zhuanlan.zhihu.com/p/53123946
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞