最近一直在思考这个问题,人工智能接下来的几年会有什么样的发展,是否真的能够在很多工作岗位上取代人类?抑或只是和人类“和谐相处”。
本文基于作者个人的经验与知识水平,从一个人工智能从业者的角度,来聊一聊技术,体验和场景,产业发展和生态等方面聊一聊,人工智能将会有什么样的发展趋势。
一.产业和生态
1. 软硬结合
互联网时代,大家做的基本都是一件事:连接。百度做了人和信息的连接,阿里做了人和商品的连接,腾讯做了人和人的连接。新时代,人和物,物和物的连接会成为一个趋势,物联网和人工智能将会紧密融合。
更多的智能硬件,智能芯片将会走进人们的生活,相互连接。但是并不是我们现在看到的这些所谓的智能家居,只是简简单单做了个手机操控的功能而已。人工智能时代的智能硬件可以直接成为和用户交互的终端,智能芯片能够为智能终端提供离线的快速响应的大脑,这是端的智能。同时,云端的人工智能大脑为整个系统提供综合的影响和指导,这是云的智能。云+端的融合,物联网+人工智能形成一个真正的“智联网”。
2.云计算
云计算已经火了几年了,但是人工智能将会赋予云计算新的生命。新时代,云计算+大数据+人工智能将会组成一组强大的“三巨头”。曾有人说:云计算重新定义了IT,大数据重新定义了资产,而人工智能重新定义了效率。仔细想想不无道理。
互联网催生了大数据,而大数据催生了人工智能。对于更多的行业和领域,触及这些最新技术的最快最好的方式就是云计算,用最近流行的说法就是:各行各业能够得到人工智能赋能,并提升自身效率的最便捷的方式就是通过云。同时,人工智能能够帮助云计算公司从标准化的“设备”竞争,过渡到更多差异化个性化的服务和解决方案的竞争。也能够为形成数据闭环提供基础。
3.数据闭环
云计算解决了大量存储的需求,而这些存储的大数据再结合云计算的强大计算能力,可以根据需求和场景训练出强大的人工智能模型,这些训练的模型可以通过云计算的方式赋能更多的场景。同时,这些被赋能的场景产生的数据又会回流到云端,对模型的优化和自学习提供帮助。
二.场景和体验
1.多模态交互
根据梅拉比安的沟通模型,沟通 = 说话内容(7%)+语气语调(38%)+肢体语言及表情(55%)。包含了语音,文字和图像。
未来人机交互会更加倾向于多模态,语音,语义,图像,动作等等融合,甚至会有脑机接口等更高层次的信息传输方式。一是能够让用户有更自然的体验,同时也能够大大加速机器人的从感知到认知,真正的全方面的理解人类的意图,给出最好的交互。
2.封闭到开放
在封闭的场景内,人工智能已经能取得一定的成果了,例如封闭领域的客服机器人,能够回答出用户很多业务相关的问题,甚至能够协助用户完成部分相对复杂的任务,如退货换货。
但是在开放的领域,他依然是个小婴儿。开放领域对数据的积累,对模型的训练,对场景的切换,都有着极高的要求。是一个长期的工程。
三.技术方面
1.增强学习
深度学习让人工智能最近又焕发新生,但是当前的深度学习还是需要大量的优质数据为基础的监督学习为主,需要投入大量的人工。
而增强学习则是一个方向,尤其是在一些边界明确,规则清晰的任务中,机器人可以自己去尝试着完成任务,完成了给奖励,失败了则给惩罚,慢慢他就会自己学会完成任务。而最新版本的AlphaGo Zero正是运用了深度学习的方法,从而可以完全抛弃掉对大量现存数据的依赖。
2.迁移学习
从某个层面上来说,现阶段人工智能商业化的最大阻碍不是算法而是数据,缺乏优质的数据使得很多产品即使在相对封闭的场景下也很难有优异的表现。数据的最大问题则是需要投入大量的人力,比如你用大量数据训练了一个人脸识别的模型,现在要做一个猪脸识别的应用,之前的数据就全都没用了,模型也要重新训练。能够举一反三是在认知领域人和机器的最大区别了,现实的世界有时候规则并不明确,需要根据总结的经验来适应相对陌生的环境。
而一旦机器拥有了迁移学习的能力,相似领域的工作将可以被复用,可以快速针对全新的领域开发出新的产品。这也正好映照了上文提到的从封闭到开放的趋势。