邓志东:细分迭代是「智能+」落地的关键
清华大学智能技术与系统国家重点实验室教授 邓志东
3月21日,己亥年人工智能春季创新大会在北京国宾酒店隆重召开,大会由人工智能产业创新联盟和赛迪传媒共同主办。会上,政府领导、企业领袖以及人工智能领域的资深专家悉数到场,围绕人工智能与实体经济深度融合展开了全面、细致的交流与研讨,各种创新观点融合交汇,为人工智能的创新应用提供了新思路、新路径。
联盟专家委主任委员、清华大学智能技术与系统国家重点实验室教授邓志东分享了关于人工智能落地应用的深层次思考。他指出,人工智能在工业、零售、医疗、客服等领域都实现了创新应用,与此同时,人工智能在实践过程中仍面临一些挑战。
大数据人工智能创新实践面临的挑战
自2013以来,大数据和大计算驱动的深度学习已成为计算机视觉、语音识别与真实感合成、自然语言处理、大数据分析等的主流方法。数据驱动方法已被视为继实验科学、理论模型、模拟仿真之后的第四科学研究范式。正如同网络技术一样,已逐渐变革为一种通用赋能工具,目前已远远超越计算机科学与技术本身的范畴。
以深度卷积神经网络为基础的新一代人工智能,能够获得更加接近于人类水平的视听觉感知能力和对文本自然语言的模式分类能力,带来了超越人类的棋类动态博弈能力。近年来,超人类水平的AlphaGo,引起了社会的强烈关注。特别是AlphaZero,带来了无需大数据且可从零开始进行自主学习的棋类通用人工智能。
对抗性神经网络的最新进展,带来了超真实感的想象能力,两个深度卷积神经网络通过相互对抗来生成超分辨率具真实感的原创图像、声音、3D物体或自然时序数据,这对半监督、无监督学习方法的研究,是一个非常重要的进展。2018年《麻省理工科技评论》把对抗性神经网络列为全球十大突破性技术之一。特别地,基于深度神经网络的目标检测、定位、分割(如语义分割、实例分割与全景分割),自2014年R-CNN问世以来,已取得了非常大的进展。目前的研究重点已超越了简单的分类识别任务,开始进一步研究动作与行为意图的检测与识别。例如,研究基于视觉深度神经网络的表情、手势、动作识别与行为意图预测等,这些都为人工智能的产业渗透带来了更多新的方向。目前,一些典型的人工智能产业应用与创新实践包括:AI刷脸支付、AI无人零售、AI摄像头、AI音箱、AI视频换脸 (虚拟主持人)、 AI速记员、 AI实时翻译耳机、AI手持翻译机、AI语音助手、AI电话客服、AI医学影像诊断、AI-IoT等。
人工智能还赋能自动驾驶的主要细分领域,包括自动驾驶的环境感知与建模、自主导航、决策规划、控制与人机交互(如智能驾驶舱)等。在这个热点产业方向,谷歌已于2018年12月5日正式推出了新的商业自动叫车运营品牌Waymo One,率先在美国凤凰城地区开启了全球首个付费自动驾驶出租车小规模商业化服务。人工智能也赋能于智能机器人产业,无论是工业机器人,还是服务机器人与特种机器人,人工智能相当于模拟机器人的大脑。机器人产业本身要模拟人的手和腿,手要灵巧地操作,腿要灵活地移动。当然,最重要的就是模拟人的大脑,靠人工智能来赋予机器人感知与认知能力。
基于深度学习的计算机视听觉感知方法,需要海量大数据的驱动,目前也缺乏认知水平的理解能力。需要解决的是,如何提供基于小样本的“数据感知+认知理解”能力?此外,在落地应用中,考虑到在开放环境下实际上是不存在完备大数据的,因此对于各种实际应用场景,大数据人工智能均只能获得较接近于人类水平的视听觉等感知能力,这与各种基于公开评测数据集得到的性能极限指标,是完全不同的。总之,就目前的深度学习算法来说,不仅缺乏人类举一反三的小样本学习能力和对目标的认知理解能力,而且不能有效利用常识与记忆,也不能进行基于知识的因果推理。
邓志东认为,中国人工智能创新实践面临挑战,一是我国人工智能技术的原始创新能力不足,基础算法、高端人工智能芯片主要还是以跟踪西方国家为主;二是投资界过于追求短线逐利;三是体制机制障碍,国有巨头型企业前瞻性战略布局不多,投入力度小,民营科技巨头在扛大旗;四是人工智能落地应用面临着诸多困难;五是缺乏高端的基础性研究人才,特别是创新能力强的人才,另外我们还需要大量的人工智能工程开发人员。
同时,他还指出,大数据人工智能的发展,也会带来法律、伦理、隐私安全和失业等方面的挑战。但对人类而言,目前的大数据人工智能总体是赋能而有益的。认知智能与通用人工智能的发展,则将对技术与产业的发展带来真正的变革,但也有可能威胁到人类自身的安全;有必要进行未雨绸缪的研究,预做准备以进行规范制约。
我国于2017年发布了《新一代人工智能发展规划》,把人工智能的发展升级为国家战略,并提出了三步走的战略目标。第三步是到2030年,中国人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。邓志东认为,成为世界主要的人工智能创新中心这个目标非常具有挑战性,目前仅有10年多一点的时间了。
党的十九大报告提出,推动互联网、大数据、人工智能和实体经济深度融合,培育新的经济增长点,形成新的转换动能。人工智能从2017年开始,已经连续三年写入了政府工作报告。在2019年总理政府工作报告中,人工智能升级为拓展“智能+”,指出要“深化大数据、人工智能等研发应用”,赋能传统制造业转型升级。力争通过新一轮科技革命,加速培育我国新兴产业集群,壮大数字与智能经济,推动产业结构变革。3月19日召开的中央全面深化改革委员会第七次会议,审议通过了《关于促进人工智能和实体经济深度融合的指导意见》,强调必须以市场需求为导向,以产业应用为目标,构建数据驱动、人机协同、跨界融合、共创分享的智能经济新形态。
在国家发展战略与产业政策的推动下,我们看到新一代人工智能的应用场景其实是非常丰富的,比如AI-IoT、5G、VR/AR、智能零售、智能安防、智能手机、智能家电、智能家居、智慧城市、智能制造(例如,零部件的外观质量检查)、自动驾驶、智能机器人、无人机等,而且还正在渗透更多的垂直应用领域。大数据人工智能将无处不在,可望替换更多依赖人类视听觉功能的服务性工种和更多需要环境适应性及自主性的复杂体力劳动。
人工智能与实体经济怎样实现融合?邓志东认为,细分迭代是“智能+”落地的关键,我国要率先努力形成世界领先的人工智能产业生态。随着人工智能的产业渗透不断加快,“智能+”产品的开发与产业发展正处于艰难的深耕期,与实体经济的深度融合方兴未艾。但人工智能的应用场景要细分,要专注于细分场景的大数据实践,有定力、有耐性地积累海量的标签大数据。另外我们还需要在应用实践中不断地进行数据、性能和体验的迭代学习。同时也需要大计算能力等人工智能公共基础设施的有力支撑。但总之,人工智能的发展最终要能给企业和社会创造价值。
“智能+”是一条条“细线”上的人工智能创新应用实践。目前的大数据人工智能创新应用产品,需要细分到特定的应用场景,进行有耐性的打磨。要敢于大胆地推广应用人工智能产品,新一代人工智能技术具有数据学习能力,用户体验可以在应用实践中不断地进行迭代升级,这一点尤其重要。归结起来,只要把每条“细线”上的人工智能落地应用都做到接近于人类水平,涓涓细流汇聚起来,就能大幅度地提高传统制造业的智能化水平。
人工智能创新应用的路径与模式
从“互联网+”到“智能+”,以市场需求为导向,以产业应用为目标,通过数据驱动和跨界融合,推动“智能+实体经济”的深度融合,助力传统制造业的转型升级以及数字经济、智能经济的发展。应以应用场景、大数据、人工智能算法和计算能力四大维度,打通产业链条,推动人工智能的创新实践和应用落地。一句话就是“大数据是基础,算法是核心,芯片是高地,人才是关键,但选定垂直细分领域最重要”。
怎么选定特定的应用场景?人工智能的落地应用,不可能是通用宽泛的,而是要选定一个特定的细分问题入手,一点一滴地开始。实际上,并非所有场景的问题都能由人工智能解决。选择的原则之一就是,能处理的特定应用场景具有较好的数字化、网络化基础,能够源源不断地产生大数据。我们要特别优选信息化基础比较好的行业或细分应用领域。
在各个垂直领域或行业,关键是对垂直领域进行细分再细分。例如,可以优选那些生产环境恶劣、产业价值高或人员稀缺的细分场景。由于目前人工智能的技术突破主要在感知智能领域,所以在各种需要高级熟练工人使用“眼睛”、“耳朵”等感知直觉完成的工作上,若人工智能通过自动学习能够达到熟练师傅“听故障”和“看瑕疵”的水平,这样就可以做到对人工的替代。
为什么说大数据是基础?“智能+”某种意义上就是“大数据+”,因为目前的人工智能就是所谓的“人工+智能”,本质上是把人的经验或直觉判断通过标签的形式转移给机器,然后赋予机器所谓的视听觉“感知智能”。前面已说过,应用落地时的开放环境下并不存在完备大数据,而且还有数据与性能的所谓“长尾效应”,也就是“行百里者半于九十”的意思,因此我们不仅必须尽可能多地积累和运用标签大数据,而且越到后面越困难,就越需要坚持。这也说明,在产业应用中亟需发展基于小样本的深度学习方法。此外,利用“人工”对数据进行清洗和做标签,包括对标签的质量审核等,催生了“标签工”这一新的工种。在应用实践中,需要建立一支工程团队,投入大量人力物力去做数据积累和数据标签,特别是建立高质量的标签大数据。基本上80%以上的人力、物力,都要投入到特定的细分问题上,去深耕应用场景和数据。按照现阶段的算法水平,还不存在一个高大上的万能方法,可以“轻松”地解决所有场景的人工智能应用。我们应以工匠精神深耕制造企业中的细分场景与大数据应用。通过“智能+”打磨人工智能产品,助推与传统制造业的深度融合及品质革命实践。以数据驱动、人机协同,通过“智能+xxx”的跨界融合,加速从基础层、核心技术层、开放平台层到应用层的人工智能产业生态建设,以我国人工智能产业和智能经济社会的快速发展,牵引驱动人工智能基础研究与前沿技术的全面进步。
为什么说算法是核心?基于深度学习的计算机视觉、机器语音、真实感数据生成、词嵌入向量等,作为人工智能算法的主要支撑,已成为“人工智能+”或“+人工智能”的产业核心共性技术,赋能产品、流程与服务体验。在探索下一代人工智能核心算法方面,亟需发展具有类似于人类举一反三小样本学习能力的人工智能算法,具体途径包括与知识图谱结合起来,尤其是与具有学习能力的知识图谱相结合。另外还须发展具有认知理解能力,具有记忆、常识和推理能力的人工智能新算法。比如发展图卷积神经网络,以“深度学习+无监督”的方式进行实体识别,结合概率图模型(知识图谱)抽象、延伸概念,赋以其内涵与外延,以实现对场景或目标的认知水平的理解。
芯片是高地。目前的人工智能芯片主要包括通用人工智能芯片,专用人工智能芯片和类脑芯片。普遍认为,工业互联网、工业物联网、5G通信、云平台和数据中心等,共同构成了大数据人工智能产业应用的硬件基础设施。
人才是关键。人工智能基础算法的创新,核心关键技术的突破,通用人工智能芯片和类脑芯片等高端人工智能芯片产品的研发,对具有原始创新能力的高端人才提出了迫切的需求。随着人工智能产业的迅猛发展,特别是人工智能对各个产业的渗透不断加快,人工智能工程技术开发人才的存量和增量存在严重不足,需求与供给的矛盾日益突出,因此必须加快我国人工智能人才高地的建设。
总之,深度学习主导的新一代人工智能已成为技术与产业的通用赋能工具和科学研究的第四范式,正在变革技术,赋能产品,渗透产业,重塑社会,加速智能经济的发展与智能社会的结构性变革。深度学习方法应用创新实践面临的重大挑战,不仅包括缺乏人类举一反三的小样本学习能力和认知水平的理解能力,而且不能有效利用常识与记忆,也不能进行基于知识的因果推理。人工智能的产品开发与产业发展正处于爆发期,与实体经济的深度融合方兴未艾。“智能+”落地,关键是应用场景的细分与实践过程的迭代。需要特别专注于细分场景的大数据实践,特别是数据、产品与性能在创新应用中的迭代。只有应用落地与用户体验做好了,给企业和社会带来了价值,才能构成正反馈迭代,人工智能技术与产业才能得到进一步的蓬勃发展。从“互联网+”到“人工智能+”,真正以市场需求为导向,以产业应用为目标,通过数据驱动和跨界融合,推动“智能+实体经济”的深度融合,促进传统产业的转型升级与数字经济、智能经济的协同发展。
以上内容,来自人工智能产业创新联盟专家委主任委员、清华大学智能技术与系统国家重点实验室教授邓志东在己亥年人工智能春季创新大会上的演讲,经整理编辑。
相关文章
-
【PW早报】微软商城恢复销售华为笔记本
-
早讯丨特斯拉空头损失惨重;腾讯加注印度市场
-
最前线|腾讯广告业务Q2面临风险,企服和云业务在逐步恢复
-
“吃鸡”没过审,拖累年报!刚刚,第十批游戏版号依旧无腾讯
-
雷军年薪近百亿;撸串研究会被取缔;美国不再要求德国禁用华为5G
-
合肥回应ApplePay交通卡落地困难:得给苹果交钱超过承受能力
-
流量造假危在旦夕,粉丝经济“永垂不朽”
-
焦点分析 | 微信改版7天后,10倍流量增长和困顿的创作者
-
钉钉发布企业拜年红包,toB端红包就该这样玩
-
女子“修了你”平台修手机,里面全是502胶水:路边摊修的
-
谷歌提高免费广告额度支持非营利机构
-
一场游戏平台商与游戏大厂的战争
-
百望云蝉联CCWResearch“用户满意度第一”大奖
-
最前线|任正非说华为要准备过苦日子,也要开始“优化”组织和员工
-
腾讯再次栽跟头!腾讯短视频“突围未果”,社交也救不了
-
昂贵苹果吞下“后悔药”,国产手机慌不慌?
-
输入法集体下架或恶意收集用户隐私信息
-
马云这话针对雷军?“风过去了,摔死的都是猪”
-
微博商业化八年,跨越山丘
-
小红书,伪装你的生活
-
百度宣战微信,正式进军社交领域
-
五年前的淘宝爆款火出国,为什么羽绒服成了最热单品?
-
年终奖将并入综合所得缴税,阿里离职女高管回应质疑
-
社交产品系列:社区类产品迭代设计
-
搜狗Q1每天进账1886万,输入法日处理6亿请求成中国最大语音App
-
智造头条|美政府罕见举动:召集构建电动车原材料供应链;高通仍想与苹果合作5G手机;腾讯为60亿美元债券定价
-
小家电战场激烈,美的类大牌VS小熊类小众,谁能取胜?
-
耀眼的贝索斯与灰暗下的亚马逊员工
-
跟谁学回应被AppStore下架:苹果用户购课价格涨30%