算力利用率超90%!地平线推二代边缘芯片,详解AIoT落地综合打法
智东西(公众号:zhidxcom)
文 | 心缘
2019年,国内AI芯片玩家正围绕落地展开新一轮的冲刺。
一边是华为、百度、阿里等科技巨头和几家独角兽轮番秀出云端AI芯片新进展,另一边聚焦于边缘与终端的多家AI芯片创企陆续登场,揭开其第一代或者最新一代芯片的神秘面纱。
与此同时,人们评判AI芯片的标准,也由看算力、功耗等硬指标,转向看量产规模、看客户、看生态。
这不,国内AI芯片落地的排头兵地平线,刚刚亮出新剑!
今天上午,地平线推出第二代边缘AI芯片旭日二代和一站式全场景边缘AI芯片解决方案。其芯片等效算力达4Tops,典型功耗为2W,算力利用率超过90%,如果配合高效算法,在同等TOPS下可处理的帧数比GPU的10倍还多。
据悉,旭日一代已服务数百家客户,营收数亿,交付数十万套方案。
在此之前,地平线已经创造了多个记录:中国第一家AI芯片创企、发布中国首款边缘AI芯片、征程芯片登陆美国助力国际顶尖Robotaxi车队、旭日一代落地首年全球出货量达六位数、发布中国首款车规级AI芯片。今年3月,地平线宣布完成B轮6亿美元融资,估值达30亿美元,成为全球估值最高的AI芯片独角兽。
经过4年的积累,地平线在AIoT领域已经形成一套独特的打法。除了推出新品之外,今日地平线还聚焦于其AIoT产品的整体布局,展示其在芯片、整体方案、开放生态体系、落地能力等方面的核心优势,并公布其AIoT系列芯片的路线图。
AIoT时代面临哪些核心挑战?为什么今年AI芯片企业的势头有所衰减?如何在碎片化的AIoT市场中构筑竞争壁垒?会后,地平线联合创始人、技术副总裁黄畅,地平线副总裁、智能物联芯片方案产品线总经理张永谦,接受智东西等媒体的采访,就这些问题一一分享了他们的见解。
一、旭日二代:算力达 4Tops , 算力利用率超90%
旭日二代边缘AI芯片(以下简称“旭日二代”)面向智能物联网,具备强大的视频结构化能力,可对多类目标进行实施检测和精准识别,今年3月已完成流片,接近量产阶段。
该芯片采用台积电28nm工艺,面积不过14mm x 14mm,内置双核A53处理器和两个基于地平线第二代BPU架构(伯努利架构)的BPU。
BPU架构由地平线基于AI算法实际场景需求设计而成,以最大程度提升算力的有效利用率,同时保障芯片的前瞻性、迭代延续性。
旭日二代的等效算力达4Tops,典型功耗为2W,单路可实时处理4K@30fps,4路可实时处理1080P@30fps。地平线联合创始人、技术副总裁黄畅强调说,该芯片典型算法模型算力利用率超过90%,这在业界几乎是绝无仅有的。
如果配合高效算法,每TOPS算力可处理的帧数将高于标称4Tops算力的AI芯片,比同等算力GPU处理帧数的10倍还多。
在旭日二代上的实际测试结果表明,分类模型 MobileNet V2的运行速度超过每秒700张图片,检测模型Yolo V3的运行速度超过每秒40张图片。
针对物联网场景下的主要目标群体“人”和“车”,旭日二代进行了大量的算法优化,在边缘端即可实现全视频结构化能力,可高效灵活地处理多类AI任务,包括10~30万人前端识别,密集人群时空属性行为分析,多种非机动车、机动车检测分类。
前期客户验证表明,旭日二代可完全满足商业、办公、社区、园区、教育等物联网场景需求。
以通行门禁考勤方案为例,相较旭日一代,旭日二代芯片方案可将最大人脸库容从最快200ms提升至100ms,并由原本只支持安卓系统进化为支持安卓/Linux系统。
目前,旭日二代支持MXNet和TensorFlow框架,预计明年年初支持PyTorch。
黄畅向智东西介绍,地平线围绕其核心BPU定义一套自己的指令集,随着指令集的扩充,未来旭日芯片还将支持更多框架。
现场黄畅还透露了旭日系列芯片的路线图,旭日三代将于大约一年后推出,作为完整SoC方案,提供多种算力配置和多Camera输入支持,更好地整合多路的视频接入、视频处理、ISP、视频编辑码压缩等技术。
▲旭日系列芯片Roadmap
二、解读地平线 AIoT五大 优势
相比传统芯片大厂,地平线拥有更加开放的生态体系,落地能力也更加灵活高效,能大幅提升开发效率,并确保客户投资安全性。
总体来看,地平线AIoT有五方面的优势。
1 、软硬协同输出 极致效能
地平线率先提出,将世界领先的深度学习算法集成在自主研发的边缘AI处理器及平台上,通过软硬协同的方式将发挥效能优势发挥到极致。
经典芯片性能评估方式是PPA(功耗Power、性能Performance、面积Area),AI芯片真实性能常用Tops/W与Tops来呈现。
而黄畅认为,此类评估方式并不完全准确,AI芯片的真实性能应是能效、利用率、算法能力的乘积。这意味着不仅要对芯片和算法进行优化,还要对连接两者的编译器等中间环节进行优化,最终达成全面的优化。
以编译器优化所带来的利用率提升为例,即便有架构自动优化,有编译器相比没编译器的情况,单帧带宽消耗可从每帧141.9MB降到每帧34.4MB,单帧计算延迟可从43.77毫秒降到25.1毫秒,而计算资源利用率可从57%提升到95%。
黄畅介绍说,地平线充分考虑到未来重要应用场景的关键算法的计算特性,对趋势进行预判,前瞻性地将计算特点融入到计算架构设计中,使AI芯片随着芯片演进趋势,能始终保持相当高的有效利用率,从而真正意义上受益于算法创新带来的优势。
2 、完整的方案能力
地平线拥有丰富的算法样例模型,能够为客户提供以芯片+算法+工具链为核心的完整方案,满足多样化场景需求。
地平线提供完整开放的旭日芯片解决方案及“天工开物”芯片工具链,包括丰富的模型和应用示例、可视化性能分析工具、可快速上手的BPU API、高度灵活的HR Runtime API和Platform API,供客户根据需求选择。
这些工具链可提供可视化调试调优工具,协助开发者快速分析定位问题,还提供丰富的例子、文档,支持客户快速产品落地。
3 、开放的生态体系
基于边缘AI芯片,地平线致力于打造一个多层次、多维度、多样性的开放生态体系。
▲地平线开放赋能生态体系
在产业链赋能方面,地平线坚持底层技术能力研发,加速普惠AI时代到来;在开发者生态方面, 地平线通过工具链服务降低开发者门槛,助力上层应用产生,以此丰富整个AIoT应用生态。
此外, 地平线也正通过与行业开放社区合作的形式降低开发者门槛,比如地平线加入96Boards社区,并在前段时间,推出基于96Boards SOM规范的边缘AI开发套件BOOTPRINTX2,该套件具有高算力、高效能、感知接口丰富、可扩展的特点。
4 、 落地能力比同类型产品更灵活高效
地平线主打软硬协同,其芯片具有高MAC利用率,实际任务处理表现更好。
其芯片方案支持新模型优化,如 MobileNet、Faster RCNN。同等算力下,X2 在MobileNetV2之类的新模型上,比海思高端芯片(4Tops 算力)有更好的表现,实际性能更强,且功耗、成本更低。
另外,海思只支持Caffe,而地平线还支持更主流的训练框架TensorFlow。比如科达选择地平线很大程度上源于旭日二代芯片支持TensorFlow。
5 、在设备投入和运维上降低 成本
得益于边缘计算具有高度可靠、实时处理、灵活部署等特性,地平线可在两方面帮助客户降低成本。
一是设备投入,无需购置大型服务器或占用较大宽带网络。
二是设备运维,进行日常维护,更新迭代方便。
三、一站式全场景边缘 AI 芯片解决方案
随后,地平线副总裁、智能物联芯片方案产品线总经理张永谦发布旭日二代AI芯片及解决方案Horizon Hero,包括三类边缘AI芯片解决方案:地平线HeroSights智能摄像机解决方案、地平线HeroSpark通行门禁考勤方案、地平线HeroStream智能分析盒解决方案。
张永谦提到,AIoT产品化存在五点挑战:
(1)开发多种形态AI产品,满足不同场景需求;
(2)最好的智能与图像场景效果;
(3)快速开发上层智能应用;
(4)快速完成硬件设计;
(5)快速完成系统级整合。
针对这些挑战,地平线将解决方案从芯片、基础算法上推,使得客户可以更快、以更小投入、最低成本去快速完成产品化。相较于市场上的AI方案,Hero在以下方面拥有明显的落地优势:
1、边缘计算:本地端即可完成计算,数据无需上传到云端;
2、软硬结合:算法与芯片协同优化,使方案兼具高性能、低功耗特点;
3、端边结合:方案覆盖智能摄像机,面板机以及智能分析盒;
4、全场景一站式方案:完整解决方案支持客户快速应用开发和量产。
图像搭配语音,从像素级感知到时空语义建模,以“人”为本的Horizon Hero AI全场景能力集的全场景能力正在快速形成。
软件方面,地平线有非常强大的智能算法团队,提供了从最底层像素级的、最基础的原子的智能化处理,到语音识别、身份识别、人体属性分析,再到对人体感知时空的分析,有一整套完整的算法能力集。
针对客户不同的应用,地平线在算法集合的基础之上,还提供算法策略能力集,以缩短产品开发时间。
为了使客户能够快速地开发应用,地平线打造了端边一体AI嵌入式软件架构,只要在端的模块上加上算法配置和通道管理模块,就可以迅速形成边缘侧的软件架构。
其软件框架跨OS、AI全场景、模块化组件开发框架既支持安卓,也支持Linux,客户可在常用的几类端设备和边缘设备上快速集成他们的应用,这些应用也都具有很强的可复制性、可迁移性。
硬件方面,地平线提供完整硬件交付与参考设计,包括芯片、套件以及标准主板,同时地平线也提供完整的原理图和PCB Layout的设计。
地平线的芯片既单独向外销售,也通过整体解决方案的方式对外供给。如果客户想选择更熟悉的元器件,地平线也可以帮助他们在元器件上做整合和集成。
地平线还会提供整机智能效果集成支撑能力,包括模块化参考设计、结构与散热设计、原型机重现等。
这是因为光有核心设计仍不够,整体方案的效果还与光照、距离等外部因素有关,针对不同场景,地平线会提供多套不同的产品设计,并为客户集成各种他们需要的模块。
目前,地平线面向平安城市、智慧社区、智慧办公、智慧园区、智慧校园、智慧商业等六大行业提供解决方案。
四、数百家合作伙伴,营收数亿
据张永谦介绍,截至目前,旭日一代芯片已服务数百家客户,营收数亿,交付数十万套方案,实现线下场景服务数千万人口。
▲地平线在 AIoT 领域部分可公开合作伙伴
在地平线商业化加速过程中,有商米、多度、小米、永辉等许多优质客户落地案例。
智慧零售方面,基于地平线针对零售场景的AIoT芯片解决方案,商米推出了AI识客摄像机,可在本地端主动识别进店顾客并进行丰富的属性鉴别,解决商家“看店难”问题,助力精准营销。
智慧社区方面,基于“AI芯片+算法”的一站式AIoT解决方案,地平线与多度联合打造了智慧社区AI智能产品及解决方案。
除了视觉外,地平线在语音领域也有颇多建树,能提供包含麦克风阵列、信号处理、唤醒、语义理解、语音识别、语音合成的全链路解决方案。其语音方案在国内已拿下多个大单。
例如,智能家居方面,地平线为小米一系列语音交互智能设备,提供自主研发的增强语音抽取(Enhanced Speech Extraction,简称 ESE)方案,使得小米音箱在复杂的噪声环境中亦可实现随时打断、随时唤醒,交互体验更为精准、流畅。
地平线的方案将各个环节算法和芯片架构充分结合,通过端云结合,能在端侧更好地解决复杂场景中的语音处理问题。黄畅相信,很快地平线就可以在端上,拿出一个和服务器能够做到的性能相媲美的整套云链路,并将进一步在语音处理与视觉融合上发力。
五、AIoT应关注两个闭环,拼落地需要综合打法
会后,地平线联合创始人、副总裁黄畅,地平线副总裁、智能物联芯片方案产品线总经理张永谦,接受智东西等媒体的采访。
▲地平线副总裁、智能物联芯片方案产品线总经理张永谦(左),地平线联合创始人、副总裁黄畅(右)
在采访期间,黄畅和张永谦还多次强调,地平线不是单纯的芯片公司,而是通过“芯片+算法”的模式以挖掘更好的性能。相比其他方案,旭日二代芯片整个解决方案的价值最大化在于软件,芯片是技术能力中的重要基石,而在AIoT长尾应用领域的核心成本也是算法。
1、AIoT面临的两大挑战
谈及AIoT的挑战,黄畅认为,我们应该关注两个闭环,一是业务闭环,二是数据闭环。
在AIoT领域赋能传统行业时,很多困境来自缺乏开放性,对自我认知不足,对边界判定不清晰,导致各方无法专注于自身核心能力的打造。如果不能有效地构成业务闭环,就无法让信息进行流动联通。
数据闭环的难处来自于跨行业。传统行业往往很难将与业务场景强相关的数据分享出来,因此对于地平线这样关注基础AI能力建设的公司来说,能否持续去获取真实场景中的数据,经过不断迭代形成一个感知平台,广泛赋能各个业务场景中的一些基础AI任务,这个能力本身也非常重要。
2、真正落地需要一套综合打法
另外,今年的安防展中,AI芯片厂商身影似乎要比往年少。对于这一现象,黄畅并不觉得奇怪。
在他看来,AI芯片距离真正商业化落地还很遥远,过去两年,国内涌现一批造芯热潮,但其中一部分处于PPT造芯,自然今年的声势会弱下去。如今大家更注重落地,地平线也是如此,并不仅仅关注构造一个更加开放的边缘AI计算平台,同时也非常关注面向垂直领域的一站式解决方案。
要做到真正落地需要一套综合打法,是个动态切换、调整的过程。在这个过程中,地平线始终保持较为灵活的姿态和开放的态度,和产业界进行充分合作,根据客户需求进行自我调整。
黄畅表示,相信围绕地平线的核心能力,他们能够去创造价值、提高效率,从而反过来去证明自己共性的价值。
3、多种感知融合成提升交互体验的新趋势
既然自动驾驶AI芯片和视觉AIoT芯片都已推出第二代,那么地平线是否有涉足语音AI芯片的计划?
对此,黄畅告诉智东西,初期地平线曾考虑过这一问题,后来发现传统语音终端芯片中,现有的DSP 、Arm CPU等模块已经足够好,如果延续传统的语音算法,不认为自研处理器会有优势。
地平线看到的契机是通过更高的算力去显著提升语音交互的体验,通过不断将语音算法放到新架构上,从算法层面上加以改进。另外近几年呈现多种感知算法相互借鉴融合的趋势,其语音与图像的运算、处理的方式越来越趋同。
结语:从地平线看 AIoT 芯片落地三趋势
人工智能和机器学习的爆发,给边缘计算带来了巨大的机会。而地平线选择的自动驾驶和AIoT两条主线,前者被公认为代表人们出行的未来,后者更是广泛应用于人们生活的方方面面。
如今已进入AIoT芯片拼落地的时代,从地平线身上,我们可以看到当前AIoT芯片发展的几个趋势:
1、单芯片性能不再是唯一指标,软件成提升性能的关键手段,通过软硬协同最终带来整体性能提升。
2、芯片开发的易用性更受重视,打造芯片的同时,也通过搭配工具链等方式降低开发门槛。
3、AIoT芯片正走出只秀性能的固有模式,开始同落地紧密结合,提供更方便易用的一站式解决方案。
而这些趋势指向的同一目标,都是尽可能最大程度地方便开发者及企业的需求,通过提供更加开放的赋能服务,吸引更多合作伙伴,为自身生态建设奠定基础。
相关文章
-
回家过年给我妈装了个老人桌面,差点没被撵出家门
-
大佬言论 | 马云:大道理谁都懂,企业家要想想自己的小道理
-
扣留孟晚舟 美国真正怕的是什么?
-
“套路贷”过街应人人喊打,但“分期购”等融资租赁受法律保护
-
苹果已禁止AndroidTV用户购买AppleTVApp上的内容
-
「刷新」R标,这家车企为5G「迭代再造」
-
iOS12.2显示苹果心电图已开始支持欧洲
-
青桔单车与国网什马合作,将共同运营共享电单车业务
-
钻戒未必戴,坐骑肯定骑,魔兽幽灵虎助攻新年送礼
-
超市竞赛的下半场,打败你的可能是一张excel表格|超级观点
-
从快手起诉抖音到双方互诉,短视频“江湖”对抗加剧
-
中央网信办等部门:到2023年底,IPv6技术创新和融合应用试点工作取得明显成效
-
中央网信办等12部委联合印发IPv6试点名单,哈尔滨入选综合试点城市
-
不负创新不负坚守,一站八年的《一站到底》以知识崇拜致敬时代
-
微信支付分正式上线,快来看看你多少分,包开通教程
-
美团反腐,摩拜大股东变更,陌陌用户数据泄露? | 天下网事12.4
-
刘强东回应配送员去底薪:底薪仅占薪酬总额10%左右此举为增加京东物流收入
-
BITEK硕颉一级代理分销KOYUELEC光与电子
-
STARTTLS相关漏洞影响多个邮件客户端
-
留下一代人黑历史的大头贴相机,并没有被美颜app杀死
-
华为做操作系统备用,但谷歌其实不敢将Android私有化
-
深度丨要版权保护,不要视觉中国
-
这5种二维码千万别扫,一不小心钱就没了!
-
爱奇艺Q1财报解读:营收超预期会员单季增长1200万
-
被蔡徐坤状告背后:B站的流量与盈利之殇
-
广州公共设施行业企业名录
-
苹果新闻是媒体巨头的派对还是葬礼?
-
亚马逊退出中国电商市场,这好像是意料之中的事
-
涅槃中的人人车最终能成为凤凰吗?