close
当前位置: SmartTimes > 硬科技 > 新闻 >

借助PowerVR Series3NX在嵌入式AI中将小麦从谷壳中分离出来

隆重介绍PowerVR Series3NX

在半导体IP领域,事情发展很快,我们屡获殊荣的 PowerVR Series2NX神经网络加速器(或我们称之为NNA)已经有了后继产品– PowerVR Series3NX。这在其前身产品上进行了多项改进,在同类产品领先的硅片领域提供了更高的性能和新功能。

欢迎来到真实的世界

在深入研究其改进之前,让我们提醒自己一些嵌入式AI所提供的令人难以置信的用途以及它如何影响我们的世界。人工智能将触及几乎所有可能的市场,从物联网,消费者,汽车到移动设备,工业,安全和农业:深度学习和神经网络的力量将增强和彻底改变人工智能。 
无人驾驶汽车是当今最广泛认可的计算机视觉用例之一。让汽车在那里“看”多种技术可供选择,例如雷达,激光雷达,红外,热成像和基于CCD的相机,由于后者往往是最便宜的选择,因此大多数自动驾驶汽车可能都配备了许多技术。但是,“看”不是问题,更具挑战性的是“理解”。无论使用哪种技术,都会有多个数据点进入,因此使用神经网络进行传感器融合将成为一个重要领域,这一领域将在明年变得越来越重要。
许多大型公司,包括技术巨头和传统汽车公司,都在致力于解决无人驾驶汽车问题,但是像MIT这样的名为iSee的MIT衍生公司这样的小型初创公司也正在努力。《技术评论》将其描述为“取得了惊人的进步……多亏了深度学习,这项技术采用了庞大的数据密集型神经网络。”
自动驾驶汽车不仅仅局限于道路。机器学习算法已在农业中广泛使用,它使大型机器人联合收割机能够在割下小麦时进行分析(从字面上将小麦与谷壳分离),并使用计算机视觉仅将除草剂喷洒在杂草而非农作物上,从而使过程更加高效,更环保,更具成本效益。
在现场联合收割机
然后还有更多左领域的例子,例如我最近遇到的这两个例子,它们都属于“计算机视觉”的范畴。第一个是3D视觉系统,使农民能够监控猪只以防止“咬尾”事件。令人不愉快的是,似乎有时猪在没有任何警告的情况下咬住其他猪的尾巴,这不仅可能使他们非常痛苦,还会引起感染,从而使肉变质,并给农民造成经济损失。通过分析猪的行为,视觉系统可以快速检测并潜在地预防这些事件的发生。
另一个例子是研究人员创造了可以从宜家组装椅子的机器人手臂(大概他们可以忽略这些说明,因此他们甚至不必担心它们没有意义)。好的,我们现在还不能肯定地知道我们现在可以为我们提供机器人管家服务,但是这是朝着正确方向迈出的一步,因此我们会采取行动。
当然,嵌入式设备中神经网络还有很多其他用例,例如用于移动或智能相机的面部识别,用于电视的手势识别和图像增强(尤其是通过放大),其中必须仅根据图像的细节来添加细节。现有像素信息。
所有这些用例所需要的是神经网络的快速,高效的硬件加速。

推出PowerVR Series3NX:我们的下一代神经网络加速器

PowerVR Series3NX是我们专用于神经网络推理的专用硬件设计的最新版本–例如,基于已经受过训练以识别特定事物的模型来加速推理。借助我们的专业工具和API生态系统,我们可以使它们在我们的专用硬件上最佳运行。
PowerVR Series3NX具有三个主要亮点:
  • 五个新的单核
  • 改进的功率,性能和面积
  • 新功能
我们的上一代设计PowerVR Series2NX包含两个内核;第二个内核是PowerVR Series2NX。小型PowerVR AX2145提供每秒1 TB的性能(TOPS),大型PowerVR AX2185提供4.1 TOPS的性能。相比之下,新型PowerVR AX3145提供1.2 TOPS的性能,而PowerVR AX3385具有5 TOPS的性能–至关重要的是,两者均在比上一代产品更小的硅片面积上实现,这意味着降低了功耗并降低了SoC制造商的成本。
从下图可以看出,该产品还随附PowerVR AX3125,这是一种非常小的内核,提供0.6 TOPS的功率,在这种情况下,最小的面积是至关重要的,低功耗是重中之重,例如电池供电或能源收集物联网应用。例如,通过打开和关闭门所产生的动能足以打开相机,拍摄快照并在本地进行推理-无需更换电池或提供电源。
PowerVR AX3595可提供令人印象深刻的10 TOPS,而在2.4 TOPS时,PowerVR AX3365可在性能和面积之间取得平衡。
总体而言,与上一代产品相比,PowerVR Series3NX能够以更少的成本提供更多的功能,并且在同一区域内的功耗降低了40%,每秒推理量增加了40%。

保持体重减轻

在神经网络中,“权重”确定特定功能对创建输出的贡献。这些权重占网络将在内存中占据多少空间的很大一部分,而对于PowerVR Series3NX,我们增加了无损权重压缩。这种压缩减少了需要存储并通过系统内存的网络模型的大小,这意味着Series3NX的总体带宽比Series2NX降低了35%,非常有用,可在SoC中节省更多功率。
所有这些都是在已经通过在每层基础上支持灵活的位深度来节省带宽的体系结构之上的,这使得可以以更低的位精度运行,同时保持推理精度,从而提供相对较小的网络模型。

大规模神经网络

尽管PowerVR AX3595在单个内核中提供了令人印象深刻的10 TOPS,但在某些用例中,需要非常高的性能。通过使用四个多核产品,PowerVR Series3NX现在可以扩展到提供20、40、80甚至160 TOPS。这些提供了大大提高的性能,但仍针对功耗受限的嵌入式设备进行了优化。
因此,PowerVR Series3NX通过满足自动驾驶等应用程序的极高计算需求,实现了真正的下一代AI功能。

安全又可靠

PowerVR Series3NX还带来了新的安全功能,例如对行业标准安全模型的支持。这些提供四种不同的配置:
  1. Unsecured:在没有任何开销的情况下实现最快的性能。
  2. 受保护的模型:当将具有重大商业价值的经过训练的模型加载到NNA(例如在安全摄像机中)时,模型,权重和中间数据将得到保护。
  3. 受保护的内容:输入,输出和中间数据均受保护,当视频需要具有DRM以确保其不被盗时(例如在机顶盒中),这是必需的
  4. 完全安全:模型,权重,中间数据,输入数据和输出数据均受到保护,例如针对人脸验证应用程序或与付款相关的应用程序。

可编程的可扩展性:介绍PowerVR Series3NX-F(灵活)

人工智能目前是技术行业中最热门的流行语。因此,机器学习和神经网络的发展迅速。为了提供体系结构的可扩展性并确保最新模型和层可以有效运行,我们引入了PowerVR Series3NX-F。它结合了Series3NX和高度神经网络计算优化的GPGPU;或者,如果需要的话,也可以是神经网络处理单元(NNPU)。两者共享RAM,并通过
这种双重用途的体系结构使神经网络层可以在单个芯片上运行,而不必依赖CPU,从而最大程度地降低了性能瓶颈,并使CPU完全可用于其余SoC操作。
由于NNPU基于我们的Rogue架构,它使开发人员可以使用基于这种成熟设计的现有生态系统来构建应用程序,并使用大量工具和API进行基于计算的编程。该设计还为SoC制造商的客户提供了在其产品上增加差异点的能力,因为可以运行用OpenCL编写的任何内容。

计算SDK

但是,故事并没有就此结束。今年晚些时候,我们将推出一个全新的Compute SDK,将开发人员所需要的一切整合在一起,以创建他们的神经网络应用程序并将其移植到PowerVR Series 3NX –并将包括对SYCL的支持。
SYCL是Khronos组规范,旨在用于异构计算。这使开发人员可以使用C ++对OpenCL或神经网络特定的API支持的任何设备进行编程。Imagination已将每个SYCL库函数映射到我们专有的IMG DNN API,从而为整个行业提供了非专有的开放标准编程环境。
它的优点在于,它是免版税的跨平台抽象层,使SoC制造商能够使用最广为人知的编程语言为开发人员释放其硬件的潜力。这意味着可以将流行的神经网络框架(例如TensorFlow)本地编译为Imagination的PowerVR Series3NX硬件。
Imagination继续与基于爱丁堡的软件工具开发商Codeplay合作,以实现这一目标。

全面的解决方案

PowerVR Series3NX是我们成功的Series2NX的有力后续产品;一种优化的硬件解决方案,可运行具有最佳性能的神经网络。凭借五个新内核,它使SoC设计人员能够通过单个内核解决方案实现从0.6到10 TOPS的一系列性能目标,而新的多核产品意味着它可以提供高达160 TOPS的性能。
除此之外,PowerVR Series3NX-F还迎合了可能在市场上崭露头角的新模型和新层,增加了体系结构的可扩展性,并为SoC制造商提供了一个与众不同的地方。一切都证明,在为SoC选择神经网络加速器或以开发为目标时,将小麦与谷壳分开是值得的。

(责任编辑:ioter)

用户喜欢...

Oppo Reno Z评论–运作中的PowerVR Series9XM

Oppo不仅在中国而且在全球范围内都成为领先品牌之一,在2019年第二季度占有9%的市场份额。它通过提供具有有趣设计和扎实功能集的手机而实现了这一目标Oppo Reno Z也不例外。当然,我们在它...


平衡PowerVR硬件上的GPU工作负载

如果您从一开始就一直关注此系列文章,那么您现在可能已经知道了练习。我们有一个新的文档网站,其中充满了对所有知识水平的开发人员有用的提示和技巧。对于新手和有经验的开发人员来...