close
当前位置: SmartTimes > 硬科技 > 新闻 >

小芯片,更快的互连,更高的效率

大型芯片制造商正在寻求架构上的改进,例如小芯片,更快的片上和片外吞吐量,以及在每个操作或周期内集中更多的工作,以提高处理速度和效率。
总体而言,这代表了主要芯片公司的方向的重大转变。随着处理需求的大量增加以及传统方法无法提供足够的改进功能,性能和面积,所有这些方法都在挣扎。自28nm以来,缩放优势一直在减少,在某些情况下甚至早于此。同时,需要使用相同或更少的功率更快地处理从新设备,新应用中收集到的越来越多的数据,以及各地传感器的大量增加。
这对芯片制造商来说是一场完美的风暴,过去它已经利用诸如投机执行之类的方法来扩大规模化的好处。但是,已经证明投机执行会产生安全漏洞,仅缩小功能就无法再在功能和性能上提高30%到50%。今天的数字接近20%,甚至需要新的材料和结构。
同时,大型芯片制造商看到诸如Google,Amazon和Facebook等公司入侵其主要市场之一的巨型数据中心。此外,它们在AI / 机器学习市场以及边缘的众多新创公司开发专用加速器的过程中面临挑战,这些加速器有望通过架构更改而实现数量级的改善。
最大的芯片制造商开始尝试拥抱这一趋势,而不是试图与这一趋势抗衡。例如,AMD推出了其Zen 2架构,该架构依赖于由小芯片和其他芯片组成的小芯片与高速芯片到芯片互连和可调整的优先级排序方案的组合,以便数据可以更快地移动。方向或其他。
AMD客户产品首席架构师Dan Bouvier在Hot Chips会议上的一次演讲中表示,小芯片可以提高良率。但是他指出,通过使用公共互连(AMD的Infinity织物)并将所有这些组件放在基板上,小芯片也可以用于将芯片尺寸增加到大于标线片尺寸的1000mm 2。该互连还可以用于连接在不同处理节点上开发的芯片,具体取决于哪种功能最适合特定功能。

图1:AMD的小芯片架构。资料来源:AMD /热芯片
英特尔的策略也高度依赖小芯片,它使用多种方法进行连接,包括其内部开发的芯片到芯片桥(嵌入式多管芯互连桥或EMIB)。但是该公司还一直在研究内存访问和存储问题。该解决方案中的一项涉及持久性内存,这有助于弥合DRAM与固态驱动器之间的差距。
一段时间以来,英特尔一直在发售一种称为3D XPoint的持久性内存类型。英特尔基于相变内存技术,将3D XPoint设备集成到了自己的SSD和DIMM中,从而加快了这些系统的运行速度。
英特尔高级总工程师莉莉·洛伊(Lily Looi)表示:“最大的挑战之一是,您需要处理所有这些数据,但是空间有限。“过去几年中数据激增,并且有两件事发生了变化。首先,纳秒很重要,因此您需要更多的容量。第二件事是您需要一个持久功能,以便在关闭电源后数据仍然存在。但是您不必保存所有这些数据。您可能只需要保存该数据块甚至几千字节,这将大大提高效率。”

图2:在哪里存储更多的数据。资料来源:英特尔/热芯片
明智的权衡不过,
更大的芯片和更快的互连并不是获得更好性能的唯一途径。有很多旋钮需要多年重新设计。
例如,Arm引入了其Neoverse N1体系结构,该体系结构显着提高了分支预测的准确性-基本上等同于搜索中的预取。Arm还继续努力以更低的功耗完成更多工作,并采用了一个相干的网格网络将IP瓦片连接在一起,从而可以根据特定应用的需求调整处理器的大小。
Arm策略的关键是更大的2级缓存和上下文切换,Arm高级首席工程师Andrea Pellegrini表示,这比以前的方法快2.5倍。他说:“我们还发现分支机构的错误预测减少了7倍。” Arm还致力于通过降低缓存未命中率来减少其指令占用空间,Pellegrini表示已将其减少了1.4倍。同时,L2访问量下降了2.25倍。
这是查看处理器效率和每瓦性能的另一种方式。虽然大多数处理器公司都是从在相同功率预算下完成更多工作的角度来解决问题的,但其他公司却在考虑用更少的功率进行更多的工作,这在带有电池的设备中很重要。这包括智能手机,但也包括为电动汽车和机器人技术开发的芯片。
Arm还将使用其网状网络方法添加针对特定数据类型定制的第三方加速器。

图3:Arm的可定制Neoverse体系结构。资料来源:Arm / Hot Chips
同时,IBM引入了既简单又非常不同的体系结构。IBM的目标之一是对数据包何时到达进行假设,这实际上将预取概念提升到了更高的抽象水平。它正在理解如何做出如此困难的假设,因为它可以提前将使用模型有效地应用于架构。
IBM的方法是为其芯片使用最可能的配置,从而预先权衡并设置限制。IBM的电源系统硬件架构师Jeff Stuecheli表示,这使它得以整合物理层的数量,并通过PCIe Gen 4运行一些数据,而其余部分则通过25G SerDes运行。Stuecheli说:“这具有更高的功率和面积效率。” 该公司还做了类似朝着非对称架构迈进的事情,这意味着一个加速器的状态不会影响另一个加速器的运行。“我们想对加速器隐藏状态表。”

图4:IBM对数据吞吐量的重视。资料来源:IBM / Hot Chips
连接各个部件
从所有这些角度来看,所有主要的芯片制造商都在其目标市场中解决类似的问题。它们通过组合通用处理器和定制加速器来提高每瓦性能,并且在许多情况下,它们使从一个市场到下一个市场以及随着算法的更新,更容易,更快地更换模块成为可能。它们还提高了片上,片外到存储器的数据吞吐量,并优先处理了各种数据的移动。
这些方法中的许多都不是新主意,但过去实现这种技术的某些技术并不存在。
Cadence的高级设计工程架构师Stuart Fiske表示:“创建通用的PHY以实现加速器是其中的关键之一。” “您还看到的是处理器并没有变得更简单。这些公司中有很多正在尝试创建加速器接口。那不能解决复杂性问题。它仍然是一个两年的设计周期,没有办法解决。但是您可以使加速器适应最新的神经网络。”
关键是要平衡所有这些组件的集成与足够的灵活性以进行更改。实际上,所有这些芯片制造商都在设计可以针对特定市场和用例进行定制的多芯片平台,同时优化每瓦性能并提高数据吞吐量。
Silexica产品和技术营销负责人Loren Hobbs表示:“设计在时钟速度方面触手可及。” “前进的道路是使每个时钟周期尽可能高效。随着多核异构多处理器的加入,这加速了这些芯片的复杂性。您可以结合所有这些小芯片来提高处理能力,但是您需要工具来帮助进行分配和分析。您必须映射代码库,它非常复杂。它需要静态,动态和上下文分析。”
这里的共同点是数据量的增长,无论是在边缘还是在云中。数据的处理位置以及传输速度是体系结构的关键部分。
“每个人都在为CCIX挣扎,” Arteris IP总裁兼首席执行官K. Charles Janac 说道。“如果您有一个加速器和两个连贯的模具,那么太多的麻烦情况使其无法轻松工作。但是现在您可以使用3D互连将平面CPU和平面I / O连接在一起。因此,对于软件而言,这看起来像是一个系统,并且您在片上网络与不同裸片之间具有片间链接。这样,您可以支持两个裸片之间的非一致性和一致性读/写。它使互连更有价值,但也使它更复杂。”
实际上,这是这些体系结构投入使用已有一段时间的原因之一。事实证明,使所有这些部分协同工作比任何人最初想的要困难得多。
Janac说:“内存控制器和NoC必须紧密集成在一起。” “问题在于,没有人了解整个芯片的QoS,也没有剩下任何独立的存储器控​​制器公司。但是必须更好地集成内存流量才能使其正常工作。”
为了使小芯片市场真正腾飞,还需要有开放标准。
“目前尚无连接小芯片的标准,” Achronix营销副总裁Steve Mensor说。“问题在于您必须能够与他们交谈。因此,您应该能够为套接字开发芯片,并具有链接和协议堆栈来支持它。有AMD和Intel的专有解决方案。也有正在开发的标准解决方案。如果我构建ASIC并购买小芯片,则需要标准解决方案,以便可以独立构建该芯片。这是该模型的基本要求。”
但是,它确实为基于不同ISA(例如RISC-V)的加速器打开了大门。
“对于小型轻巧的硬件加速器来说,这是一个新的机会,” Codasip的营销副总裁Chris Jones说。“面向初创企业构建芯片的开放式界面可能会为半导体行业带来另一个繁荣周期,这将一直持续到完整封装。围绕此问题仍然存在一些问题,例如最终由谁负责测试整个接口,以及如何在签到接口时工作。我们还必须查看小芯片接口的外观,无论它们是标准化的还是专有的。但这无疑为增加更多的验证IP,仿真和仿真提供了新的机会。”
更改组件
目前尚不清楚这些架构中还有哪些更改。本周介绍的大多数产品都是平面的,但也可以选择将其中一些设计推入Z轴。
例如,SerDes为设计增加了等待时间,但是先进的封装技术可以实现同样的效果。台积电的CoWoS(晶片上晶片)和InFO MS(将扇出与基底上的存储器集成在一起)就是两个这样的选择。eSilicon业务和企业发展副总裁Patrick Soheili表示,该公司刚刚使用UMC的插入器开发了CoWoS类型的方法。
Soheili说:“您可以将其拆开,并将其带入不同的抽象层次。” “如果您查看其中的某些架构,则如果有大量数据流过,那么拥有许多小SRAM的效率就不高,而处理大型存储器时效率却很高。这听起来似乎违反直觉,但我们发现更大的内存效率更高,尤其是对于AI类型的应用程序。”
下一步
是所有这些方法的市场正在发展。现在的关键是找出将可重复性和可靠性构建到这些不同体系结构中的方法,以便将它们用于对安全至关重要的应用中,例如汽车或工业,以及广泛的终端市场,而如今,这些终端市场正涌现出各种各样的内容。数据类型。
使这些新架构如此引人注目的是能够针对特定应用定制它们的能力,这些架构利用了作为此类定制基础的架构。从FPGA供应商到像Nvidia这样的公司,所有处理器供应商都在采用这些类型的体系结构,后者在创纪录的六个月内推出了新的芯片体系结构。但显而易见的是,随着设备的修改和更新,随着时间的推移,整个行业将需要更多的工具,更多的数据分析以及对潜在交互作用的更好理解。
这只是转变的开始,最终将涉及整个半导体供应链。而且,尽管扩展将继续,但在处理器领域,它已成为增加架构,封装,材料和工作负载优化等众多清单的另一个旋钮。如今,建筑师是变革的驱动力,他们中的大多数人都认为,随着摩尔定律的降低,建筑变革将加速。一年有什么不同。

(责任编辑:ioter)

用户喜欢...

为什么在物联网部署中MCSP是更好的选择

毫无疑问,过去十年来物联网和云的出现和成功。随着越来越多的数据转移到云中,新的物联网应用被推向市场。由于市场加速因素,全球物联网市场预测已被向上修订,现在预计到2025年总市...


小米的物联网,生活方式产品收入增长86.9%

中国智能手机制造商小米报告称,2018年其物联网(IoT)和生活方式产品领域的收入高速增长。 这家在香港上市的公司出售通过物联网平台连接的智能手机和智能硬件,该公司在截至2018年12月...


“小米印度超越了我们的期望”:雷军

小米董事长兼创始人雷军被称为中国的史蒂夫乔布斯。受到已故的苹果联合创始人早年的启发,Jun打算效仿乔布斯的脚步。我深受那 本《山谷之火》 一书的影响,我想建立一家一流的公司。...


雷军:“你们鼓掌不积极”小米9 Pro发布应者寥寥

在小米9 Pro的介绍环节,一度陷入观众急求快进的状态,雷军也尴尬的说到:你们鼓掌不积极,偌大的小米科技园篮球场,雷军不断介绍着手中的新机,但应者寥寥。 在小米经历了股价腰斩之后...


阿里第一颗芯片怎么样?

阿里巴巴集团首席技术官兼阿里云智能总裁张建锋发布了阿里第一颗芯片:全球最高性能AI推理芯片含光800。 含光的名字,依然沿袭平头哥传统,取自神兵宝剑:含光是上古三大神剑之一,含而...


研究人员为物联网设备开发了更快,低功耗的5G网络

OT设备在数量上由白天和当代的Wi-Fi成长和蜂窝网络是不是在维持设备数量的增加有效。根据一项研究,到2025年,将有750亿个IoT设备,我们需要一个更快,更节能的网络来使它们工作。 输入来自...


为什么5G比4G更安全

对于技术主题,5G的推出吸引了专家,政界人士和其他人士的想象力,他们有时错误地将其描述为对某种技术终点的竞赛或对国家安全的迫在眉睫的威胁。尽管许多评论员缺乏技术专业知识,但...


iPhone 11 Pro拆解显示更小的逻辑板,更大的电池

iFixit拆解了Apple的新iPhone型号,这告诉我们更多有关去年手机的区别。iFixit拍摄了iPhone 11 Pro拆解的实时视频,并撰写了iPhone 11 Pro Max的指南。 第一个主要区别是iPhone 11 Pro和iPhone 11 Pro Max中的电池...


什么是高清地图,它们将如何使我们更接近自动驾驶汽车?

自动驾驶汽车使许多人为未来带来了兴奋。他们热切期望能够在旅途中跳上汽车,而不必触摸方向盘或制动踏板。很难想象这些汽车可以给使用它们的人带来什么样的自由。 但是,当有远见的...


未来两年AI芯片市场规模将翻一番

关于人工智能(AI)解决方案潜力的讨论很多,虽然偶尔会有一两次突破,但普通消费者仍将其视为一种新颖技术。 这可能很快就会改变。根据ABI Research的两份新报告,人工智能芯片市场在未来...