硅生命周期管理对 IC 可靠性的影响越来越大
导语:半导体工程与英特尔首席工程师 Prashant Goteti 坐下来讨论硅生命周期管理、它如何扩展和变化以及问题出在哪里;Arm研发人员 Rob Aitken ;Zoe Conroy,思科首席硬件工程师;Subhasish Mitra,斯坦福大学电气工程和计算机科学教授;和卡尔斯鲁厄理工学院可靠纳米计算主席 Mehdi Tahoori。以下是该对话的摘录,该对话是在最近的 Synopsys 用户组会议上现场(虚拟)举行的。
SLM 正在被集成到芯片设计中,作为提高异构芯片和复杂系统可靠性的一种方式。
SE:随着半导体用于安全和任务关键型应用,并且随着异构设计的复杂性增加,人们更加关注硅生命周期管理。芯片需要在汽车、工业和数据中心应用中使用更长时间,而设计成本正在推动延长半导体寿命的需求,即使是在手机中也是如此。
Gotti:传统上,它是关于延长使用寿命并获取您反馈的数据以用于产量和制造目的。但是现在范围已经发生了显着变化,我们将看到的是硅生命周期管理必须相应地改变。我们将看到大量来自小芯片的数据——系统级封装中的多个小芯片。它必须用于数据中心的各种事物,从工作负载平衡、动态性能改进和管理,以及传统的遥测类型应用程序。所以这绝对是一个新兴领域,需要做很多工作。但这并不新鲜。它已经持续了一段时间。
康罗伊:从数据中心和网络产品的角度来看,它是硬件和软件的结合。两者必须不断合作,没有错误。从硬件方面,您正在查看某种类型的异构集成,其中包含来自不同供应商的许多不同组件。第一个挑战是真正了解这一点,然后说,‘好吧,组件是什么?各自做什么?如果我要进入 SLM,每个风险是什么?我希望在我的产品中监控哪些可能对我的网络产生不利影响的关键组件?第一是真正了解您的产品以及该产品的测试方式,以及它将在整个生命周期中执行什么样的功能。然后你会说,‘好吧,如果我想端到端监控 SLM,我将从晶圆分类直接到现场。所以如果我要测试和监控我的芯片,我到底想监控什么?以及如何,我将如何监控它?我需要获取哪些数据?我将如何将这些数据——从源头、测试或现场——通过网络传输到我可以进行实时分析的区域?SLM 有许多组件。现在我们有了云解决方案之类的东西,我们现在可以在其中进行端到端分析。但这非常复杂,对于未来会发生什么,我们只是处于冰山一角。来自测试,还是来自现场——通过网络进入我可以进行实时分析的区域?SLM 有许多组件。现在我们有了云解决方案之类的东西,我们现在可以在其中进行端到端分析。但这非常复杂,对于未来会发生什么,我们只是处于冰山一角。来自测试,还是来自现场——通过网络进入我可以进行实时分析的区域?SLM 有许多组件。现在我们有了云解决方案之类的东西,我们现在可以在其中进行端到端分析。但这非常复杂,对于未来会发生什么,我们只是处于冰山一角。
Aitken:它不仅仅从晶圆测试开始。我们必须考虑在 CPU、周围逻辑、I/O 等中实际需要存在什么——为了提供数据而实际必须存在什么。你能用这些数据做什么?即使在物联网领域,我们也经常遇到的问题是,如果您要将某种设备管理作为硅生命周期管理的一部分,您将如何进行升级?软件如何更新?设备如何信任软件提供商?云服务如何知道信任设备?整个过程中存在很多问题和挑战,还有很多工作要做。但是已经有很多进展了。
Mitra:听到我的行业同事谈论他们已经在做这件事很有趣。我们正处于黑暗时代,离我们想去的地方很远。因此,如果网络出现故障,我们知道我们遇到了麻烦。但是今天现实世界中发生的事情并不是事情正在下降。这是他们产生了不正确的结果,没有人知道这些结果是不正确的。它们被称为无声错误,业界似乎没有解决方案。
艾特肯:有可能处于黑暗时代并且仍在取得进展。人们普遍认为还有很多工作要做,但这并不意味着什么都没有发生。
米特拉:但进展正在以缓慢的速度发生。
Tahoori:从积极的方面来说,有很多机会。随着我们前进,系统变得越来越复杂。我们正在处理芯片和系统质量以外的许多问题,包括信任。SLM 可以成为一种解决方案 仍然需要取得很多进展,但 SLM 有望通过设计和验证以及对非常复杂的硬件和软件系统的信任来解决一些挑战。如果做得好,我们可以应对日益复杂的挑战。
SE:解决方案是否更好的设计,包括更多的验证和模拟,以及芯片在现场时的在线监控?
Gotti : 这取决于你想要达到的目标。对于无声数据损坏、无声数据错误,这些可能是由于制造缺陷等原因造成的。这就是更好的设计、验证和测试内容可能会有所帮助的地方。但是,如果您正在考虑动态工作负载平衡或每瓦性能调整等问题,那么在这种情况下,更好的验证不会对您有所帮助。所以你可以用更好的设计、更好的验证、更好的测试内容来解决一些问题,但不是全部。你必须选择你的战斗,策略会有所不同。
米特拉:我同意和不同意。其中相当多的事情本质上是动态的。您不能只是在零时间静态地执行它,并希望一切正常。你必须适应系统。但是当你有适应性时,它必须被验证。而且你必须确保事情在现场不会出错。因此,适应性将同时施加更多的验证和更多的测试。
Aitken:它还涉及到安全性。您提到无声数据损坏是一个挑战。但是您的对象被黑客入侵或被用作僵尸网络的开始也是一个挑战,您需要确保您在设备上拥有的任何监控功能都能够识别设备何时受到攻击并对此采取措施。这是您可能在该领域追求的另一个载体。
Tahoori:在推进系统要求的过程中,适应性是我们必须处理的事情,但不一定是 SLM。它们有一些重叠,但它们不一定是同一件事。SLM 覆盖范围更广,使我们能够基本上收集有关系统和芯片群体的数据。从这些数据中,我们可以推断出更多有用的信息,而这些信息仅靠在单个系统或设备上进行调整是不可能的。这为大量设备和系统提供了进行异常检测的能力,无论是有缺陷的行为、无声的数据损坏还是某种安全漏洞。
SE:这会引起很多蠕虫,因为获取其中一些数据非常困难。20 年来,我们一直在讨论谁拥有数据、共享多少数据、与数据相关的隐私问题。这有改善吗?
康罗伊:当你做自己的芯片时,你就有了自己的数据。如果您从其他供应商处购买组件,您可能需要也可能不需要这些数据,具体取决于组件是什么。通常,当您从其他供应商处购买芯片时,他们真的不想共享该芯片周围的任何数据,除非它是合格的芯片并且符合规范。但是对于 SLM,重点是您确实希望数据沿着供应链向下流动。如果某个部件出现故障,而这不是您的部件,您想知道原因。您希望获得更多数据来帮助您诊断并确定根本原因。业界仍然不愿意从我们的私营公司分发数据,因为这成为他们管理数据的支持负担。
艾特肯:这也是潜在的责任负担。当某人拥有数据时,其他人可能拥有问题。您需要设计数据、代工数据、测试数据、生产分布数据、现场数据的某种组合,这些数据都属于五家不同的公司。每个人在某种程度上都想拥有问题的某些方面,而在其他层次上又希望别人拥有问题?谁拥有什么,谁将保证什么,是挑战的一部分。谁有什么动机在什么时间收集和使用什么数据?
Mitra:这是涉及数据可靠性和安全性的重要一点。我看过很多论坛,我们在讨论谁拥有数据,但问题是确定我们在谈论哪些数据。大多数时候,人们甚至不知道要收集哪些数据,更不用说谁拥有数据或谁负责数据了。这很重要,但真正的重点应该是收集哪些数据、机制是什么、仪器是什么、需要在架构中放置什么才能收集数据。以及如何分析数据?这就是我们落后的地方。
戈泰蒂:我同意数据量将成为一个重要问题,我们将获得大量数据。如果您假设一个封装中有 50 或 60 个小芯片,那么您将从所有这些中的遥测数据中获取大量数据,并且除非您有一个高效的系统来处理这些数据,否则这将是困难的。但回到谁拥有数据的问题,这是一个需要快速解决的悬而未决的问题。我们不是唯一的开拓者。一段时间以来,飞机工业一直在利用大数据来做这件事。发动机制造商从发动机收集数据,然后决定是否与航空公司或飞机制造商自己共享这些数据。这是我们在半导体行业听到的我们需要弄清楚的事情——而且相当快,因为数据即将到来。我们已经有很多数据,
Mitra:你的信噪比非常小。
Gotti:在噪声中找到信号很重要,但我们需要解决这两个问题。我们需要解决如何处理数据以及如何处理大量数据。然后我们还需要弄清楚谁可以使用这些数据以及以何种方式使用这些数据,而不管是谁收集这些数据。
关于电子元器件分销商广州同创芯
广州同创芯是一家 b2b 电子合同制造商,拥有多家电子元件采购点。我们可以以优惠的价格寻找和采购混合电子元件和 IC,并满足客户需求。无论您想要什么组件,无论数量多少,您都可以从同创芯以合理的价格和可追溯的质量购买。
【优势出货】
IRFP4668PBF 3.2K
ATMEGA32A-AU 16k
STM32F207VET6 一包
STM32F205VET6 一包
STM32F107RCT6 两包
STM8S003F3P6TR 30k
KSZ8081MNXIA-TR 20K
AT91SAM7X256C-AUR 1KDS1631S+TR
编辑:钱江
版权声明:本网注明来源为“西安网”的文字、视频、图片内容,版权均属本站所有,如若转载,请注明本文出处:http://www.xiancity.cn 同时本网转载内容仅为传播资讯,不代表本网观点。如涉及作品内容、版权和其它问题,请与本网站联系,我们将在第一时间删除内容。