FPGA在汽车相机和传感器中的作用已经很成熟。但他们也在一系列新技术中赢得了插座,从将成为自动驾驶车辆中心逻辑的人工智能系统到新型传感和通信技术。
西门子事业部Mentor的Catapult HLS综合与验证高级产品营销经理Stuart Clubb表示,“有很多关于脚踏实地的概念,以便能够实现智能驾驶辅助应用。” “有各种文章在讨论如何,首先,它太昂贵了。你不能在一辆价值2万美元的汽车里装一个12,000美元的液冷Nvidia GPU盒子。福特无法写出足够的支票来做到这一点。“
汽车业是一个利润率相对较低,业务量较大的企业。虽然数量肯定与那些在过去十年中一直保持摩尔定律的智能手机相比,但汽车制造商一直在努力将成本从供应链中挤出数十年。随着越来越多的电子产品被添加到车辆中,价格压力也扩展到芯片和电子子系统。
但汽车世界为芯片制造商增加了一些主要障碍。除了尽可能削减成本外,它们还必须符合严格的标准,如ISO 26262和ASIL A,B,C和D,并满足十年或更长时间内的弹性,老化和可靠性要求。这就是问题真正开始的地方,因为技术和标准处于几乎不变的演变状态。这也是汽车公司开始依赖FPGA作为首选处理器架构的原因。
“这不仅仅是'我们跑了30分钟,看起来不错,发货了。'这是一个非常不同的方面,”Clubb说。 “如果我们看一下人工智能正在发生的事情,那么人们在谈论卷积神经网络(CNN)是机器学习中最重要的事情。传统的ADAS是行人检测,雷达处理等,但CNN是一个巨大的实验领域,因为没有人真正了解它们的工作原理。关于它们为什么起作用,它们是如何工作的,没有数学证据。他们只是这样做。它包括卷积池和培训网络。你为一件事训练一个网络,它看起来很好,然后你抛出一些东西,它不起作用。每个人都认为解决方案会有很多浮动点,这可能就是英特尔推出Stratix 10器件上所有浮点单元的原因,因为这将是机器学习[平台]。它要么是推论,要么是培训,这将是非常棒的。“
那是在GPU赢得算法培训市场之前。 GPU已被证明是一种廉价的培训架构,因为它们很容易并行化,并且大多数算法开发人员都很熟悉。这使得它们成为数据中心的理想选择,而数据中心也是开发训练算法的地方。但它并不是推理的最佳架构,其功耗,性能和面积比培训更重要。
Clubb说,现在的挑战是量化。 “什么样的网络?我如何建立该网络?什么是内存架构?你从网络开始,即使你只有几层并且你有大量的数据和一些系数,它很快就会转向数百万个系数。那里的内存带宽变得非常可怕,没有人真正知道正确的架构是什么。“
这些问题与用户大声共鸣,因为EDA领域的许多工具提供商都在报告强烈的需求,并参加有关AI /机器学习/深度学习相关主题的研讨会和活动。当答案不明显时,设计定制ASIC的成本太高。
“你唯一能做的就是购买带有一大堆加速器的CPU,”他说。 “但是没有人真正找到正确的答案。福特和通用汽车已经表示他们希望整个自驱动子系统的功率为100瓦或更低,而现在示威者相当于驾驶后备箱中的100台笔记本电脑。所以还有很长的路要走,而且解决方案不会是一大堆GPU。有人会为通用解决方案或具有某些可更新性的非常具体的定制事物破解解决方案。这就是为什么我们开始看到嵌入式FPGA方面实际上已经复苏的原因。“
图1:英特尔的FPGA和加速堆栈。来源:英特尔。
eFPGAs的角色越来越重要
离散FPGA的问题是汽车公司无法足够快地将数据输入和输出这些芯片。 “FPGA上有很多SerDes进行通信,而且它们的性能非常高,但是当你看到在128位总线上可以在芯片上传输多少数据时,SerDes并不是那么快,” Flex Logix首席执行官Geoff Tate说。 “因此,任何时候你进入任何芯片,任何芯片,这通常是一个瓶颈。为了使FPGA有用,它通常必须与FPGA之外的其他东西进行对话。这就是Xilinx和Altera开发SoC芯片的原因。这是缓解这一目标的一步。但Zynq型芯片非常庞大且昂贵。因此,有一类客户希望使用FPGA提供更具成本效益的解决方案,但不一定需要数百万个LUT或数十万个LUT。“
根据市场观察,Tate认为有很多SoC和微控制器公司希望集成FPGA。 “他们看到了它的价值。我们发布应用笔记,展示基于可重配置FPGA的加速器如何比Arm处理器更快。但目前的挑战是大多数微控制器公司习惯用C编程。他们通常不知道如何用Verilog编程。另一个挑战是,如果你看一下FPGA,这些东西的编程模型通常是一个客户编写所有代码。今天,通过计算机或时间共享和多核,有许多程序在操作系统下同时运行。我们被问到如何转向模块化或多核FPGA架构,其中可以有一个应用程序库,可以在多个不同的SoC和微控制器上运行,而无需人们学习RTL。你如何使FPGA看起来更像处理器,他们可以同时运行大块代码和来自不同人的几个不同的代码块,并绕过当前模型,它是一个人一次编写的RTL的一大块?这将使非RTL专家的人更容易获得嵌入式FPGA价值主张。“
离散型FPGA长期以来一直用于汽车领域,从仪表控制台和娱乐功能(统称为信息娱乐系统)开始,并转向驾驶员辅助。 “Altera在激光雷达,声纳和雷达的传感器融合方面赢得了大量插座,而FPGA则非常适合这种情况,”Arteris IP首席技术官Ty Garibay表示。 “您可以以不同的格式将每个接口上的数据合并,合并,并在另一端吐出。因此,FPGA几乎普遍用于每一款高端汽车,例如360度视角。当你离停车位太近时,没有专门的SoC可以做到这一点。它们以每秒近30帧的速度运行。 Altera和Xilinx几乎拥有所有后视摄像头市场。“
他指出,FPGA对于汽车制造商而言也具有成本效益,因为传感器技术可能会发展,但整个FPGA不需要重新认证。
但是,分立式FPGA并不适用于所有产品。 “只要驾驶员协助意味着向驾驶员提供指导或警告,传统的FPGA就足够了,”Achronix的系统架构师Kent Orthner说。 “术语'驾驶员辅助'正在改变意味着代表驾驶员操作车辆,通过对自适应巡航应用制动或油门,自动换道和自动平行停车。由于FPGA负责汽车的实际运行,功能安全要求变得更加严格,难以满足。“
他说,拥有开发符合汽车功能安全要求的ASIC或SoC经验的设计团队可以实施该设备,将eFPGA视为整个解决方案的一个组成部分。 “然后,该团队可以将他们的功能安全专业知识应用于汽车eFPGA SoC的设计,验证,文档和特性描述,从而使设备能够比传统的独立FPGA更容易满足安全要求。此外,eFPGAs提供了更多机会,可以根据手头的应用定制FPGA的核心。对于汽车而言,这意味着可以使用专门的硬化电路来满足弹性要求和冗余。“
另一种力量
汽车领域对电力相关问题并不陌生。功率预算会影响每加仑或每次充电的里程数,特别是当汽车越来越通电时。除了所有这些新的电子技术之外,汽车制造商仍然必须满足所有政府的里程要求。
“特斯拉有三种冷却系统,”Mentor的Clubb说。 “有常规冷却系统,HVAC等等。有一个电池冷却系统。然后是基于GPU的大型显示器的冷却系统。一辆10万美元的汽车很好,但我认为在本田思域没有这么好用。出于同样的原因,我也不会在其中投入5,000美元的FPGA。过去经验法则是,如果您向最终客户销售的产品成本低于1,000美元,那么您就不会在其中加入FPGA。尽管如此,工程团队还是有一个更大的复苏说,'我有这个非常复杂的加速算法。我不能用软件做。我当然不能在Arm处理器上做到这一点,GPU是不可能的,所以我需要一些自定义硬件。我真的不确定我还有正确的答案,所以我需要一个中途可编程的解决方案。'这就是这些SoC自成一体的地方。 FPGA SoC的危险在于它很容易被锁定在提供的IP中。“
图2:特斯拉的带状冷却管。资料来源:Teslarati.com
知识产权在其他任何地方都不一定能发挥出色
“突然之间,离开锁定FPGA平台的障碍变得相当可观,即使你可能在RTL中有你为FPGA编写的秘密,甚至是你用FPGA工具完成的HLS,这也是锁定你,“他说。 “你不会去那种设计方法。如果您正在进行概念验证并希望被亚马逊或Facebook收购,这是可以的,但如果您打算生产真正的产品,那么摆脱这种环境的努力是相当可观的,因为您实际上已经到了去设计IP或去购买它。这突然使得5000美元的FPGA看起来不那么昂贵,因为你没有为这个IP付费;这是一个你如何付钱的问题。人们在生产预算和发展预算之间做出了很大的区分。“
汽车市场推动了非常具体的要求,所以汽车的好消息/坏消息是,虽然他们有这些严格的要求,但他们也希望这些芯片能够工作至少10年,Piyush Sancheti,高级主管说道。在Synopsys营销。 “在我们开始使用一次性汽车之前,我们至少会期待我们的汽车可以工作10年。”
这种动态本身给专注于消费产品的半导体公司带来了新的挑战。
Marvell连接业务集团技术营销总监Avinash Ghirnikar表示,对于其他人而言,灵活性采用了不同的方法。自2005年以来,该公司一直致力于汽车及其通过汽车专用设备(如88Q9098无线SoC)改变汽车需求的方法。 “这款设备不是我们为手机设计的,而是刚刚进入汽车市场。正如我们与Tier Ones和原始设备制造商谈过的那样,他们中的很多人都表达了制定可定制解决方案的愿望,因此我们提供固件SDK,这将允许他们定制他们的WiFi解决方案。这意味着,如果通用汽车想要凯迪拉克和雪佛兰科鲁兹的解决方案,他们可以为凯迪拉克创造一些定制,这可能是雪佛兰科鲁兹的不同定制。由于他们的环境不同,用例可能略有不同。“
最终,设计方法以及FPGA等技术的灵活性使汽车原始设备制造商能够比以往更多地选择定制和定制车辆,并随着汽车需求的成熟而适应不断变化的要求。