在数字化工业的新浪潮中,西门子数字化工业软件再次引领潮流,日前推出了名为Catapult™ AI NN的革新性软件,旨在为神经网络加速器在专用集成电路(ASIC)和芯片级系统(SoC)上实现高层次综合(HLS)提供强有力的支持。Catapult AI NN的推出,标志着西门子在人工智能(AI)与硬件设计融合领域迈出了坚实的一步。
Catapult AI NN不仅仅是一个软件工具,它更是一个综合性解决方案的集合体。它拥有独特的能力,可以从AI框架中捕获神经网络的详细描述,随后将这些描述转化为高效的C++代码,并进一步合成为Verilog或VHDL语言的RTL加速器。这样的流程确保了神经网络能够顺利地在芯片中得以实现,为开发者带来了前所未有的便利和灵活性。
值得一提的是,Catapult AI NN集成了两大开源技术:hls4ml和西门子Catapult™ HLS软件。hls4ml是一个专门用于机器学习硬件加速的开源软件包,而Catapult™ HLS软件则是西门子在高层次综合领域的杰出代表。两者的结合,使得Catapult AI NN在神经网络加速器设计方面具备了极高的定制性和优化能力。
这一创新性的解决方案背后,是西门子与美国能源部费米实验室以及其他为hls4ml做出贡献的机构的紧密合作。他们共同面对的挑战是,如何满足机器学习加速器设计在功耗、性能和面积(PPA)方面的独特要求。Catapult AI NN的推出,正是对这一挑战的积极回应。
西门子数字化工业软件副总裁兼高层次设计、验证和功耗总经理Mo Movahed表示:“在神经网络模型的交接过程,以及将其手动转换为硬件实现的过程中,效率往往非常低下,耗时且容易出错。特别是在针对特定性能、功耗和面积定制的硬件加速器变体时,这一问题尤为突出。Catapult AI NN的推出,将极大地提升AI/ML软件工程师的开发效率,实现加速创新。”
随着AI和机器学习任务的日益普及,从数据中心到消费电器、医疗设备等领域,对于合适大小的AI硬件的需求也在快速增长。Catapult AI NN的推出,正是为了满足这一市场需求。与传统的C++、Verilog或VHDL相比,多数机器学习专家更习惯于使用TensorFlow、PyTorch或Keras等工具。而Catapult AI NN的出现,为他们提供了一个无缝衔接的桥梁,使得他们能够在不改变原有工作流程的前提下,将神经网络模型高效地转换为ASIC或SoC设计。
hls4ml的原始目标是将AI框架中的神经网络描述转化为C++代码,以便在FPGA、ASIC或SoC上实现。而Catapult AI NN则将hls4ml的功能扩展到了ASIC和SoC设计领域,提供了针对ASIC设计的专用C++机器学习功能资源库。这使得设计人员能够在不同的C++代码实现之间进行延时和资源方面的权衡,从而实现PPA的优化。
费米实验室的新兴技术主管Panagiotis Spentzouris表示:“粒子探测器对边缘AI有着严格的约束条件。我们与西门子合作开发的Catapult AI NN,为我们提供了一个综合性框架,使得我们的科学家和AI专家能够充分利用他们的知识,即便他们并不是ASIC设计人员。这种框架同样适用于经验丰富的硬件专家。”
目前,Catapult AI NN已经向早期采用者提供,并计划于2024年第4季度全面推向市场。这一创新的解决方案将极大地推动神经网络加速器设计的发展,为AI技术的广泛应用提供强有力的支持。