新浪数码讯 5月10日下午消息,后摩智能发布首款存算一体智驾芯片——鸿途H30,最高物理算力256TOPS,典型功耗 35W,或成为国内率先落地存算一体大算力 AI 芯片的公司。

在人工智能技术飞速发展的今天,高效的 AI 计算能力成为智能驾驶普及应用的重要基石。后摩智能以底层技术创新为驱动力,采用存算一体架构突破芯片算力和功耗的瓶颈,实现了芯片能效比的阶跃,为快速发展的智能汽车产业带来了全新的解决方案。

通过底层架构创新,实现 AI 计算效率的极致突破

一直以来,计算效率的提升都是科技发展和变革的底层驱动力。如今,一部小小的智能手机,计算能力和效率已经比2000年代的个人PC提高了至少 1000倍。这种计算能力的提升,为人们带来了丰富多彩的生活和便捷体验。从大型机到 PC 再到手机,技术发展与应用变革的趋势也表明,每 1000倍效率提升将会创造一个新的计算时代,并改变人们的生活方式。伴随着AI技术的跃进,未来万物智能时代的计算系统,和今天的芯片相比,在计算能力和效率上至少要再有 1000倍以上的提升。

后摩智能创始人兼 CEO 吴强表示:“2年前,后摩智能成立,我们坚定地选择以存算一体的底层架构创新,来实现 AI 计算效率的极致突破。存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。随着 GPT 等大模型的出现,存算一体芯片越来越受到行业关注,我们很高兴看到更多创业公司加入进来,与我们一起推动硬科技的创新与应用。”

发布会上,中国电动汽车百人会副理事长兼秘书长张永伟指出,智能驾驶市场规模庞大,仍处于加速渗透的阶段,为新技术和新企业提供了创新发展的巨大机遇。存算一体作为一种创新技术,对工艺制程依赖度低,具有极高的竞争力,为智能驾驶芯片提供了更具前瞻性的技术路径选择。采用多种技术路径实现芯片国产化布局,将有利于解决汽车芯片供应链中存在的同质化竞争问题,助力提升产业链的韧性和供应链的安全性。

存算一体,为智能驾驶打造高效计算引擎

后摩智能联合创始人兼研发副总裁陈亮表示,鸿途H30 以存算一体创新架构实现了六大技术突破,即大算力、全精度、低功耗、车规级、可量产、通用性。鸿途H30 基于 SRAM 存储介质,采用数字存算一体架构,拥有极低的访存功耗和超高的计算密度,在 Int8 数据精度条件下,其 AI 核心IPU 能效比高达 15Tops/W,是传统架构芯片的7 倍以上。为了更好地实现车规级,后摩智能基于鸿途H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。

为了充分发挥存算一体带来的高计算效率,后摩智能面向智能驾驶场景打造了专用 IPU(处理器架构)——天枢架构,采用多核、多硬件线程的方式扩展算力,实现了计算效率与算力灵活扩展的完美均衡,AI 计算可以在核内完成端到端处理,保证通用性。天枢架构的设计理念源自于庭院式的中国传统住宅,以大布局设计保障计算资源利用效率的同时,再进一步结合现代住宅多层/高层的设计优势,以多核/多硬件线程的方式灵活扩展算力。得益于灵活、高效的硬件架构设计,鸿途H30 实现了性能 2 倍提升的同时,还降低了 50% 功耗。

据陈亮介绍,天枢架构是后摩智能自主研发的第一代 IPU(处理器架构),第二代天璇架构已经在研发中,将采用Mesh 互联结构,可根据应用场景的不同配置计算单元的数量,整体性能、效率和灵活性将进一步跃升,支持多场景应用,例如成本和功耗敏感的智能终端、大模型等场景。第三代天玑架构已经开始规划,将为万物智能打造。

颠覆式技术赋能智能驾驶,鸿途H30再创性能新高

发布会上,后摩智能联合创始人兼产品副总裁信晓旭对鸿途H30 的产品性能与优势做了详细介绍。得益于存算一体的架构优势,鸿途H30 基于 12nm 工艺制程,在 Int8 数据精度下实现高达 256TOPS 的物理算力,所需功耗不超过 35W,整个 SoC 能效比达到 7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。在实际性能测试中,鸿途H30 基于Resnet 50 模型的 Benchmark,在 Batch Size 等于1 和 8 的条件下分别达到了 8700 帧/秒和 10300 帧/秒的性能。

目前,基于鸿途H30 已成功运行常用的经典 CV 网络和多种自动驾驶先进网络,包括当前业内最受关注的 BEV 网络模型以及广泛应用于高阶辅助驾驶领域的 Pointpillar 网络模型。以鸿途H30 打造的智能驾驶解决方案已经在合作伙伴的无人小车上完成部署,这是业界第一次基于存算一体架构的芯片成功运行端到端的智能驾驶技术栈。

本次发布会,后摩智能同步推出了基于鸿途H30 芯片打造的智能驾驶硬件平台——力驭。有赖于鸿途H30极高的计算效率和计算密度,力驭平台 CPU 算力高达200 Kdmips,AI 算力高 256Tops,支持多传感器输入,能够为智能驾驶提供更充沛的算力支持,进一步提升了系统的可靠性。力驭平台功耗仅为 85W,可采用更加灵活的散热方式,实现更低成本的便捷部署,有利于推动大算力智能驾驶场景的普及应用。

为了让客户拥有更好的产品使用体验,后摩智能还基于鸿途H30 芯片自主研发了一款软件开发工具链——后摩大道,支持 PyTorch、TensorFlow 、ONNX 等主流开源框架,编程兼容 CUDA 前端语法,同时支持 SIMD 和 SIMT 两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现了鸿途H30 的高效、易用。

信晓旭透露,鸿途H30 将于6月份开始给 Alpha 客户送测。同时,后摩智能的第二代产品鸿途H50 已经在全力研发中,将于2024年推出,支持客户 2025年的量产车型。

鸿途H30 的发布,开启了存算一体大算力芯片商用落地的新阶段。后摩智能将坚定不移地专注于底层技术创新,打造极致效率的计算芯片,与生态链上的合作伙伴密切合作,共同推进万物智能的实现。