10月7日(美国当地时间),美国商务部工业和安全局(BIS)宣布将对向中国出口先进人工智能(AI)和超级计算芯片制造、生产设备以及所需的某些工具实施新限制。据媒体报道,新规定要求美国芯片制造商获得美国商务部的许可,才能向中国公司出口半导体和芯片制造设备,目标是阻止中国获得需要使用先进半导体的高性能计算能力。
AI(人工智能)已经成为了各国必争的战略性行业,并不断在实际场景中落地生根。这其中,我国的AI技术发展尤为迅速,在全球AI版图上占据了非常重要的地位。
根据统计,2021年,我国AI产业规模达4041亿元人民币(约568.4亿美元),在当年全球AI产业3619亿美元的产业规模中占比达15.7%;产业投融资金额为201.2亿美元,在当年全球714.7亿美元的产业投融资金额中占比更是达到了28.2%之多。
近年来,为了进一步推动我国人工智能行业的发展,重磅政策频频出台。就在前不久,科技部等六部门联合印发了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》。随后,科技部又公布了《关于支持建设新一代人工智能示范应用场景的通知》,打出以场景创新推动人工智能发展的政策“组合拳”。
在人工智能与医疗结合的场景上,《通知》明确提出“针对常见病、慢性病、多发病等诊疗需求,基于医疗领域数据库知识库的规模化构建、大规模医疗人工智能模型训练等智能医疗基础设施,运用人工智能可循证诊疗决策医疗关键技术,建立人工智能赋能医疗服务新模式”的示范应用场景。
不过,就在国内医疗AI行业为政策助推欢欣鼓舞的同时,来自大洋彼岸的“技术输出限制”消息却为国内医疗AI的未来蒙上了一层阴影。
国内方兴未艾的医疗AI行业究竟是不是“建造在沙滩上的高楼大厦”,会否面临卡脖子的问题?动脉网对行业人士进行了探访,希望能为读者参考。
事实上,10月7日的技术限制也可以算作8月26日相关政策的延续升级。当天,英伟达(NVIDIA)发布公告,称美国政府要求其对部分产品即刻执行新的许可证要求,需要获得美国政府的许可后才能出售给中国(除台湾省外)客户。
公告指出,受到影响的产品有A100和即将出货的H100两款加速卡,以及搭载A100、A100X及H100的DGX及其他整机系统。此外,英伟达在未来推出的任何峰值性能及芯片间吞吐性能等于及强于A100的加速卡及所有搭载此类加速卡的整机系统也将需要遵循许可证要求。
英伟达公告内容(截图自SEC公开公告)
8月31日,英伟达发布了补充公告,明确美国政府已授权出口、再出口和国内转账,以继续其对H100的开发。此外,美国政府也授权在2023年9月1日前,英伟达仍可通过设立在香港的分支机构履行A100和H100的订单和物流。同时,公司还将积极帮助受影响的客户获得美国政府的许可证。尽管无法保证获批,但英伟达展示出来的对客户的诚意不言而喻。
在公告及之后发布的半年财报中,英伟达预测该新许可条例可能会影响约4亿美元的销售收入,占其数据中心产品业务收入的10%左右,相对可控。不过,由于国内也需要承担H100的周边开发任务,许可证将导致开发进度变慢且成本提升。
根据外媒报道,英伟达在加速卡领域最大的竞争对手AMD也收到了相应的通知,涉及产品则是MI250及搭载这些系列加速卡的整机系统。不过,截至本文截稿,AMD并未发布官方公告。
消息一出,英伟达的股价当即受到了明显影响,当日收盘价162.6美元,较8月25日179.13美元的收盘价大跌9.8%,并持续下跌。截至10月5日,其股价为132.09美元,较事件发生之前160美元以上的股价,市值蒸发了接近20%。
虽然英伟达强调仍然可以帮助国内客户向美国政府申请许可证,但从近年来的经验来看,可能性基本为零,相当于事实上的“禁售”。基于英伟达是主要的AI加速卡供应商,在AI算力供应上几乎占据了垄断地位。这一新的许可证制度无疑会对国内医疗AI造成了一定的影响。
被列入限制的A100和H100是英伟达针对数据中心的高端产品。目前,英伟达在这一领域主要有三款产品:V100、A100和H100。从规格来看,H100>A100>V100。V100目前暂未被要求提供许可证,但从芯片规格上来看和其继任者还是有相当的差距。
英伟达数据中心加速卡规格对比
事实上,此次加速卡的事件并非个例,类似事件近来已多次发生,市场的恐慌情绪逐渐积累。举例而言,前不久美国启动了《国家生物技术和生物制造计划》,以确保美国能够在国内制造于美国所发明的所有东西。计划改变目前美国生物医药行业过于依赖美国以外原料和生物生产的现状,在美国国内建立更强大的供应链。
尽管该计划并未制定强制措施,其效力究竟如何也存在不少疑问,但仍对国内方兴未艾的CXO行业造成了重大影响,国内CXO龙头企业的股价纷纷受到波及。仅以受关注度最高的药明康德为例,其市值在一个交易日内就蒸发了205亿元。
10月5日,美国政府又将华大基因列入了“涉军企业清单”(Chinese Military Companies,简称CMC)。不过,被列入CMC清单的企业暂时并无具体的制裁措施。8日,国庆长假后返工的第一天,美国政府又升级了本文开头所述的技术管控措施。
没有任何疑问,在可预见的将来,类似事件或许会越来越多。
那么,AI加速卡在医疗AI中主要用在哪些环节呢?希氏异构CEO宋捷向动脉网做了解读。
目前,医疗AI主要可以分为两大类,一类是与影像关联较大的,统称为医疗影像。其开发思路主要是利用人工智能对MRI、CT、超声等影像数据,形成某种算法,然后再应用到医疗影像的识别中。另外一类则是人工智能在医疗影像之外的领域的应用,包括语音识别、AI基因、AI新药等应用。
在AI影像上,基于GPU及其衍生的加速卡主要在医疗AI的训练(研发端)和推演(应用端)得到应用,两者所需要的硬件差异较大。
“实际在临床上应用的是推演端,也可以称为应用端。它的作用是把训练好的模型加载到某个设备平台上使用。它需要的算力或者图形加速能力其实不算高,只需要相对比较中低端的产品,性能要求跟训练端不是一个数量级的。”宋捷表示。
“据我所知,这类产品并未受到限制。实际上,从另外一个角度而言,我个人认为推演端对国内医疗AI不会产生很大压力,因为它有很多可替代的方案。”他补充道。
“训练端则是基于大量的医疗数据——这些数据可以是图像形式,也可以是其他形式进行训练,以期得到一个非常好的模型(算法)。随后,需要将完成的模型部署到推演端。这个训练的过程需要很强的算力,甚至需要搭建超算中心,从而提升模型训练和迭代的效率,或者可以节约开发成本。”宋捷介绍道。
根据英伟达官方的介绍,本次被限制销售的H100在基因测序上的性能比A100快7倍。简单来说,在A100上需要花费7天训练时间的模型,在H100上大概只需要1天即可完成,差别不可谓不大。
宋捷坦承在这一部分上,国内对国外加速卡的依赖较强。但他同时也表示,产品输入的限制暂时不会对国内医疗AI的发展造成太大的影响。
首先,即使在训练端,目前国内医疗AI的需求暂时不会用到这样高端的产品。
以希氏异构为例,其早在2018年就组建了当时国内算力最强的专用于AI影像研发平台——“神农1号”(SINOSEEDS)超算中心。“我们使用的是当时性能最强的V100,处理能力非常强。我们搭建的时候就做了很大的冗余,直到现在我们的算力在处理医疗数据时基本都是绰绰有余的。”他介绍道。
其次,他表示国内最近5年尤其注重算力等基础设施的建设,成效斐然。
一个最新的例子是2022年2月,我国启动了“东数西算”工程,通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。这一工程类似于著名的“西电东输”计划,不同的是其输送的主要是算力。
随后,国家在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。
“所以,即使不像我们一样自己搭建了专门的超算中心,也可以使用第三方的超算中心算力,或者云端的算力。相对医学影像数据处理要求而言,国内算力是足够的。除非最近出现颠覆性的技术,否则仅现有算力就足以满足未来几年行业对算力的需求。”宋捷表示道。
“当然,你要用前瞻性的眼光去看,这种技术限制也会导致我们用不到国外的新产品。如果有颠覆性的新技术出现我们就无法使用。另外,这种技术限制也会产生持续的影响——比如‘东数西算’工程,以及超算中心和云端算力等就会受到一些影响。这是另当别论的事情。”
行业人士也赞同这一观点。国内某知名AI新药企业向动脉网介绍到,目前政策不会对其业务产生影响。
某知名AI芯片公司的研发人员在与动脉网交流时也表示,基于目前仍然可以使用已有设备的缘故,影响并不会太大;但后续的扩容或者正常的设备替换或许会受到潜在的影响。不过,如果许可证的范围进一步扩大到更多的产品,可能行业未来就会受到一定影响。
一个好消息是,在目睹了前几年其他行业面临的技术限制后,国内AI行业一直在探索替代方案。目前,AI加速除了基于GPU的加速卡方案,也有CPU加速、基于ASIC的AI芯片以及FPGA加速三种硬件类型。
CPU方案的通用性是最强的,但效率也最低。最为关键的是,高性能CPU上对于国外企业的依赖度甚至比GPU更高。英特尔和AMD等国外巨头早已在X86架构上建构了无数专利壁垒,要想实现突破极为困难。因此,这一方案在AI加速上应用得越来越少。
基于GPU的加速方案应用最为广泛,根据预测,GPU加速将在2025年在所有AI加速中占到接近6成的比例。这也是为何英伟达股价能够节节高涨的关键。
不过,GPU加速并非在所有场合都具有优势。比如,在与专为某个用途定制的ASIC,比如捆绑了AI算法的AI芯片比较时,GPU方案未必具有优势。再加上对可能存在的技术限制的风险考虑,国内头部人工智能企业在近年自研或与AI芯片公司合作开发AI芯片已经蔚然成风。
数据显示,2021年国内AI芯片行业投融资事件109起,总金额达到396.36亿元。全球范围来看,AI芯片初创公司的投融资事件数量在170起,累计投资金额约为99亿美元,是上年同期的三倍之多。AI芯片受资本的热捧可见一斑。
不过,目前国内AI芯片刚刚发布,仅从公布的理论算力上较GPU加速仍然有着数量级的差距。此外,目前还没有见到在医疗AI上实际落地的应用,其具体应用效果如何还有待观察。
除了基于专有ASIC的AI芯片方案,配合专用算法的FPGA因其较为灵活的可配置特性和特定环境不逊于GPU的性能成为了AI公司的另外一个选择。简单来说,在写入软件前FPGA具有胜于CPU的通用性,在写入软件后则有类似ASIC的表现。
某知名AI企业的研发人员向动脉网介绍到,人工智能目前的技术领域主要分为深度学习和机器学习。深度学习在医疗领域主要是通过CV技术实现辅助影像诊断和病理分析,近年来,深度学习也开始在新药研发和分子预测等应用落地。目前,深度学习主要运用GPU实现模型训练。
另外一类则是机器学习,它可以实现辅助病情诊断,比如慢性病筛查和风险评估等,机器学习可以通过学习过往慢性病患者数据预测未来患病风险。这类场景受限于数据等因素,不如影像AI落地那么广泛。不过,这类场景受到基于GPU的加速卡的影响不大,国产FPGA加速卡完全可以实现模型训练和推理效能的提升。
即使在国外巨头占据绝对优势的GPU领域,国产替代概念也在近年迅速兴起。当然,这些产品的理论性能尚只能达到相当入门的阶段,此外,真实的落地性能究竟如何也有待观察。
“我们一直在探索可替代的方案,产品端对性能的要求不是特别高,我们至少有两种以上的替代方案。研发端的话,我们之前建设的超算中心算力一直是足够的,暂时也就不存在替代的问题。”宋捷介绍道。
不难看出,尽管有几种可替代的技术路线,但国内替代方案的进展还远未成熟,仍然需要时间。若未来几年仍不能有成熟的替代方案,且面临进一步的技术限制时,或将对行业产生不利的影响。
与此同时,面对美国政府的限制,英伟达也在设法采取措施。毕竟,中国区是英伟达三大主要市场之一,没有人会和钱过不去。与此同时,主力收入来源之一的游戏显卡的库存高企营收不佳、股价低迷等种种负面影响都对英伟达的经营产生了巨大的压力。
据路透社报道,英伟达CEO黄仁勋在9月21日GTC后的新闻发布会上提到,早些时候披露的芯片限制对于芯片性能、芯片连接其他芯片有关能力上都有特定的门槛,英伟达仍然拥有大量产品可以销往国内。合理利用规则,通过提供在限制范围内的架构兼容产品,仍然可以保证英伟达产品在国内的“市场空间”。
一个现实的方式是通过更多满足限制的较低性能的产品的堆叠,或者基于现有产品精准开发“特供版”产品,实现与限制产品同等的算力。当然,这或许还涉及到一系列配套解决方案的分拆供应。尽管较为繁琐,且需要付出额外的代价,但理论上并非无法实现。
另一个方式在半导体行业多少有点源远流长。偶尔会出现一些只需要通过软件或者硬件的简单改动就可将一款产品变为另一款产品的情况。早些时候,一个简单的硬件跳线或者驱动更改都可以让数百元的游戏显卡摇身变为上万元的专业显卡。
与此同时,被定位在其他领域的产品未必就不能用于AI加速。举例而言,前两年原本用于游戏市场的显卡反而成为了“矿工”手中的“挖矿”利器,使得原本2000元级别的游戏显卡被炒出接近万元的天价。
从目前的情况来看,这一许可证制度暂时对国内医疗AI们造成的影响有限。一方面,医疗人工智能所需要的算力并没有想象中那么高,加上最近几年国内在算力上的重点建设,行业仍然有足够的算力可用。
动脉网认为,虽然目前并未受到太大的影响,但随着美国对华政策的收紧,行业有必要未雨绸缪,提前规划可替代方案,以便在相应限制范围扩大时不至于措手不及。
上海国际医疗器械展览会 上海医博会 2023上海国际医疗器械展 2023上海国际医博会 上海春季医博会 上海春季医疗展 医疗器械展 2023上海春季医博会 2023上海医疗器械展 2023春季医博会 春季医博会 医博会官网:/shanghai/
让人略感欣慰的是,虽然难度较大,但行业内已正视这一问题,并正寻求可替代的方案。需求,向来是行业发展的一大推动力,如同早前的芯片禁售推动了国内半导体行业的大发展。或许这意外的需求将会触发相关行业的快速发展也不一定。这样看来,或许也未必是件坏事。
毕竟,历史教导了我们,核心技术还是自己掌握的好。