ChatGPT板块爆发国内企业聚焦突破算力束缚

来源：第一财经作者：时间：2023-12-04 点击量：891

原文链接：https://www.yicai.com/news/101916514.html

近日，OpenAI以山姆·奥尔特曼（Sam Altman）回归公司CEO（首席执行官）职务、重新组建董事会的方式将路线之争暂时压下。而国内人工智能创业赛道在看过热闹之后，重新聚焦于眼前的算力问题解决。

2023人工智能计算大会上，中国工程院一局副局长唐海英表示，近期刚发生的戏剧性 OpenAI 事件，正是加速派和保守派之间矛盾的体现。对国内产业而言，人工智能的迅猛发展带来便利，也带来风险与挑战。特别是我国的科技界与产业界，应考虑如何利用大规模数据、模型、应用等优势，生成自己独特并能造福人类的AI。既要大胆探索、勇于创新，又要小心谨慎，预估各种风险，开展负责任的研究和应用。

中国工程院院士王恩东表示，虽然目前外界对AI的发展存在很多担心，但今天的计算发展仍处于初级阶段，AI也刚开始进入经济、社会与个人生活。未来可能人们生活的每个场景内都有一个大模型。人工智能发展的前景是美好的，但对算力的需求也是巨大的。

Wind数据显示，截至发稿，上证指数强势翻红，ChatGPT板块强势爆发，昆仑万维冲击20cm涨停，万兴科技、果麦文化升超15%，网达软件涨停，海天瑞声、云从科技、拓尔思集体走强。算力基础设施板块涨0.39%。

生成式AI引爆算力需求

大会现场发布的《2023-2024中国人工智能计算力发展评估报告》显示，中国智能算力规模增速快于同期通用算力规模增速。

IDC数据显示，预计到2027年通用算力规模将达到117.3EFLOPS（每秒进行百亿亿次浮点运算的能力），智能算力规模将达到1117.4EFLOPS；2022年至2027年，预计中国智能算力规模年均复合增长率达33.9%，同期通用算力规模年均复合增长率为16.6%。

浪潮信息高级副总裁、AI&HPC产品线总经理刘军表示，在生成式AI 的带动下，人工智能计算力的技术和应用趋势发生了较大的变化，可归纳为三个方面巨大的格局之变：计算范式之变、产业动量之变以及算力服务之变。

计算范式上，刘军表示，大模型和生成式AI 的发展驱动了产业对高性能、高互联的算力基础设施的需求，也推进了人工智能在云边端的覆盖。同时伴随着应用场景的多样化，底层的基础设施也呈现出多元化的发展。

其次，生成式AI带来了产业动量之变。生成式AI会重构现有的工作和生产方式，在内容创作、自动驾驶、零售、医疗等诸多领域改变人们的生活和生产方式，也带来了更大的市场机会。具体的产业栈上，AI算力、算法、应用服务等产业变量都在加速创新，成为创新加速器，在生态链上面催生出新的玩家。

第三，刘军表示，生成式AI将重构算力服务的模式和市场的格局。不同于以往云计算的服务方式，基础大模型的训练需要用大规模AI算力平台进行长时间的单一任务，进而带来高额训练成本。作为企业方，除了自己构建训练集群外，还可以通过采用算力服务等租赁方式来满足自己的训练需求，这也为算力服务的市场带来了新的机会。

在这些层面，机会伴随着挑战，尤其是如何在算力层面更好地支撑生成式AI创新应用。刘军认为应从算力系统、AI软件基础设施（AI Infra）、算法模型以及产业生态四方面进行综合考量。

刘军认为，目前国内外AI训练算力供给虽百花齐放，但由于每个厂商在开发过程中采用的技术路线不同，在接口互联协议方面存在较多不兼容问题，这也导致AI算力系统开发适配的周期长、定制开发投入大、业务迁移时间久等问题。

此外，由于大模型的训练对AI算力系统扩展要求很高。而对目前的行业、尤其在国内，企业在单GPU算力受限的情况下，为获得更大的训练性能，必须通过扩展集群规模来获得性能的扩展。其次，在数据存储方面，大模型已从原来的单模态向多模态、跨模态演进，其中会涉及到文本、图像、音频、视频等多态数据进行模型训练，训练数据集会达到 TB 级甚至 PB 级。

当集群的规模达到一定量级之后，刘军称，网络性能的波动会导致所有计算资源的利用受到影响，一旦出现故障，整个系统的连通性也会受到较大的波及。

算力压力面临生态挑战

解决之道在哪里？刘军认为首先应开放平台多元算力，首先是开放平台多元算力，打造高性能AI 服务器。在计算方面尤其要解决目前多元算力的问题。在可以预见的相当长时间内，行业一定会处于多元算力共存的局面，所以希望用一个统一的系统架构和接口规范来兼容各类多元AI 算力，从而保障AI算力的高效释放。

北京智源人工智能研究院副院长兼总工程师林咏华表示，目前国内在芯片性能方面的差距大概为三年。目前英伟达已发布H200，国内大多数AI大模型训练集群所使用的国内芯片个别能力接近H100、A100、A800，但更多尚未达到这些芯片性能的50%，这是目前的现状。

但需要注意的是，林咏华强调，芯片性能差距更大在于生态方面的差距。英伟达的成功不仅仅在于其芯片，更在于其软件栈CUDA（Compute Unified Device Architecture）的成功。近期应为宣布全球CUDA注册开发者数量超过300万。

人工智能与机器学习领域国际权威学者吴恩达此前曾评价CUDA的意义：“在CUDA出现之前，全球能用GPU编程的可能不超过100人，有CUDA之后，使用GPU变成一件非常轻松的事。”行业普遍认为，CUDA完善的编译器生态是英伟达GPU在高性能计算领域成功的关键，如易部署、开发接口灵活、编程语言适配、工具及代码库完备，且兼容Windows、Linux和MacOS多个操作系统。

反观国内市场，林咏华称，国内AI芯片厂商有40多家，每家厂商都有自己的软件栈，但整体份额加起来不超过10%，整个软件生态非常割裂，当然也面临产能受阻等客观问题。

这样的背景下，林咏华认为行业需考虑如何突破算力受限与生态壁垒，打破全球芯片与中国芯片之间的差异难题，即打破异构算力束缚。

一位业内人士对记者表示，生成式AI这种智能算力完全替代通用算力的可能性已经开始出现了。聚焦目前国产芯片的话，部分较好的产品，其单卡算力基本能达到300T，但由于英伟达独有的接口原因，基本上国内芯片计算能力以及互联能力综合能达到英伟达A100的水平，但与H100、H800相比，还有较大差距。另外，目前几乎全球所有开源系统都基于英伟达CUDA生态构建，而CUDA是闭源的，其他企业必须开发自己的生态。

“大模型或智算框架，国内企业都经过很多探索，去适应一个新的生态，这个过程非常漫长且痛苦，相应来讲，会有很多企业还是会继续选择英伟达，而非一些比较新兴的公司。这也是任何一种生态发展过程。”该人士表示。

上一条：“人肉开盒”深度调查：谁在售卖你的隐私
下一条：2023年数据要素市场发展提速，数据治理不能靠数交所唱“独角戏”