碎片百科网

当前位置: 首页 > 生活百科

英伟达改良版芯片已调试,大模型厂商寻找备选方案:国产算力供应紧张

时间:2023-12-04 00:35:01    浏览:6

自今年10月24日起,我国人工智能(AI)芯片的出口管制禁令正式实施已有月余。虽然国产算力的发展前景被广泛看好,但在禁令的影响下,国内大模型厂商对华为芯片的需求急速上升,供应链的准备尚需时日。此外,英伟达、英特尔、AMD等公司纷纷推出改良版AI芯片以应对禁令带来的挑战,然而这些新产品的性能和供应情况仍然有待观察。在这片风起云涌的市场中,国产算力正逐步崛起,有望在未来与美国芯片展开竞争,填补市场空缺。然而,短期内国产算力的发展仍面临诸多困境,如供应不足、价格上涨等,使得这场混战仍将继续一段时间。自10月24日美国针对人工智能(AI)芯片的出口管制禁令正式生效,已经月余。

最佳的备选方案无疑是国产算力。目前,已有一些能够与英伟达竞争的产品出现,例如华为昇腾910B,已在科大讯飞以及多个地区的智能计算中心投入使用,并且根据测试结果,其某些性能已经与英伟达芯片相当。然而,突如其来的禁令,使得国内大型模型厂商对华为芯片的需求急剧增加。尽管华为的供应链还需要一些时间来做好准备,但是春天来临的速度比预期中的要快。

针对禁令,英伟达、英特尔、AMD等公司都迅速做出了反应,它们都宣布正在加紧研发改良版的AI芯片。据钛媒体App此前报道,H20在带宽和计算速度方面都有所限制。理论上,整体的算力会比英伟达H100(第一代被禁止出口的芯片)降低约80%,也就是说,H20的算力只有H100的20%。然而,H20增加了HBM显存和NVLink互连模块,从而提高了性能。

一份网传的调研报告指出,H20的设计工艺相对普通,甚至比不上华为昇腾910B的算力设计工艺。然而,增加的显存和网络带宽可能更适合训练参数较少的模型,适用于多卡堆叠以及多个AI服务器的使用。"如果拥有充足的显卡资源,不考虑能耗,H20的算力可以达到H100算力集群的水平。"然而,一位云计算业内人士认为,这种情况下实现的可能性不高,"H20采用风冷设计,热设计功耗为400W,与A100相近,尽管低于H100的700W,但要通过堆叠达到H100的算力,实际功耗可能是H100的两倍甚至更高。能源供应问题成为关键因素。"

由于禁令的限制,过去一个月内,算力市场波澜壮阔。11月初,包括中贝通信、优刻得在内的国内上市公司公开表示,受到服务器供应紧张的影响,租赁价格将根据市场行情等因素进行相应的调整。英伟达A100芯片的算力服务收费价格甚至提高了100%。许多目光聚焦在国产AI芯片上,其中最热门的是华为昇腾。据《IT时报》独家报道,昇腾910B已在我国许多智能计算中心得到应用,进入了规模化商用的前阶段。有多个信息来源显示,在某些指标上,910B已经能够与英伟达去年被禁止的A100相媲美。

通信高级工程师、战略规划专家袁博在接受《华夏时报》采访时提到,华为昇腾芯片与英伟达GPU在AI机器学习训练领域的应用场景有所不同。尽管昇腾芯片在AI能力上已经接近或部分超过了英伟达,但在图像图形处理方面仍有待提升,因此仅能弥补英伟达部分场景的不足。

从长期来看,美国禁令的加紧并未阻碍国产算力的快速发展。IDC发布的报告显示,受益于政策支持,我国本土云端AI加速芯片制造商正快速崛起。截至2023年上半年,我国AI服务器使用的本地采购/开发的AI加速器芯片达到50万块,占整个服务器市场的10%,预计到2024年这一比例将显著上升。

尽管如此,在目前的阶段,国内厂商仍然依赖于英伟达。百度CEO李彦宏表示,得益于之前研发的文心一言,公司已储备了足够的AI芯片,以确保在未来1-2年内持续更新AI大模型。腾讯高层也表示,公司的H800等芯片库存水平较高,可以支持几代混合大模型的更新。

在大模型带来的巨大算力消耗红利推动下,英伟达实现了第三季度收入的暴增。11月22日,英伟达公布了2024财年三季度业绩,数据显示:该季度营收为181.2亿美元,同比增长205.5%;营业利润为104.2亿美元,同比增长1633.7%,营业利润率为57.5%。

从某种程度上看,AI算力芯片的发展仍然需要一定的过渡期,这为我国各大AI厂商提供了一线生机,让他们有机会进行调整和改进。然而,另一方面,目前AI芯片市场呈现出涨价的趋势,供应紧张,形成了“僧多粥少”的现象,这对中小型AI企业而言,当前的算力服务器和算力价格并不友好,因此,这场竞争还将持续一段时间。

猜你喜欢
热搜美食更多