随着AI技术疾驰,大模型成科技新战场。国内巨头纷纷涉足,短短两年,“百模大战”硝烟弥漫。 随着技术突破与成本下降,厂商从参数、性能之争转向价格战。 近期,大模型领域迎来降价潮。
算力部署耗费巨资,持久战正酣。 当前GPU供应紧缺,难以满足AI训练需求。算力生态多元发展,但增长不均。2018至2021年,参数量每18个月增340倍,而GPU内存仅增1.7倍。 单芯片算力增长滞后,大模型训练成本高昂。 对能获取算力的公司而言,成本仍是难题。
Meta的LLaMA需2000个A100 GPU,单次训练成本500万美金。百川CEO王小川指出,每1亿参数训练成本约1.5万至3万元,千亿级模型单次训练成本高达3000万元。 传统产业和中小公司需求明确:高性能低功耗算力、稳定模型、数据安全。但早期重视ROI,前景不明时,不愿冒然投入。 私有化部署成常见选择,但负担不小。
算力一体机或成破局关键。
价格战带噱头色彩,但技术进步是降价主因。 尽管降价幅度超成本降幅,商业策略转变亦有影响。但高并发定价未降,B端用户难享实质优惠。 然而,随着算力和算法发展,大模型成本降低趋势不变,降价可能持续。
对小开发者而言,模型API降价利好,助AI应用落地。阿里云资深副总裁刘伟光表示,降价旨在推动AI应用爆发,加速商业落地。
大模型降价既是策略,也是AI发展需求,更是算力一体机发展趋势的必然。
回顾移动互联网时代,APP繁荣带来便利。如今,大模型降价与AI技术革新将孕育更多AI创新应用。