从22年11月OpenAI发布ChatGPT开始,国内大公司、AI创业者也是主动或被动进入大模型的赛道开始竞赛。2年过去,大模型这个赛道的发展情况如何?这篇文章,我们看看作者是如何帮我们梳理的。
一、行业概览
大模型行业是一个快速发展的新兴领域。
发展历程方面,历经萌芽期、探索沉淀期,自2020年进入迅猛发展期。产业链分工明确,上游包括硬件(芯片、服务器、通信网络等)和软件(云计算、数据库、中间件等);中游为大模型行业本身;下游涵盖游戏、办公、传媒影视、医疗、金融、电商、工业等众多应用领域。行业的核心商业模式主要为技术驱动,通过不断提升模型的参数规模和数据量级,提高模型的性能和泛化能力,以满足不同领域的复杂任务需求。
大模型主要分为按输入数据类型分为语言大模型(NLP)、视觉大模型(CV)和多模态大模型;按应用领域分为通用大模型(L0)、行业大模型(L1)和垂直大模型(L2)。
目前,大模型市场容量及规模巨大,预计2028年将达到1179亿元,2024年市场规模预计可达216亿元。众多科技巨头纷纷入局,如国内的百度、腾讯、阿里、华为,国外的OpenAI、谷歌、微软等。
1. 行业数据
中国大模型行业市场规模增长迅速,2023 年市场规模为 17.65 亿元,其中云侧大模型市场规模为 16.88 亿元,端侧大模型市场规模为 0.77 亿元;预计 2030 年我国 AI 大模型行业市场规模为 896.58 亿元,其中云侧大模型市场规模为 812.39 亿元,端侧大模型市场规模为 84.19 亿元。
2024 年山东重点大模型建设项目 54 个,计划总投资 20.87 亿元,年度计划投资 11.32 亿元,前三季度完成投资 9.86 亿元,年度投资完成率 87.12%;前三季度山东大模型业务收入达 24.85 亿元,同比增长 176.7%。全国大模型相关企业近 8 万家,截至 2023 年 08 月,全国大模型企业数量广东省、北京市、江苏省位列前三。全国范围内已有 197 个生成式人工智能服务通过网信办备案,北京大模型数量 85 款,在全国占比超 40%。
从大模型的类型来看,通用大模型、行业大模型数量分别为 61、136 款,占比分别为 31%、69%。2023 年中国大模型平台市场规模达 17.65 亿元人民币,百度智能云以 19.9%的市场份额获中国大模型平台市场第一。
2. 行业痛点
当前大模型行业存在多方面痛点。
对于非结构性数据的处理以及由此产生的安全性问题和道德风险较为突出,例如可能被利用获取客户密码,回答具有歧视性等,需要相应工具检测风险。能耗和性能平衡是大模型落地的难题,目前大模型训练在云端实现,中心化算力精度要求高且成本高。
恶意信息泛滥、保护隐私和数据安全问题亟待解决。我国大模型在算力和算子库方面面临“卡脖子”风险,GPU 芯片依赖海外进口,AI 算法开源生态构建滞后。数据供给面临枯竭,获取难度大、成本高,质量不一且难以满足需求。
人才短缺问题严重,无论是数量还是质量都与发达国家有差距。
大模型行业应用过程中还面临法规风险,包括数据安全和隐私问题、责任归属和伦理问题、监管与技术创新矛盾、知识产权问题等。
市场对大模型行业应用的认知不准确也阻碍实际应用落地,部分群体不认可大模型能力,部分客户预期过高失望。
此外,芯片短缺、数据约束、人才缺口等制约因素也影响大模型发展,如算力紧缺与芯片“卡脖子”有关,优质中文训练数据匮乏,商业落地难等。
大模型落地边缘侧时,芯片性能和功耗的平衡也是关键问题。
3. 行业发展驱动要素
大模型行业的发展受到多方面因素驱动。
政策端,政策环境持续优化,为 AI 大模型市场的高速发展赋能,从“十二五”到“十四五”规划,国家对人工智能新技术、新产业给予巨大支持,从方向性引导到强调落地应用与场景创新。
供给端,下一代 AI 基础设施等快速发展,助力大模型应用落地,如算力对大模型开发至关重要,尽管中国存在算力剪刀差等问题,但各厂商仍在加大投入。
需求端,AI 市场高景气,大模型下游行业需求旺盛。此外,算法、算力、数据均为关键要素,高质量数据决定模型的训练质量、性能表现和应用领域广度与深度,数据要素市场大有可为。
国产化需求强烈,银行、大型央国企明确限制使用国外大模型,有购买或自研国产大模型的需求,且从数据安全角度出发需进行本地部署。
数据语料库、算法框架和算力芯片也是重要因素,数据语料库的丰富性和质量决定模型性能,算法框架影响训练效率和性能,算力芯片为模型运行和训练提供硬件支撑。
4. 商业模式
大模型行业的商业模式呈现多样化特点。
专门大模型公司主要有以下几种商业模式:
直接提供模型服务(API/SDK):国内外企业都通过这种方式将大模型能力输出给开发者或企业客户,国内注重生态建设,国外则利用大模型重构原有业务和服务。
自用模式或垂直应用开发:基于大模型自主研发面向消费者或企业的应用进行变现,国外侧重于提升现有产品线智能化水平或开发新智能产品。 – 混合模式:结合直接服务和自用模式优点,专注特定领域应用同时开放 API。 – 开源模式:国内与自有行业数据结合,国外更加成熟,吸引全球开发者完善创新。
生态型商业模式:促进生态成员能力共享和组合,赋能各行各业。
对云厂商而言,提供大模型能力变现方法多样,不仅搭售云资源,还有多种策略和产品组合。
大模型收费模式可总结为 API、订阅、广告、定制化四种。
OpenAI 确立了经典商业模式,包括 ChatGPT 订阅、API 调用、战略合作三种营收方式。
目前,大模型的 B 端应用已出现各种定价方法,如按时间段收费、按调用量收费、按 token 收费等。行业普遍认为,面向 B 端的大模型商业模式更清晰,C 端多数产品仍以免费为主。
此外,大模型的商业模式创新也在不断探索中,如多中心分布式技术架构等。
最适合大模型的盈利点被认为是算力,按使用量计费模式合理。
5. 行业在产业价值链中的位置
大模型在产业价值链中处于关键位置,具有强大的影响力。
大模型产业链架构不断完善,上游由算力设施、数据服务商、算法供应商组成,为中游的各类研发厂商提供算力设备、数据原材料以及算法技术支持。下游则面向千行百业的垂直应用,涵盖制造、物流、能源、营销服务等多个领域。
在产业价值链高附加值两端的研发/设计和营销/服务领域,大模型渗透率较高。例如营销服务领域,无论是电商行业的数字人,还是广告行业的文案与图片素材生成,都形成了较成功的应用案例。这些场景跨行业通用性强,数字化基础好,已积累大量行业数据,能基于通用大模型底座优化自身性能。
而在生产制造等中间环节,由于情况复杂,大模型应用相对较慢。但随着大模型产业的不断成熟,有望加速推动人工智能从“工具”变为“伙伴”,为各行各业带来工作效率与体验的多重变革。
大模型作为新质生产力发展的核心驱动引擎,对经济复苏和重塑产业结构起着至关重要的作用,未来将重塑每个行业,并创造出无数新行业。
6. 行业细分市场情况
大模型行业的细分市场主要包括云侧大模型和端侧大模型。
云侧大模型市场规模较大,2023 年为 16.88 亿元,预计到 2030 年将达 812.39 亿元。端侧大模型市场规模相对较小,2023 年为 0.77 亿元,2030 年预计为 84.19 亿元。
按功能可分为 NLP 大模型、CV 大模型、科学计算大模型和多模态大模型。如今大模型支持的模态数量更加多样,从单一任务逐渐发展为支持多种模态下的多种任务。
从行业大模型的类型来看,涵盖教育、金融、办公、政务、医疗等多个领域,且正在向传媒、招聘、家装、心理等更广阔的场景延伸。其中,教育领域有 19 款,金融领域 18 款,办公领域 15 款,政务领域 11 款,医疗领域 11 款。
在金融领域,金融大模型发展迅速,国内金融机构对大模型的态度从讨论是否入局转变为在各大细分场景落地开花,赋能智能营销获客、财富管理、风险管理等多个环节。
此外,AI 大模型行业涵盖多个细分领域,如 NLP 大模型专注于自然语言处理领域,广泛应用于智能客服、机器翻译、文本创作等场景;CV 大模型、科学计算大模型和多模态大模型也在各自的专业领域发挥着重要作用。
二、4P分析
1. 行业产品情况
中国大模型行业产品丰富多样。主要分为基础层、模型层、中间层和应用层四个一级环节,涵盖 19 个二级环节和 47 个三级环节。按输入数据类型可分为语言大模型(NLP)、视觉大模型(CV)和多模态大模型。按应用领域分为通用大模型 L0、行业大模型 L1 和垂直大模型 L2。
通用大模型可在多个领域通用,如 GPT 系列、文心一言等;行业大模型针对特定行业,如金融大模型;垂直大模型针对特定任务或场景。此外,还有工业大模型,工业互联网等工作为其提供了部分数据基础,目前处于萌芽阶段,产品形态较为稚嫩。在各个领域都有广泛应用,如自然语言处理、计算机视觉、语音识别、推荐系统等,在自动驾驶、医疗、教育、金融等领域发挥重要作用,像华为云发布的盘古汽车大模型覆盖汽车多个业务场景,京东探索研究院开发的大规模视觉模型 ViTAE 在多个权威榜单上获得佳绩。
2. 产品价格情况
中国大模型行业处于快速发展阶段,价格体系呈现出多样化且竞争激烈的态势。
目前大模型产品价格根据不同的模型和功能可分为免费模型、低成本模型、中等成本模型和高成本模型。
免费模型主要有百度的 ENIRESpeed 和 ENIRELite 等,完全免费向用户开放。
低成本模型输入价格通常在每百万 tokens0.5 元到 10 元不等,输出价格也相对较低,如 GLM – 3Turbo 和 Deepseek – V2 的输入和输出价格都为 1 元。
中等成本模型输入价格在每百万 tokens10 元以上且不超过 50 元,输出价格相对较高,在 12 元到 120 元不等。
高成本模型输入价格从每百万 tokens71.6 元到 215 元不等,输出价格非常高,从 100 元到 430 元不等。
国内大模型行业价格战激烈,众多厂商纷纷降价或推出免费模型以争夺市场份额。例如:
5 月以来,幻方量化旗下 DeepSeek 发布的 DeepSeek – V2 开启价格战源头,随后智谱、字节跳动、阿里云、百度、科大讯飞、腾讯云等厂商纷纷加入。
字节跳动将豆包大模型价格降至比行业价格低 95.8%甚至 99.3%;
阿里云通义千问 9 款模型全面降价,降幅最高达 97%;
百度两款轻量级模型免费开放;
科大讯飞轻量级模型 API 永久免费开放;
腾讯云多款模型免费或降价。
此外,与国外大模型相比,微软 Azure 云服务的 GPT – 4o – mini 价格具有一定优势,国内部分模型价格相对较高,如通义千问的 Qwen1.5 – 7b – chat 模型和文心一言的 ERNIE 4.0 Turbo 系列。
总体而言,中国大模型行业价格体系复杂,价格战使得价格区间跨度较大,且存在明显的价格断层,免费模型、低成本模型、中等成本模型和高成本模型之间价格差异显著。随着行业的发展和竞争的持续,价格体系可能会不断调整和变化。
3. 销售渠道情况
目前,中国大模型行业的销售渠道主要呈现多元化特点。
一方面,大模型相关企业通过与各行业的企业直接合作,将大模型技术应用于特定领域,如自动驾驶、医疗、教育等,实现技术落地并拓展销售渠道。例如,华为云发布的盘古汽车大模型覆盖汽车多个业务场景,通过与汽车企业合作推广。
另一方面,一些大模型企业可能通过参与政府项目,在政策支持下拓展销售渠道。国家对人工智能行业高度重视,陆续出台多项政策鼓励发展,各地政府也相继发布支持人工智能产业发展的政策文件,围绕打造拓展人工智能应用场景等方面作出部署,为大模型企业提供了参与政府项目的机会。
此外,大模型行业也可能通过参加行业展会、研讨会等活动,展示技术成果,与潜在客户建立联系,拓展销售渠道。随着大模型技术的不断发展和应用领域的不断扩大,其销售渠道也将不断拓展和创新。
4. 销售促销情况
目前中国大模型行业处于快速发展阶段,各企业在销售促销方面主要采取以下策略:
技术展示与合作:通过展示大模型在各个领域的应用成果,如自动驾驶、医疗、教育等,吸引潜在客户。同时,积极与各行业企业开展合作,共同探索大模型的应用场景,以实际案例推动产品销售。
学术交流与推广:中国学者在大模型领域做出了许多原创性贡献,企业可以借助学术交流活动,展示自身技术实力和创新成果,提高行业知名度和影响力。
政策响应:积极响应国家政策,如国家对人工智能行业的支持政策以及各地出台的相关政策文件。企业通过强调自身产品在符合政策要求方面的优势,吸引政府和企业客户的关注。
行业报告与研究发布:如智研咨询等机构发布的行业报告,企业可以借助这些报告展示自身在行业中的地位和发展前景,为潜在客户提供决策参考。
举办活动与分享会:邀请一线企业专家进行项目实践经验分享及前瞻思考,举办各类活动和分享会,吸引行业内人士的参与,扩大品牌影响力。
三、行业特征分析
1. 竞争特征
大模型行业竞争激烈,参与企业众多,呈现出百芯百模的竞争态势。
竞争企业战略主要包括以应用为导向、以系统为核心,支持开源开放、多元多模的方式激发生态创新;同时,大企业凭借雄厚财力及注重长期目标的优势,在大模型领域占据重要地位。
行业竞争热点集中在技术创新、应用场景拓展以及数据和人才资源的争夺上。
技术创新方面,深度学习、自然语言处理、计算机视觉等技术不断进步,多模态大模型、科学计算大模型等新兴领域取得重要进展。
应用场景从文本生成等任务不断向金融、医疗、智能制造等多个领域拓展。
数据方面,政府开放的公共数据以及社会力量整合的数据可用于大模型训练,而专业领域的高质量私域数据更是稀缺资源。
人才方面,既懂人工智能技术又懂相关专业领域知识的人才争夺激烈。
行业资源可得性方面,数据资源丰富但获取难度不一,人才资源竞争激烈但数量有限。
产品差异化程度目前相对较低,随着技术的发展和应用场景的细分,未来有望提高差异化程度。
2. 需求特征
大模型行业的需求特征呈现出多方面特点。
需求增长率方面,随着人工智能产业进入爆发增长期,大模型的需求增长迅速,智能算力需求呈指数级增长,行业规模也在不断扩大,如2023 年我国 AI 大模型行业规模已达到 147 亿元。
顾客稳定性方面,目前多数需求方认可大模型价值,计划追加投入,显示出一定的顾客稳定性。例如某运营商在 2023 年研发客服大模型并试点上线,2024 年计划加快规模化商用推广。 替代品可接受性较低,大模型具有多模态支持能力,能更好地适应不同场景下的数据需求和业务需求,为各行业提供独特的解决方案,目前难以找到可替代的产品或技术。
需求弹性方面,大模型的需求弹性较大。企业需求特征表现为在满足可落地的前提下实现价格、私密安全性和大模型能力效果的三者平衡,用户对大模型的需求也包括内容生成与创意设计、信息提炼与专业辅助、任务调度与智能交互等多个方面,同时还要求易于部署、易用、个性化定制等,这使得大模型的需求会随着技术发展、成本变化和用户需求的多样化而发生较大变化。
3. 技术特征
大模型技术目前处于快速发展阶段,技术成熟度不断提升。
大模型的工作机制是基于概率和统计推动进行的,具有不可解释性和幻觉不可消除等主要特征。其技术复杂性较高,由大量参数组成,以GPT-3为例,参数量达到1750亿,远超以往模型。技术影响广泛,在政务、金融、产业升级、医疗、文化教育、智慧城市等多个领域均有落地应用,正以前所未有的速度推动科技革命和产业变革。
技术的可保护性方面,由于训练大模型需要对大量互联网数据进行有损压缩,通常需要巨大的 GPU 集群,技术门槛较高,一定程度上增加了可保护性。研发费用情况较大,需要大量的计算资源和数据支持。
大模型技术在语音识别、自然语言处理、计算机视觉等任务中具有更高的准确率,泛化性能强,在不同任务、语言、模态、场景的通用性都变得越来越好。
大模型可以作为预训练模型,提升小模型性能。同时,大模型技术具有强理解能力、强生成能力和强信息集成能力,能够集成各种类型的信息,融合知识和数据。
随着技术的进步,大模型的潜力正在不断释放,引领人工智能发展,赋能新质生产力。
4. 增长特征
大模型行业处于快速增长阶段。从市场规模来看,2023 年中国大模型市场规模为 147 亿元,且近几年复合增长率较高。同时,预计 2024 年市场规模将进一步扩大,如中国工业大模型虽处于萌芽阶段,但随着技术的发展和应用场景的拓展,市场增长潜力巨大。
在生产能力方面,大模型的规模持续扩大,参数从数百亿增长至数千亿,这体现了其技术能力的不断提升,也为行业的发展提供了强大的动力。多模态融合、行业定制化模型兴起等趋势,进一步拓展了大模型的应用场景,推动行业生产能力的增长。
新投资总额也具有极大提升空间。智能计算基础设施作为大模型行业的重要支撑,其重资产投入的特征将吸引更多的资金投入。目前,大模型行业的投资总额尚处于不断增长的阶段,随着技术的进步和市场需求的增加,未来的投资总额有望持续提升。
然而,大模型行业也面临一些挑战,如算力瓶颈、主流架构局限、高质量训练数据集不足以及爆款应用尚未出现等问题,这些可能会对行业的增长速度产生一定的影响。但总体而言,大模型行业增长态势强劲,未来发展空间广阔。
5. 盈利特征
目前大模型行业整体盈利情况较为复杂。
一方面,部分大模型创业公司在初期获得了显著的融资成就,如光年之外、百川智能等,这显示投资者对行业前景有一定信心,但融资成就不能直接等同于盈利能力。一些具有深厚学术背景的公司如智谱 AI 更注重长期技术研发,短期内盈利能力可能较弱。
大模型的盈利能力取决于多个因素。应用领域融合较好的公司,如聆心智能,若能找到有效商业模式并推向市场,有望实现盈利。百融云在拥有大模型且融合度较好的 AI 上市企业中表现突出。出门问问通过「产模结合」在大模型内卷中率先盈利。 科大讯飞在大模型领域高投入但面临低回报的盈利迷局,其 AI 业务在 B 端和 G 端市场受经济大环境和政府财政支出影响,盈利增长受限。不过,科大讯飞董秘提出了大模型赚钱的五个维度,包括与现有业务结合、通过开放平台生态落地、在行业市场落地、企业内部运营提质增效等。
此外,19 家 Kimi 大模型企业中,部分企业如掌阅科技有一定的盈利能力表现。但总体而言,目前大模型行业盈利临界点尚不明确,大多数参与者盈利模式尚不清晰,短期内难以看到明显的盈利迹象。而英伟达通过向大模型构建者和使用者提供硬件产品和软件服务,实现了相对稳定的盈利。
四、行业竞争环境分析
1. 大模型行业上游供应商议价能力
大模型行业上游供应商的议价能力因不同主体而有所差异。
对于互联网公司、AI 公司、学校及科研院所等主流大型语言模型构建者而言,由于自身有算力基础设施布局,上游供应商的议价能力较弱。然而,对于行业专家组件的科研团队、工作室来说,算力需依靠外部力量解决,会产生一定的算力成本,在这种情况下上游供应商议价能力相对较强。此外,中国人工智能芯片行业主要上游供应商为半导体材料和半导体设备,由于半导体设备技术水平较高、专用性较高且市场处于供不应求的局面,使得中国人工智能芯片行业供应商的议价能力较强。在特种油品行业,行业上游的原材料供应商议价能力较高。
总体来看,大模型行业中部分主体的上游供应商议价能力较强,而另一部分主体由于自身资源布局可在一定程度上削弱上游供应商的议价能力。
2. 下游购买者议价能力
在大模型行业中,下游购买者的议价能力相对较强。
一方面,随着行业的发展,市场上出现了越来越多的大模型产品与服务,下游客户的选择性较大。例如在大数据行业,由于行业现有竞争者较多,客户对大数据产品与服务有多种选择,因此议价能力较高。大模型行业与之类似,众多的产品供应使得下游客户在选择合作对象时有更多的话语权,可以通过比较不同产品的性能、价格、服务等方面来压低价格或要求更高质量的服务。
另一方面,若大模型产品的标准化程度较高,购买者向多个卖主购买产品在经济上也完全可行,这进一步增强了下游购买者的议价能力。同时,若转换其他大模型供应商购买的成本较低,购买者也处于较为有利的谈判地位。
3. 行业内现有企业竞争情况
大模型行业内竞争激烈,呈现多巨头竞争的格局。
国际市场上,微软、亚马逊、谷歌等拥有云计算业务的科技公司在大模型领域加大投入力度,资本支出增速大幅增长。
国内方面,腾讯、华为稳居第一梯队,市场地位得到认可,商业化落地潜力大。百度、阿里等企业也在积极布局,如阿里作为全球第四大云厂商,在大模型浪潮中动作备受关注。此外,商汤、智谱 AI、百川智能、第四范式等企业也在市场中占据一定份额。
2024 年中国人工智能行业大模型企业竞争力 100 强报告显示,北京因融资环境好、产业生态优等优势,企业数量领先。已上市的百强企业占比 57%,“专精特新”企业与高新技术企业成为推动行业大模型落地的重要力量。
大模型行业竞争不仅体现在技术和资金投入上,还体现在生态开放能力方面。例如,平台争相开放生态,协同办公生态竞争加剧,钉钉等平台面临来自各方的竞争挑战。同时,行业对于大模型的竞争也在特定行业应用中展开,行业大模型通过轻量化设计,在保持性能的同时减少参数规模,体现出“够用”即可的特征。
4. 替代品威胁
大模型行业面临一定的替代品威胁。
一方面,行业内不断有新的技术探索,如寻找 GPU 替代品、探索不同的开发路径如向量数据库和 RAG 路线等,这些都可能在一定程度上改变大模型的开发和应用模式。
另一方面,许多人认为 99%的行业大模型都可能被替代,目前在一些简单场景下,如翻译、文档整理、数据标注等,大模型配合智能体框架已做得较好,这些领域的工作相对容易被替代。
此外,随着编程范式的转变,未来复杂任务可能通过智能体平台由多个协同工作的智能体完成,这可能改变程序员的传统工作方式,对大模型在某些领域的应用构成替代威胁。
同时,国产大模型在 ChatGPT 终止服务中国后,有望成为替代品,这也说明行业内不同产品之间存在替代的可能性。
而且,低代码平台虽然在某些方面有一定优势,但与原生开发相比存在灵活性不足、数据隐私和安全问题、性能瓶颈及优化受限等问题,原生开发在一定程度上也可能替代低代码平台在大模型开发中的作用。
另外,斯坦福大学 AI 团队主导的 Llama3 – V 开源模型被指套壳抄袭国内清华与面壁智能的开源模型,也反映出行业内产品的可替代性。
最后,AI 大模型时代下,一些职业如销售业务、财务、软件、行政等已开始受冲击,这也暗示着新的技术和模式可能会替代现有的大模型在这些领域的应用。
5. 潜在进入者威胁
大模型行业目前面临着一定的潜在进入者威胁。
一方面,大模型行业需要大量的数据、强大的计算力以及先进的算法,这在一定程度上构成了进入壁垒。例如,OpenAI 在数据收集、标注、清洗等环节持续投入,还借助微软搭建了定制化算力集群,拥有近 3 万块英伟达 GPU。这对于新进入者来说,需要投入巨额资金来获取相应的资源。
另一方面,大模型行业竞争激烈,现有企业在技术研发、市场份额争夺等方面积极布局,对潜在进入者反应强烈。目前,行业内已有众多企业发布大模型产品,如阿里通义千问、百度文心一言等,这些企业在技术积累和市场认知度上具有一定优势。
此外,大模型仍面临四大挑战,包括群体智能与安全可控、个性化和隐私保护、关键性任务和动态适应性标准、基础设施和架构改造等,新进入者需要具备应对这些挑战的能力。
同时,大模型行业还存在价格战,大型科技公司的激烈竞争使得市场格局不断变化,这也给潜在进入者带来了不确定性。总体而言,大模型行业虽有一定进入壁垒,但潜在进入者仍可能带来新的生产能力和市场竞争。