华泰证券：国产模型厂商进入API“价格战” 利好AI应用开发

发布时间 2024-6-11 07:39

更新时间 2024-6-11 08:05

© Reuters. 华泰证券：国产模型厂商进入API“价格战” 利好AI应用开发

BIDU

0700

BABA

智通财经APP获悉，华泰证券发布研报称，5月6日，DeepSeek发布最新MoE模型DeepSeek-V2（32K上下文），刷新了模型API定价：输入￥1元/M tokens、输出￥2元/M tokens。紧接着，智谱、阿里(09988)、百度(09888)、腾讯(00700)、讯飞(002230.SZ)等厂商均宣布旗下模型API降价，部分降价幅度高达100%。华泰证券深入拆解了各家API产品矩阵，发现降价的主要是轻量级模型，对于高并发B端用户或影响不大。华泰证券认为，API降价将吸引更多的ISV开发AI相关应用，有望提高Super App出现概率，建议关注算力和应用相关公司。

华泰证券主要观点如下：

降价以入门级轻量API为主，可以从技术优化和生态抢占来解释

降价厂商中，智谱、百度和讯飞主要降价产品为轻量版；阿里和腾讯则将旗下全部模型进行降价，降价幅度不等。字节为首次定价，价格较低。可以看出，降价幅度和范围较大的主要是互联网企业，其资源更加丰富。分析降价原因，一方面，DeepSeek V2证明了，确实可以通过注意力机制优化，大大减少所需缓存的量，降低成本和提高效率。另一方面，即使没有技术上的降价逻辑，通过降价手段吸引开发者，目前看仍是抢占生态的重要手段。

从技术层面降低模型推理成本，核心在于优化KV cache

目前，大模型的长文本支持能力已成为趋势。在推理长文本时，需要首先将文本预填充到GPU的HBM中，然后再解码出token。其中预填充速度主要受GPU计算能力影响，解码速度受HBM带宽影响。当文本很长时，KV cache将占用HBM相当大的空间，导致用户并发性下降，且解码耗时更长。用户并发性下降，还将带来新的问题，即需要从HBM上“卸载”暂时不用的KV cache，再“加载”下一个用户的KV cache，带来新的耗时。因此，降低KV cache是优化关键。

典型优化方法：压缩KV cache，或采用全局KV cache

该行研究了近期DeepSeek V2和微软的YOCO典型的KV cache压缩方法，代表两种流派。DeepSeek V2引入多头隐注意力（MLA）机制，不再缓存全部的KV，而是用隐向量来压缩KV，与Transformer原始的多头注意力相比，KV cache可以减少90%以上。微软的YOCO则将Decoder架构一切为二，下半部分负责用高效的注意力机制产生全局KV cache，上半部分则直接使用全局KV cache，不再需要额外计算，也大大降低了缓存量。

模型降价有望利好算力和应用，建议关注相关产业链公司

该行认为，模型降价将吸引更多的开发者开发AI应用，或进一步提振算力需求，提升Super App出现概率，建议关注：1）AI服务器相关公司；2）AI应用相关公司。

查看所有评论（0）0

名称	最新价	涨跌幅	交易量
领益智造	7.12	+10.05%	595.56M
东方财富	10.56	-6.88%	405.63M
中兴通讯	27.97	+4.06%	128.39M
中国船舶	40.71	+7.84%	95.21M
立讯精密	39.31	+1.18%	93.37M
赛力斯	91.12	+7.85%	71.54M
贵州茅台	1,467.39	-1.55%	3.86M

名称	最新价	涨跌幅	交易量
东杰智能	5.74	+20.08%	19.25M
田中精机	22.30	+20.02%	22.04M
Henan Carve Electronics Technology	22.18	+20.02%	11.05M
欣灵电气	24.71	+20.01%	6.56M
吉药控股	1.02	+20.00%	62.52M
北方长龙	32.28	+20.00%	13.64M
捷邦科技	32.54	+19.99%	6.25M

名称	最新价	涨跌幅	交易量
百华悦邦	14.02	-15.85%	30.77M
线上线下	28.02	-15.53%	7.93M
飞天诚信	10.43	-14.72%	70.78M
金道科技	24.38	-10.66%	15.67M
新湖中宝	1.58	-10.23%	285.30M
鹏都农牧	0.440	-10.20%	5.01M
科林电气	24.26	-10.02%	6.36M

热门股票

名称	最新价	涨跌幅	交易量
新电信SingTel	2.750	0.00%	33.73M
新加坡航空公司SIA	6.90	-0.72%	8.29M
贵州茅台	1,467.39	-1.55%	3.86M
赛力斯	91.12	+7.85%	71.54M
小米集团－Ｗ	16.48	-0.36%	86.77M

显示更多

安装我们的APP扫描二维码，安装APP

风险批露: 交易股票、外汇、商品、期货、债券、基金等金融工具或加密货币属高风险行为，这些风险包括损失您的部分或全部投资金额，所以交易并非适合所有投资者。加密货币价格极易波动，可能受金融、监管或政治事件等外部因素的影响。保证金交易会放大金融风险。
在决定交易任何金融工具或加密货币前，您应当充分了解与金融市场交易相关的风险和成本，并谨慎考虑您的投资目标、经验水平以及风险偏好，必要时应当寻求专业意见。
Fusion Media提醒您，本网站所含数据未必实时、准确。本网站的数据和价格未必由市场或交易所提供，而可能由做市商提供，所以价格可能并不准确且可能与实际市场价格行情存在差异。即该价格仅为指示性价格，反映行情走势，不宜为交易目的使用。对于您因交易行为或依赖本网站所含信息所导致的任何损失，Fusion Media及本网站所含数据的提供商不承担责任。
未经Fusion Media及/或数据提供商书面许可，禁止使用、存储、复制、展现、修改、传播或分发本网站所含数据。提供本网站所含数据的供应商及交易所保留其所有知识产权。
本网站的广告客户可能会根据您与广告或广告主的互动情况，向Fusion Media支付费用。
本协议的英文版本系主要版本。如英文版本与中文版本存在差异，以英文版本为准。

热门搜索

请尝试其他搜索

华泰证券：国产模型厂商进入API“价格战” 利好AI应用开发

最新评论

热门股票