比英伟达(NVDA.US)GPU快20倍! Cerebras“出炉”全球最快AI推理解决方案

股市

发布时间 2024-8-28 10:31

更新时间 2024-8-28 11:08

查看所有评论（0）0

© Reuters. 比英伟达(NVDA.US)GPU快20倍! Cerebras“出炉”全球最快AI推理解决方案

INTC

MSFT

TEF

NVDA

智通财经APP获悉，人工智能初创公司Cerebras今日宣布推出Cerebras Inference，据称是世界上最快的人工智能推理解决方案。该公司表示:“Cerebras　Inference为Llama 3.18B每秒提供1800个token，为Llama 3.170B每秒提供450个token，比基于英伟达(NVDA.US)GPU的超大规模云快20倍。”

Cerebras Inference由第三代晶圆级引擎(WaferScaleEngine)提供动力，同时由于消除了内存带宽障碍，速度更快。Cerebras称其GPU解决方案的推理成本是微软Azure云计算平台的三分之一，而使用的功率是微软Azure云计算平台的六分之一。

该公司表示:“Cerebras通过制造世界上最大的芯片，并将整个模型存储在芯片上，解决了内存带宽瓶颈。”“凭借我们独特的晶圆级设计，我们能够在单个芯片上集成44GB的SRAM，从而消除了对外部存储器和连接外部存储器和计算机的慢速通道的需求。”

提供人工智能模型独立分析的人工智能分析公司(Artificial Analysis)联合创始人兼首席执行官MicahHill-Smith表示:“Cerebras在人工智能推理基准方面处于领先地位。Cerebras为Meta的Llama3.18B和70BAI模型提供的速度比基于GPU的解决方案快一个数量级。我们在Llama3.18B上测量的速度超过每秒1800个输出token，在Llama3.170B上测量的速度超过每秒446个输出token，这是这些基准测试中的新记录。”

他称，“凭借推至性能前沿的速度和具有竞争力的价格，Cerebras Inference对具有实时或大容量需求的人工智能应用程序的开发人员特别有吸引力。”

值得一提的是，这可能会在整个人工智能生态系统中产生连锁反应。随着推理变得更快、更高效，开发人员将能够突破人工智能的极限。曾经因硬件限制而受阻的应用程序现在可能会蓬勃发展，并激发出此前被判定为不可能的创新。不过， J. Gold Associates 分析师杰克·戈尔德 (Jack Gold) 也提出，“但在我们获得更具体的现实基准和大规模运营之前，现在估计它到底有多优越还为时过早。”

本月早些时候，Cerebras提交了首次公开募股(IPO)申请，预计将于今年下半年上市。该公司最近还任命了两名新的董事会成员:曾在IBM( IBM (NYSE:IBM).US)、英特尔(INTC.US)和西班牙电信(TEF.US)担任高管的格伦达•多查克;以及VMware和Proofpoint前首席财务官保罗·奥维尔(Paul Auvil)。

这家初创公司还向上市迈出了重要的一步，本月早些时候聘请鲍勃•科明(Bob Komin)担任首席财务官。Komin曾在Sunrun担任首席财务官，领导了该公司的IPO流程。他还曾在被雅虎收购的Flurry和被微软(MSFT,US)收购的TellmeNetworks担任CFO。

Cerebras首席执行官兼联合创始人AndrewFeldman说，“鲍勃在他的职业生涯中一直是一个关键的运营领导者，在几家公司担任创业高管，这些公司发明了重大的技术和商业模式创新，并迅速成长为行业领导者。他在成长期和上市公司的财务领导方面的丰富经验对Cerebras来说是非常宝贵的。”

查看所有评论（0）0

最新评论

上证指数

3,368.07

-1.96

-0.06%

富时中国A50指数

13,318.56

-97.14

-0.72%

香港恒生指数

19,720.70

-31.81

-0.16%

日经225

38,723.50

-85.00

-0.22%

US 30

42,829.00

+486.8

+1.15%

US 500

5,930.80

+63.7

+1.09%

美元指数期货

107.57

-0.582

-0.54%

最热门文章

资讯

分析评论

美股盘前：纳指期货跌约300点七巨头集体下跌特斯拉跌5%

提供者 Investing.co...

2024年12月20日

今日财经市场5件大事：美联储最爱的PCE通胀数据来袭，美国政府又要停摆？

提供者 Investing.co...

2024年12月20日

比特币将重演「互联网泡沫」破裂？全球超30万人爆仓，爆仓金额超10亿美元

提供者 Investing.co...

2024年12月19日

瑞银：2025年最值得关注的25只美国股票

提供者 Investing.co...

2024年12月19日

史上规模最大“三巫聚首日”来袭！价值6.6万亿美元期权即将到期

提供者智通财经

2024年12月19日

更多资讯

股市走势

名称	最新价	涨跌幅	交易量
东方财富	26.11	+1.01%	439.03M
中兴通讯	37.38	-1.11%	399.56M
视觉中国	30.99	+2.01%	224.73M
IEIT SYSTEMS	51.56	+0.72%	201.43M
中芯国际	94.28	+10.35%	176.77M
兆易创新	113.20	+0.94%	66.83M
宁德时代	262.71	-2.62%	27.74M

名称	最新价	涨跌幅	交易量
光云科技	13.90	+20.03%	83.19M
天键股份	52.54	+20.01%	9.45M
灿芯股份	89.17	+20.00%	10.01M
电声股份	16.20	+20.00%	44.86M
青木股份	64.10	+19.99%	4.51M
锴威特	41.36	+19.99%	6.02M
华灿光电	7.75	+19.97%	60.36M

名称	最新价	涨跌幅	交易量
中百集团	8.42	-10.04%	13.99M
新宏泽	8.60	-10.04%	22.45M
星期六	8.69	-10.04%	183.06M
博瑞传播	5.85	-10.00%	146.56M
上海凤凰	18.80	-10.00%	92.24M
诺邦股份	15.95	-9.99%	28.61M
日丰股份	13.07	-9.99%	4.03M

热门股票

名称	最新价	涨跌幅	交易量
顶级手套	1.32	-5.71%	32.67M
YTL Power Int	4.140	+1.47%	73.32M
YTL Corp	2.580	+1.18%	120.90M
腾讯控股	426.40	+2.70%	44.83M
阿里巴巴-SW	80.10	-3.44%	132.89M

显示更多

安装我们的APP扫描二维码，安装APP

风险批露: 交易股票、外汇、商品、期货、债券、基金等金融工具或加密货币属高风险行为，这些风险包括损失您的部分或全部投资金额，所以交易并非适合所有投资者。加密货币价格极易波动，可能受金融、监管或政治事件等外部因素的影响。保证金交易会放大金融风险。
在决定交易任何金融工具或加密货币前，您应当充分了解与金融市场交易相关的风险和成本，并谨慎考虑您的投资目标、经验水平以及风险偏好，必要时应当寻求专业意见。
Fusion Media提醒您，本网站所含数据未必实时、准确。本网站的数据和价格未必由市场或交易所提供，而可能由做市商提供，所以价格可能并不准确且可能与实际市场价格行情存在差异。即该价格仅为指示性价格，反映行情走势，不宜为交易目的使用。对于您因交易行为或依赖本网站所含信息所导致的任何损失，Fusion Media及本网站所含数据的提供商不承担责任。
未经Fusion Media及/或数据提供商书面许可，禁止使用、存储、复制、展现、修改、传播或分发本网站所含数据。提供本网站所含数据的供应商及交易所保留其所有知识产权。
本网站的广告客户可能会根据您与广告或广告主的互动情况，向Fusion Media支付费用。
本协议的英文版本系主要版本。如英文版本与中文版本存在差异，以英文版本为准。

热门搜索

请尝试其他搜索

比英伟达(NVDA.US)GPU快20倍! Cerebras“出炉”全球最快AI推理解决方案

最新评论

热门股票