英伟达被“偷家”?全新AI芯片横空出世速度比GPU快十倍

sansa2025 sansa2025 2025-08-07 企业 阅读: 4
摘要: 《科创板日报》2月20日讯 芯片推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天,一家名为Groq的初创公司在AI圈爆火。Groq读音与马斯克的聊天机器人Grok极为接近,成立时间却远远早于后者。其成立于2016年,定位为一家人工智能解决方案公司。在Groq的创始团队中,有
《科创板日报》2月20日讯 芯片推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天,一家名为Groq的初创公司在AI圈爆火。Groq读音与马斯克的聊天机器人Grok极为接近,成立时间却远远早于后者。其成立于2016年,定位为一家人工智能解决方案公司。在Groq的创始团队中,有8人来自仅有10人的谷歌早期TPU核心设计团队。例如,Groq创始人兼CEO Jonathan Ross设计并实现了TPU原始芯片的核心元件,TPU的研发工作中有20%都由他完成,之后他又加入Google X快速评估团队,为谷歌母公司Alphabet设计并孵化了新Bets。虽然团队脱胎于谷歌TPU,但Groq既没有选择TPU这条路,也没有看中GPU、CPU等路线。Groq选择了一个全新的系统路线——LPU(Language Processing Unit,语言处理单元)。“我们(做的)不是大模型,”Groq表示,“我们的LPU推理引擎是一种新型端到端处理单元系统,可为AI大模型等计算密集型应用提供最快的推理速度。”从这里不难看出,“速度”是Groq的产品强调的特点,而“推理”是其主打的细分领域。Groq也的确做到了“快”,根据Anyscale的LLMPerf排行显示,在Groq LPU推理引擎上运行的Llama 2 70B,输出tokens吞吐量快了18倍,由于其他所有云推理供应商。第三方机构artificialanalysis.ai给出的测评结果也显示,Groq的吞吐量速度称得上是“遥遥领先”。为了证明自家芯片的能力,Groq还在官网发布了免费的大模型服务,包括三个开源大模型,Mixtral 8×7B-32K、Llama2-70B-4K和Mistral 7B - 8K,目前前两个已开放使用。图|Groq(Llama 2)对比ChatGPT(来源:X用户JayScambler)LPU旨在克服两个大模型瓶颈:计算密度和内存带宽。据Groq介绍,在 LLM 方面,LPU较GPU/CPU拥有更强大的算力,从而减少了每个单词的计算时间,可以更快地生成文本序列。此外,由于消除了外部内存瓶颈,LPU推理引擎在大模型上的性能比GPU高出几个数量级。据悉,Groq芯片完全抛开了英伟达GPU颇为倚仗的HBM与CoWoS封装,其采用14nm制程,搭载230MB SRAM,内存带宽达到80TB/s。算力方面,其整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。值得注意的是,“快”是Groq芯片主打的优点,也是其使用的SRAM最突出的强项之一。SRAM是目前读写最快的存储设备之一,但其价格昂贵,因此仅在要求苛刻的地方使用,譬如CPU一级缓冲、二级缓冲。华西证券指出,可用于存算一体的成熟存储器有Nor Flash、SRAM、DRAM、RRAM、MRAM等。其中,SRAM在速度方面和能效比方面具有优势,特别是在存内逻辑技术发展起来之后,具有明显的高能效和高精度特点。SRAM、RRAM有望成为云端存算一体主流介质。
英伟达被“偷家”?全新AI芯片横空出世速度比GPU快十倍
(图片来源网络,侵删)
英伟达被“偷家”?全新AI芯片横空出世速度比GPU快十倍
(图片来源网络,侵删)
其他相关
《狂飙》刀哥:一盘炒粉,他记恨20年!

《狂飙》刀哥:一盘炒粉,他记恨20年!

作者: sansa2025 时间:2025-08-07 阅读: 13
一盘炒粉,刀哥记恨20年!这件小事,他居然记了这么多年啊!唐小龙因开设地下赌场和放高利贷,安欣带领警队实施抓捕,唐小龙情急之下爬上高台,被警队众人围堵。无处可逃的唐小龙情绪激动,对着安欣咆哮,表示是被安欣逼的!回忆起自己在旧厂街当“卫生员”时,曾不受安欣待见,他热心迎接安欣,想坐下来一起吃炒粉,却被安欣拒之于千里之外,把板凳撤走,没让他上桌,至今仍耿耿于怀。原来当初没有让他留下来炒粉,这件事居然让...
一文看懂苹果秋季新品发布会:iPhone15系列来了

一文看懂苹果秋季新品发布会:iPhone15系列来了

作者: sansa2025 时间:2025-08-07 阅读: 16
手机讯:2023年9月13日凌晨,苹果一年一度的秋季新品发布会如期举行,今年大会主题为「好奇心上头」,主视觉中的苹果logo元素由灰色及蓝色粒子组成,按照经验来看,这些都与新品的变化息息相关。当然,基于欧盟禁令的威胁,iPhone 15系列本次有极大可能放弃Lighting接口,转用Type-C接口。加上此前曝光的潜望长焦镜头的加入、中框材质的更新、全系灵动岛的普及,以及静音按键方案的变化,都让本...
个人养老金巨亏,还值得继续投入吗?

个人养老金巨亏,还值得继续投入吗?

作者: sansa2025 时间:2025-08-07 阅读: 13
最近股市暴跌,我不但在股市挨打,还因为此前推荐朋友买个人养老金被抱怨了。我打开自己的个人养老金,确实是惨。我买的三只养老基金,截至2月3日亏损幅度分别是华夏养老2045三年持有(FOF)-19.07%,中欧预见养老2050五年持有(FOF)-25.71%,兴全安泰积极养老五年持有(FOF)-12.95%,我看一下持有时间408天了,整体体验确实很差。2022年11月份,我国正式开通个人养老金业务,...
今日南财市场情绪指数为48.3,市场投资热度明显提升

今日南财市场情绪指数为48.3,市场投资热度明显提升

作者: sansa2025 时间:2025-08-07 阅读: 14
今日南财市场情绪指数为48.3,较前一交易日42.0大幅上涨,市场投资热度明显提升。情绪指数由以下四大指标构成:1.50ETF期权隐含波动率今日该指标值为15.04,目前该指标处于近一年较低区间,说明投资者认为未来市场波动处于较低水平。50ETF期权波动率(原中国波指iVIX,也称作恐慌指数),指数与上证指数存在负相关性,但不绝对。指数点位越高,代表投资者预期后市波动程度愈加激烈;指数点位越低,代...
他俩要是有孩子,这眼睛得多大?

他俩要是有孩子,这眼睛得多大?

作者: sansa2025 时间:2025-08-07 阅读: 12
笑疯了!原来,宅斗的精髓是魔法互轰!近日,业内首部种田剧《田耕纪》开播后,剧中各种极品亲戚的极品操作更是直击观众乳腺,不过好在,这次田曦薇饰演的女主连蔓儿是懂“打怪升级”的,让大家也体会了一把爽文的快感。《田耕纪》以农家田园生活作为故事背景,讲述了女主连蔓儿改变自己的命运,实现家庭的自立自强的故事。在集齐战士沈诺、输出连蔓儿、奶妈幼恒哥之后,好戏开场了。剧中连蔓儿堪称商业奇才,在发现小说里说的猪下...
勒索团伙声称窃取3000份SpaceX火箭设计图威胁卖给竞争对手

勒索团伙声称窃取3000份SpaceX火箭设计图威胁卖给竞争对手

作者: sansa2025 时间:2025-08-07 阅读: 13
3月17日消息,勒索软件团伙LockBit声称窃取了埃隆·马斯克(Elon Musk)旗下SpaceX火箭团队的3000份设计图纸,并威胁要将它们出售给其竞争对手。本周早些时候,LockBit向马斯克告知了此事,并警告称将在3月20日举行的重大活动上公开或拍卖这些经过认证的设计图。该团伙在暗网上发帖说:“我们感到非常幸运,SpaceX的承包商真的很健谈。我认为,这些材料会很快找到买家。”帖子中还称...
我来说两句

年度爆文