英伟达被“偷家”?全新AI芯片横空出世速度比GPU快十倍

sansa2025 sansa2025 2025-08-07 企业 阅读: 31
摘要: 《科创板日报》2月20日讯 芯片推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天,一家名为Groq的初创公司在AI圈爆火。Groq读音与马斯克的聊天机器人Grok极为接近,成立时间却远远早于后者。其成立于2016年,定位为一家人工智能解决方案公司。在Groq的创始团队中,有
《科创板日报》2月20日讯 芯片推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天,一家名为Groq的初创公司在AI圈爆火。Groq读音与马斯克的聊天机器人Grok极为接近,成立时间却远远早于后者。其成立于2016年,定位为一家人工智能解决方案公司。在Groq的创始团队中,有8人来自仅有10人的谷歌早期TPU核心设计团队。例如,Groq创始人兼CEO Jonathan Ross设计并实现了TPU原始芯片的核心元件,TPU的研发工作中有20%都由他完成,之后他又加入Google X快速评估团队,为谷歌母公司Alphabet设计并孵化了新Bets。虽然团队脱胎于谷歌TPU,但Groq既没有选择TPU这条路,也没有看中GPU、CPU等路线。Groq选择了一个全新的系统路线——LPU(Language Processing Unit,语言处理单元)。“我们(做的)不是大模型,”Groq表示,“我们的LPU推理引擎是一种新型端到端处理单元系统,可为AI大模型等计算密集型应用提供最快的推理速度。”从这里不难看出,“速度”是Groq的产品强调的特点,而“推理”是其主打的细分领域。Groq也的确做到了“快”,根据Anyscale的LLMPerf排行显示,在Groq LPU推理引擎上运行的Llama 2 70B,输出tokens吞吐量快了18倍,由于其他所有云推理供应商。第三方机构artificialanalysis.ai给出的测评结果也显示,Groq的吞吐量速度称得上是“遥遥领先”。为了证明自家芯片的能力,Groq还在官网发布了免费的大模型服务,包括三个开源大模型,Mixtral 8×7B-32K、Llama2-70B-4K和Mistral 7B - 8K,目前前两个已开放使用。图|Groq(Llama 2)对比ChatGPT(来源:X用户JayScambler)LPU旨在克服两个大模型瓶颈:计算密度和内存带宽。据Groq介绍,在 LLM 方面,LPU较GPU/CPU拥有更强大的算力,从而减少了每个单词的计算时间,可以更快地生成文本序列。此外,由于消除了外部内存瓶颈,LPU推理引擎在大模型上的性能比GPU高出几个数量级。据悉,Groq芯片完全抛开了英伟达GPU颇为倚仗的HBM与CoWoS封装,其采用14nm制程,搭载230MB SRAM,内存带宽达到80TB/s。算力方面,其整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。值得注意的是,“快”是Groq芯片主打的优点,也是其使用的SRAM最突出的强项之一。SRAM是目前读写最快的存储设备之一,但其价格昂贵,因此仅在要求苛刻的地方使用,譬如CPU一级缓冲、二级缓冲。华西证券指出,可用于存算一体的成熟存储器有Nor Flash、SRAM、DRAM、RRAM、MRAM等。其中,SRAM在速度方面和能效比方面具有优势,特别是在存内逻辑技术发展起来之后,具有明显的高能效和高精度特点。SRAM、RRAM有望成为云端存算一体主流介质。
英伟达被“偷家”?全新AI芯片横空出世速度比GPU快十倍
(图片来源网络,侵删)
英伟达被“偷家”?全新AI芯片横空出世速度比GPU快十倍
(图片来源网络,侵删)
其他相关
一加Ace2Pro即将官宣李杰:竞争力非常强行业天花板级别

一加Ace2Pro即将官宣李杰:竞争力非常强行业天花板级别

作者: sansa2025 时间:2025-08-07 阅读: 73
快科技7月26日消息,一加Ace 2 Pro获得入网许可,型号是PJA110,支持150W闪充。与此同时,一加宣布将在今天10点公布重要信息,这次一加应该是为Ace 2 Pro预热,新品将在8月份正式发布。一加Ace 2一加中国区总裁李杰暗示,一加Ace 2 Pro竞争力非常强,有不少是行业天花板级别的,大家可以期待一下。据悉,一加Ace 2 Pro搭载高通骁龙8 Gen2移动平台。这是一加第一次...
今晚,按兵不动!

今晚,按兵不动!

作者: sansa2025 时间:2025-08-07 阅读: 107
隔夜,现货黄金在一周高点下方企稳,日内最高触及1975.19美元,最低触及1955.22美元,最终收报于1959.14美元。今日欧市盘中,黄金小幅上涨,目前在1968美元附近徘徊。中国资产爆发!隔夜,美股三大指数高开后走势震荡,纳斯达克指数、标普500指数盘中一度转跌。Wind数据显示,截至收盘,道琼斯工业指数、纳斯达克指数、标普500指数分别涨0.47%、0.07%、0.16%。美股此番走势,主...
价格腰斩!有人一箱一箱往家搬,紧急提醒:已有多人中招

价格腰斩!有人一箱一箱往家搬,紧急提醒:已有多人中招

作者: sansa2025 时间:2025-08-07 阅读: 77
近期,随着海运车厘子大量到货,不少市场的车厘子价格大幅下调。相比车厘子刚上市的时候,价格可以说是“拦腰斩”。福建厦门某水果批发市场批发商:刚开始一件(十斤)是1000多元 ,现在打三折多了。随着车厘子的降价最近有浙江网友发帖称车厘子买多了,家里人不太吃怕坏了所以自己一下子吃了两斤结果又吐又拉该网友表示一吃就停不下来结果吃过量导致上吐下泻她说以后不敢吃了要不是今年便宜自己也不会吃那么多由于市价一降再...
剧透!《中国说唱巅峰对决》名单出炉!大量Rapper即将决战上海

剧透!《中国说唱巅峰对决》名单出炉!大量Rapper即将决战上海

作者: sansa2025 时间:2025-08-07 阅读: 71
终于来了。《中国说唱巅峰对决》已知参赛选手名单出炉。嘻笑堂经过第一轮统计,目前已经有接近20位Rapper确认参加节目。热狗、GAI、法老、瘦子、艾热、杨和苏、早安、黄旭、李佳隆、盛宇、PSY.P、宝石gem、派克特、VaVa、雾都、Bridge、威尔、艾福杰尼名单是目前确认人员,我们还在不断更新中,也欢迎大家勘误和补充。而与此同时,两位热单Rapper,王以太和刘聪放弃参加这次《中国说唱巅峰对决...
外媒:中国发布新一代国产超算系统

外媒:中国发布新一代国产超算系统

作者: sansa2025 时间:2025-08-07 阅读: 66
参考消息网12月7日报道 据路透社12月6日报道,中国发布新一代国产超级计算系统,其能力比之前的版本强大数倍。这一超级计算机系统名为“天河星逸”,由国家超算广州中心在广州举行的一次行业活动上发布。据介绍,“天河星逸”采用国产先进计算架构,在通用CPU计算能力、网络能力、存储能力以及应用服务能力等多方面较中国超级计算机“天河二号”实现倍增。“天河二号”由国防科技大学研制,在国家超算广州中心运行。“天...
大V曝直播数据造假:虚假繁荣数据全靠水军刷,真实签收率仅10%

大V曝直播数据造假:虚假繁荣数据全靠水军刷,真实签收率仅10%

作者: sansa2025 时间:2025-08-07 阅读: 68
VIA:自我的SZ知道直播数据很多是假的,但没想到这么假。杭州做直播的朋友告诉我,他的朋友给抖音很多大主播做供货某品,一场下来卖个几千万,他朋友意气风发开发新款,大有一种一年上市的气吞山河。刚开始一二千平米的公司发展到一栋楼,到现在又缩回了一二千平米。原来直播的很多数据是有人刷的不说,退货率也高达70%。做了一年多,除了贡献漂亮的GMV数据外,自己亏的爹妈都不认识了。现在不给主播供货了,自己做线下...
我来说两句

年度爆文