GPT-4 是 8x2200 亿参数的混合模型?这个小道消息今天传疯了 世界新视野
机器之心报道
(相关资料图)
编辑:吴昕
George Hotz:除了苹果之外,大部分公司保密的原因都不是在隐藏什么黑科技,而是在隐藏一些「不那么酷」的东西。
「GPT-4 的参数量高达 100 万亿。」相信很多人还记得这个年初刷屏的「重磅」消息和一张被病毒式传播的图表。
不过很快,OpenAI 的 CEO Sam Altman 就出来辟谣,证实这是一条假消息,并表示,「关于 GPT-4 的谣言都很荒谬。我甚至不知道这从何而起。」实际上,许多人相信并传播这样的谣言是因为近年来 AI 社区不断在增加 AI 模型的参数规模。谷歌在 2021 年 1 月发布的 Switch Transformer 就把 AI 大模型参数量拉高到了 1.6 万亿。在此之后,很多机构也陆续推出了自己的万亿参数大模型。据此,人们有充分的理由相信,GPT-4 将是一个万亿参数的巨量模型,100 万亿参数也不是不可能。
虽然 Sam Altman 的辟谣帮我们去掉了一个错误答案,但他背后的 OpenAI 团队一直对 GPT-4 的真实参数量守口如瓶,就连 GPT-4 的官方技术报告也没透露任何信息。
直到最近,这个谜团疑似被「天才黑客」乔治霍兹(George Hotz)捅破了。
乔治霍兹因 17 岁破解 iPhone、21 岁攻陷索尼 PS3 而闻名,目前是一家研发自动驾驶辅助系统的公司(comma.ai)的老板。
最近,他接受了一家名为 Latent Space 的 AI 技术播客的采访。在采访中,他谈到了 GPT-4,称 GPT-4 其实是一个混合模型。具体来说,它采用了由 8 个专家模型组成的集成系统,每个专家模型都有 2200 亿个参数(比 GPT-3 的 1750 亿参数量略多一些),并且这些模型经过了针对不同数据和任务分布的训练。
在这段播客播出之后,PyTorch 创建者 Soumith Chintala 表示自己似乎听过同样的「传闻」,很多人可能也听过,但只有 George Hotz 在公开场合将其说了出来。「混合模型是你在无计可施的时候才会考虑的选项,」George Hotz 调侃说,「混合模型的出现是因为无法让模型的参数规模超过 2200 亿。他们希望模型变得更好,但如果仅仅是训练时间更长,效果已经递减。因此,他们采用了八个专家模型来提高性能。」至于这个混合模型是以什么形式工作的,George Hotz 并没有详细说明。为什么 OpenAI 对此讳莫如深呢?George Hotz 认为,除了苹果之外,大部分公司保密的原因都不是在隐藏什么黑科技,而是在隐藏一些「不那么酷」的东西,不想让别人知道「只要花 8 倍的钱你也能得到这个模型」。对于未来的趋势,他认为,人们会训练规模较小的模型,并通过长时间的微调和发现各种技巧来提升性能。他提到,与过去相比,训练效果已经明显提升,尽管计算资源没有变化,这表明训练方法的改进起到了很大作用。
目前,George Hotz 关于 GPT-4 的「爆料」已经在推特上得到了广泛传播。
有人从中得到了灵感,声称要训练一个 LLaMA 集合来对抗 GPT-4。还有人说,如果真的像 George Hotz 说的那样,GPT-4 是一个由 8 个 2200 亿参数的专家模型组合的混合模型,那很难想象背后的推理成本有多高。需要指出的是,由于 George Hotz 并未提及消息来源,我们目前无法判断以上论断是否正确。有更多线索的读者欢迎在评论区留言。George Hotz 采访内容。GPT-4 相关内容在 49:00 前后。视频来源:https://www.youtube.com/watch?v=K5iDUZPx60E&t=3030s
参考链接:https://twitter.com/soumithchintala/status/1671267150101721090
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
关键词:
相关阅读
-
GPT-4 是 8x2200 亿参数的混合模型?...
机器之心报道编辑:吴昕GeorgeHotz:除了苹果之外,大部分公司保密的原 -
异世界奇妙龙物语
楔子 龙回应了你的“龙龙,XXX,火,XX,烧,一起。”巨大的洞窟中... -
米体:纽卡准备6000万欧报价托纳利,切...
直播吧6月21日讯据《米兰体育报》报道,纽卡斯尔准备6000万欧元报价托 -
上海戏剧学院2023年应届毕业生都去哪儿了?
“北京人民艺术剧院冯远征院长给我发来短信,今年北京人艺2023年应... -
滴滴出行九江同日收7罚单 因服务车辆未...
滴滴出行九江同日收7罚单因服务车辆未取得合法资质 -
内蒙古新井煤矿事故失联者全部遇难
新华社呼和浩特6月21日电(记者王靖)记者21日从内蒙古自治区应急管理 -
国会大厦骚乱事件中一使用电击枪袭警的...
当地时间6月21日,据《国会山报》报道,一名叫丹尼尔·罗德里格斯的... -
环球快资讯丨山东省戒毒管理局举办戒毒...
记者栾海明通讯员王邵茹在第36个国际禁毒日到来之际,为充分展现全省司 -
近五年“最火”端午开启:预计1亿人次出...
预订情况来看,飞猪数据显示,在6月初,端午假期首日及前一日的火车票 -
《高德地图》查看两个地方的距离教程 ...
高德地图怎么查两个地方的距离?有时我们需要知道两个地点之间的距离具 -
淮安市国产普通化妆品年度报告率达100%|...
淮安市国产普通化妆品年度报告率达100%为保障化妆品注册备案工作顺利推 -
扩散|延长运营!调图!今起,天津地铁...
从天津轨道交通集团获悉,为进一步满足广大市民乘客节假日出行需求,6 -
奉天子以令不臣原文(奉天子以令不臣)...
奉天子以令不臣原文,奉天子以令不臣这个很多人还不知道,现在让我们一 -
每日看点!悲伤透露被IG解约!imp相信JKL...
时隔多日,那局比赛的胜负也引起连锁反应,悲伤在粉丝群透露,IG已经找 -
全球观察:枭怎么读 拼音_枭怎么读
1、枭的读音是:xiāo,具体意思如下:勇猛;强悍:~将。2、~骑。3、 -
江西东乡:网箱养殖黄鳝 生态养殖富农
养殖户正在查看网箱里的黄鳝生长情况。近日,在江西省抚州市东乡区杨桥 -
当前视点!康希诺董秘回复: 根据中国证...
康希诺(688185)06月21日在投资者关系平台上答复了投资者关心的问题。 -
美联储博斯蒂克:此前银行倒闭所担忧的...
每经AI快讯,美联储博斯蒂克:此前银行倒闭所担忧的传染效应“并未... -
【环球新视野】成都有哪些便宜的酒店比...
关于成都有哪些便宜的酒店比较好点的内容,包含成都有哪些酒店比较好, -
昆明一家10人食用,9人中毒!这条云南人...
夏季到来,雨水增多越来越多野生菌破土而出云南人最喜欢的食菌季来了但