GPT-5改名叫“Gobi”?OpenAI想抢在谷歌Gemini前抢发多模态模型
大型语言模型之间的竞争尚未结束,多模态大模型的战争就已经开始。
就在上周,谷歌对一些外部公司开放使用多模态大模型Gemini的部分功能。
而OpenAI,自然也不会坐以待毙。据外媒爆料,一款名为“Gobi”的全新多模态大模型,已经在秘密筹备之中。OpenAI计划在Gemini发布之前就推出多模态LLM,一举击杀谷歌。
对战谷歌,OpenAI抢发多模态大模型
早在今年3月,OpenAI在推出GPT-4时便预览了这些功能,例如,只需查看用户希望网站拥有的外观的草图即可为网站生成代码,或者输出可视化图表的文本分析。
不过随后,多模态仿佛昙花一现,再也没人见过产品化的实体功能。除了一家名叫Be My Eyes的公司外,OpenAI并未向其他公司提供这些功能,该公司借助这项多模态功能为盲人或弱视人士开发了相关产品。
最近,OpenAI打算更广泛地推出名为GPT-Vision的功能。
OpenAI为什么花了这么长时间?
最主要的原因,是他们担心新的视觉功能会被不法分子利用,比如通过自动破解验证码来冒充人类,或者通过面部识别来追踪人类。
不过,对于这些法律上的安全风险,OpenAI的工程师们似乎已经解决了。
同样,一位谷歌发言人也表示:谷歌已经采取了一些措施,防止Gemini被滥用。
在7月做出的承诺中,谷歌保证会在所有产品中开发负责任的人工智能。
OpenAI的Greg Brockman vs 谷歌的Demis Hassabis
相比之下,多模态时代的到来似乎对谷歌更加有利,因为谷歌拥有大量的专有数据存储库,包括文本、图像、视频和音频——这是谷歌多年来源自搜索和YouTube网站等消费产品积累的丰富资源池。
Gobi能成为GPT-5吗?
在GPT-Vision之后,OpenAI有可能会推出更强大的多模态大模型,代号为Gobi。
跟GPT-4不同,Gobi从一开始就是按多模态模型构建的。
所以,Gobi就是传说中的GPT-5吗?现在,我们还无法知晓。Gobi训练到哪一步了,也没有确切消息。
在9月初,DeepMind联合创始人、现Inflection AI的CEO Mustafa Suleyman,在采访时曾放出一枚重磅炸弹——据他猜测,OpenAI正在秘密训练GPT-5。
Suleyman认为,Sam Altman最近说过他们没有训练 GPT-5,可能没有说实话。(原话是:Come on. I don’t know. I think it’s better that we’re all just straight about it.)
而在谷歌这边,根据试用过Gemini的人士表示,Gemini产生的幻觉,会比现有的模型都更少。
总之,谷歌和OpenAI的这场多模态模型大战,可以说是AI版的iPhone和Android对决。
一个是称霸AI领域多年的硅谷巨头,一个是风头无两的顶流AI初创公司,二者差距有多大,所有人都在屏息等待。
谷歌秘密测试Gemini
另一边,谷歌也在开始邀请部分外部开发者加急测试,即将推出的下一代多模态大模型Gemini 。
上周,The Information独家报道称,Gemini可能很快准备好进行测试发布,并会集成到像Google Cloud Vertex AI等服务中。
在今年的谷歌I/O开发者大会上,劈柴曾公开介绍Gemini,是一个多模态模型、高效集成工具、API。
为了合力干大事,谷歌还将谷歌大脑,与DeepMind实验室进行了合并。
据称,至少有20多位高管参与了Gemini的研发,DeepMind的创始人Demis Hassabis领导,谷歌创始人Sergey Brin参与研发。
还有谷歌DeepMind组成的数百名员工,其中包括前谷歌大脑主管Jeff Dean等等。
一位测试过的人士说,Gemini至少在一个方面比GPT-4有优势:除了网络上的公开信息外,该模型还利用了大量谷歌消费产品(搜索、Youtube)的专有数据。
因此,Gemini在理解用户对特定查询的意图时应该特别准确,而且它产生的错误答案,即幻觉,似乎更少。
据此前SemiAnalysis分析师的爆料,谷歌的下一代大模型Gemini,已经开始在新的TPUv5 Pod上进行训练,算力高达~1e26 FLOPS,比训练GPT-4的算力还要大5倍。
另外,Gemini的训练数据库包含Youtube上936亿分钟的视频字幕,总数据集规模约为GPT-4的两倍。
据称,谷歌下一代大模型也是由多种规模组成,可能使用了MoE架构,以及投机采样技术。
通过小模型提前生成token并传递给大模型进行评估,以提高模型的总体推理速度。
谷歌DeepMind的负责人Hassabis在采访中曾表示,Gemini预计花费数千万到数亿美元,与开发GPT-4的成本相当。
不过,对于谷歌和OpenAI来说,信息安全问题更是主要的考量因素。确保多模态大模型不会被恶意使用或滥用,比谁更先推出相应的产品更加重要。
共有 0 条评论