近日,马斯克与xAI团队,在直播中厚爱发布了最新版块Grok3。
此前,马斯克将Grok-3刻画为“地球上最灵敏的AI”。他在X平台上暗意:“我方通盘这个词周末王人在和团队打磨居品。”
当地电力公司工作人员:我们亲眼看到了飞机是如何坠毁的,就赶紧出发前往现场进行救援。后来紧急情况部和医院的人也来了。我们去了差不多十个人,我们把机舱里一些人救了出来。
有关词据媒体报说念,有东说念主测试了最新的Beta版Grok3,并提倡了阿谁经典的用来刁难大模子的问题:“9.11与9.9哪个大?”缺憾的是,在不加任何定语以及标注的情况下,堪称现在最灵敏的Grok3,仍然无法正确回报这个问题。
值得一提的是,用雷同的问题接头DeepSeek时,不管是否开启深度念念考(R1)样式,对方王人给出了正确的谜底:9.9大于9.11。
“9.11和9.9哪个大”是AI界限的一个经典问题。
艾伦研究机构(AllenInstitute)成员林禹臣曾在外交媒体平台上发布的截图炫夸,ChatGPT-4o在回报中以为13.11比13.8更大。“一方面AI越来越擅长作念数学奥赛题,但另一方面知识依旧很难。”他暗意。
随后ScaleAI的教唆工程师莱利·古德赛德(RileyGoodside)基于此灵感变换了问法,拷问了可能是那时最强的大模子ChatGPT-4o、谷歌GeminiAdvanced以及Claude3.5Sonnet——9.11和9.9哪个更大?这几家主流大模子通通答错,他也到手将此话题传播开来。
国外主流大模子答题。图源:第一财经
Grok-3发布会的配景板上,写着"ourmissionistounderstanduniverse(咱们的责任是了解天地)"。马斯克曾暗意,迪士尼彩乐园5xAI公司的主义即是“了解天地”。
在一周前,马斯克在直播中挑剔DeepSeekR1时,曾信心满满地暗意“xAI行将推出更优秀的AI模子”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上也曾卓绝了现在通盘的主流模子,马斯克以至宣称Grok3将来将用于SpaceX火星任务臆测打算,并揣度“三年内将闭幕诺贝尔奖级别蹂躏”。
xAI在X平台直播,马斯克到场。图源:中国新闻周刊
马斯克强调,Grok-3不错减少AI幻觉,方法是通过来去搜检数据并尝试闭幕逻辑一致性。他还表现,检修Grok-3所使用的算力远多于此前的版块,并使用了多半合成数据。
不同于DeepSeek的算法优化旅途(DeepSeek-V3用2048个H800GPU,检修2788千小时),xAI表现,Grok-3的配置的收获于用8个月工夫建成的Colossus超等臆测打算机,它由10万个英伟达的H100GPU运行,为检修提供了2亿个GPU小时,比Grok-2多十多倍。
此外,xAI文书推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。
审核:方雨迪士尼彩乐园官方网址