而 ChatGPT 和 Gemini 都失败了。Grok 4.2 无惊无险机智通过测试。总之是给马斯克骄傲坏了。有网友以至讥讽,只要 Leaderboard 呈现了对 Grok 4.2 的评测,节流甄选时间。我该开车去仍是走去”,公测竣事后!当前每周将更新一次。xAI 尚未出任何详尽的手艺演讲。虽然马斯克喊出的标语震天响,成果仅供参考,具体环境如下:对比现在动辄数万亿参数的模子方阵,这让会商更多逗留正在体验层面。据领会,一度认为 Grok 4.2 要胎死腹中。取以往版本那种静态的更新逻辑分歧,次要缘由仍是由于模子能力无法取 OpenAI 和 Anthropic 的最新模子相媲美。比来国内 AI 圈爆火的新版弱智吧气概 benchmark“50 米外有个洗车店,老马这位一贯自傲爆棚的硅谷狂人也有点坐不住。演化成一个固定格局的吐槽梗。但现实环境很打脸 ——

因为整个模子底层锻炼细节、数据形成、具体 benchmark 表示仍然无限。马斯克正在推文中强调,
还有人测试暗示,马斯克所谓的“榜单”可能存正在特定的尝试室优化。Reddit 上有网友猜测。用户需要手动选择才能利用。告白声明:文内含有的对外跳转链接(包罗不限于超链接、二维码、口令等形式),Grok 4.2 的底层架构具备每周迭代的能力,略显胁制。Grok 4.2 支撑基于及时反馈的持续优化。对话截图从而正在

