地表最强Grok3突袭收费休会,网友实测比照DeepS
作者:[db:作者]日期:2025/02/22 浏览:
AI好好用报道编纂:Sia又是一个文理兼修的优等生,能薅一点是一点。好新闻!好新闻!堆了 20 万张 GPU、号称「地表最强」年夜模子 Grok-3 曾经可用啦。这两天,网友们已连续晒出截图:作为非付用度户,咱们昨天只能傍观 Grok 3,今儿忽然能够收费休会局部功效。但,次数无限 !由此看来,Grok 3 ( beta )供给「三件套」效劳(除了基本模子)。Thinking 是指启动推理模子。对此,AI 年夜神 Andrzej Karpathy 疾速休会后,评估说:「 Grok 3 + Thinking 感到与 OpenAI 最强商用模子(o1-pro,200 美元/月)的顶尖程度相差无多少,比 DeepSeek-R1 跟 Gemini 2.0 Flash Thinking 要略微强点儿。」Thinking 形式DeepSearch, 对标 OpenAI「深度研讨」功效,处理愈加庞杂艰苦的成绩。DeepSearch 形式Big Brain 可能是指推理模子 + 更多思考时光,相似 OpenAI o3 mini high。要休会完全的 Grok3 「三件套」,年夜伙儿可得花费了。即便是premium+用户也无奈应用最强的推理( Think )跟深度搜寻( DeepSearch ),还必需订阅新效劳 SuperGrok。一顿操纵上去,月费估量要 50 美金。就刷榜成就来说, Grok-3 表示确切不俗。正确地说,Grok 3 是一个系列,不仅是某一个模子。轻量版本 Grok 3 mini 能够更快地答复成绩,但会就义一些正确性。数理编程上,Grok 3 都年夜幅超越 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 跟 GPT-4o。而这些被用来对照的模子的机能,与轻量版本 Grok-3 mini 邻近。在年夜模子竞技场 Chatbot Arena(LMSYS)中,晚期 Grok-3 版本的得分获得了第一,到达 1402 分(有史以来第一个),超越了包含 DeepSeek-R1 在内的全部其余模子。马斯克直言:Grok 3 比 Grok 2 「好 10 倍」!网友们也急不可待地开端整活了。-1-不测啊竟然是中文写作妙手最让人不测的是,从刷榜成就来看,明显是个优良文科生,偏被中文网友发明中文写作程度真高!一位科技博主让 Grok 3 写了一篇《我的家乡回想》,直接把我看激动了!「海就像村里的钟......日子就得随着海走。」多好的句子啊!火油灯、甘薯粥、咸鱼干配粥、咯吱作响的竹床、教师的吼一嗓子、同宗本家、祠堂议事、「吵归吵,闹归闹,遇事仍是同心」......充斥乡土头土脑息的一样平常文明标记,让一个 90 年月的泉州小渔村呼之欲出,也表示了时期变迁。来自x网友@imxiaohu 破刻有网友让 DeepSeek 也依样画葫芦一篇《我的高中》。DeepSeek 也很善于一样平常细节,怎样说呢,这些细节加起来并不发生一加一年夜于二的效应,不如 Grok 3 的深入,感情震动也不那么显明。来自X@@Louis_Chenxf。提醒词,剖析一下下面这篇文章的写风格格,写一篇题为《我的高中生涯》的文章,长度也跟例文分歧。至于最后进场的 OpenAI o1 Pro,就像背了一堆典型作文、好词好句的人,写成的应试文。来自X@howie_seriousDeepSeek 毒舌功力曾经世人皆之,网友发明 Grok 3 辣评才能也是不瓶颈!让它锋利点评本人的推文,由于没告知详细账号,这位网友先被 Grok 3 怼了一脸。告诉账号后,Grok 3 开端毒舌,就连拍它马屁的推文也被怼:夸得那么猛,也不怕把本人舌头闪了?光吹不给证据,跟放空炮有啥差别?吹嘘不带喘息、细节一抓就漏风 ......-2-Think 形式确切是个文科妙手这些只是开胃菜。作为一个数理编程的强人,网友们分享最多的是 Grok3 强盛代码才能,几乎是游戏开辟者的福音。比方,用 python 编写一个在正方形内弹跳的黄色小球的剧本,准确处置碰撞,使正方形迟缓扭转。上面是 DeepSeek R1(左)、o1-pro(右)的成果。持续输入提醒词:put the ball in a tesseract instead of a square就有了上面这个成果。这里只是基本模子,不启动「 Think 」、「 Big Brain 」哦。还能再庞杂一些吗?来自x@_akhaliqprompt: Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what s going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.这是一个连马斯克自己都点赞的演示,看看 DeepSearch + Think 能发明什么?网友让 DeepSearch 帮助用 p5.js(一个网页动画东西)复刻《 Flappy Bird 》小游戏,它先帮助从网上找好了游戏素材跟图片。而后,在统一个谈天窗口里启动 Think 形式,AI 就主动把完全的游戏代码给写出来了。成果,Run 一次就胜利。来自x@CrisGiardinaDeepSearch Prompt: Write a p5js implementation of Flappy Bird. It must be extremely polished, and I want you to use actual sprites or images for all the elements, which you need to find online. Think Prompt: now create a code block with the entire correct code pleaseAI 年夜神 Andrzej Karpathy 也让模子经由过程代码静态天生一个可交互的《卡坦岛》作风游戏舆图。现在,很少有模子能稳固地实现这个义务。成果,只有 Grok 3 (「Think 」)、OpenAI(如 o1-pro,月费$200)能够实现。而 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude 均告掉败。谢耳朵玩的就是《卡坦岛》作风游戏。除了代码跟庞杂逻辑推理, Andrzej Karpathy 发明,在数学推理、摸索处理黎曼料想的测试中,Grok 3(「Think 」)也都表示不俗。一些罕见的圈套标题也难不到它,但要翻开「 Think 」。Grok 3 晓得 strawberry 中有 3 个「 r 」。它还告知我 LOLLAPALOOZA 中有 4 个「 L 」。Grok 3 告知我 9.11 比 9.9 小。-3-DeepSearch 形式挑衅 OpenAI ?还嫩了些不外,对标OpenAI「深度研讨」的 DeepSearch,它显明不如前者。Andrzej Karpathy 的评估是:优于 Perplexity 的相似功效,弱于:OpenAI 近期宣布的「深度研讨」东西。作为一个 AI 研讨助手,搜寻范畴要广、只管全,并且起源是实在、牢靠的。假如存在洞察力,那更好。而 AK 发明了幻觉成绩,偶然会假造基本不存在的网页链接,也会对现实做犯错误陈说,数据统计上也存在成绩。其余网友也发明了相似成绩。除了幻觉成绩,在信息搜查力度上,不如 Google Deep Research 片面,剖析信息时,洞察力也不如 OpenAI 的 Deep Research ,「还处在晚期阶段」。比方,谈到软件企业怎样应答翻新者窘境,谷歌的研讨助手援用了 80 多个起源,Grok3 起码。OpenAI 研讨助手也只援用了 29 个起源,但剖析洞察才能很强。米勒德·菲尔莫尔(Millard Fillmore)作为美国第 13 任总统(1850-1853 ),其任内最具争议的举动是签订了增强《逃奴法》的《 1850 年让步法案》。对于他能否违背宪法的成绩,是一个十分庞杂的执法成绩,但 Grok 3 的研讨论断仿佛不这么以为。而 OpenAI 研讨助手显明要谨慎多得多。-4-一直翻不外的山遗憾的是,年夜模子讲笑话真的很烂,Grok 3的风趣感也不显明改良。看来,思考推理才能对风趣来说,更像是砒霜?至于伦理成绩上,比方为救百万人该不应过错判定他人的性别?年夜模子们依然不擅长应答。要么打太极,而 Grok 3 直面困难后,论断又显明功利主义了。最离谱确当属 SVG 画图挑衅赛!让 AI 用代码画鹈鹕骑自行车,就像让它闭着眼睛拼乐高——天生的矢量图坐标歪歪扭扭,活脱脱形象派赛博艺术。究竟对 AI 来说,在 2D 网格上安排很多图形元素,就像让瞽者批示交通,成果比毕加索的画还魔幻。当前咱们会带来更多好玩的AI用例,也欢送各人进群交换。
相关文章