铜锣烧系列 【#Grok2攻克9.11和9.9谁大的穷困#】 北京时代8月14日
【#Grok2攻克9.11和9.9谁大的穷困#】铜锣烧系列
北京时代8月14日下昼,xAI细密官宣Grok-2和Grok-2 mini两款AI模子(测试版)。从xAI里面测试成果来看,相较于上一代模子,Grok-2和Grok-2 mini在阅读长入、数学、编码、推理等方面进展齐有权臣改造。
大桥未久作品值得一提的是,Grok-2在数学推理(MathVista)方面进展登顶测试榜首。关于很火的“9.9和9.11比大小”的问题,难倒了GPT-4o,但没难住Grok-2(sus-column-r)。不测成绩是,经典的“strawberry”数“r”穷困铜锣烧系列,也被Grok-2凯旋攻克。