3月8日消息,据1MAINews消息,OpenClaw创始人PeterSteinberger转发第三方机构PinchBench基准测试结果,该测试评估AI大语言模型在OpenClaw代理任务中的表现。结果显示Gemini3Flash处理OpenClaw任务成功率以95.1%领先,minimax-m2.1、kimi-k2.5则分别以93.6%、93.4%分列2、3位。ClaudeSonnet4.5则为92.7%,GPT-4o为85.2%。