如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

时间：2025-06-23 18:40:11来源：当前位置：当前位置：首页 >

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

上一篇 : 有一个***约你出去，你会去吗？

下一篇 : 什么水草扔缸里就能活？

相关文章：

{dede:myad name='右侧广告位'/}

后端开发除了增删改查还有什么？

十年phper 见过上百万行代码，其中水平参差不齐尤其外包...
2025-06-27阅读全文 >>
你所见过的穷是什么样子？

2010年，去河池某地参加一项拍摄。当地的生活穷困到超乎...
2025-06-27阅读全文 >>
大厂后端开发需要掌握docker和k8s吗?

哎呦，小老弟，你这问题问得挺有意思，正好踩在了老油条的脚趾上...
2025-06-27阅读全文 >>
你为什么退出了乐队？

这里没人认识我，我想说点自己的经历。我在校园时期曾组过一...
2025-06-27阅读全文 >>
谁是对Mac有成见然后用完Mac后真香的？

我刚好相反，现在用的m4max的mbp，以前觉得mac续航很...
2025-06-27阅读全文 >>

养花知识本月排行

1各大媒体预测顺位皆在首轮之后，杨瀚森实际顺位大涨是因为什么？
深圳的人口最终会剩下多少？
穿瑜伽裤爬山的女生会不会害羞？
IntelliJ IDEA 中有什么让你相见恨晚的技巧？
现在已经有5K、6K、8K分辨率显示器，那么8K之后是什么？
续签香港优才，怎么证明申请人“常住香港”?
为什么《战争雷霆》没有什么竞品游戏?
编译器和解释器的分界线在哪，字节码效率能否无限接近机器码？
○÷25=○-864，○代表同一个数，○是多少？
为什么今年的雷霆会惹众怒？

{dede:myad name='右侧广告位'/}

养花知识精选

养花知识推荐