两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
工作上要严谨细致,家里有老有小,属于自己的时间和精力,真得精...
2025-06-29阅读全文 >>现在一堆人吹 Rust,整得好像它要取代 C++、吊打 Go...
2025-06-29阅读全文 >>餐费的事情是这样子的: 2025年初,多益网络要求离职员工按...
2025-06-29阅读全文 >>同一个项目,用go和rust写出来的东西是不一样的。 就我...
2025-06-29阅读全文 >>人的身材分两方面,一个是身高,一个是身材,前者看遗传,后者靠...
2025-06-29阅读全文 >>