site stats
一句话总结:干活用Claude,科研用Gemini,写码用GPT1. Claude Opus 4.7在实际工作任务上遥遥领先。GDPval-AA这个测试中拿到1753分,比第二名高出79分。这个测试不是做选择题,而是模拟真实工作。2. Gemini 3.1 Pro的强项是知识和科学推理。它在HLE(人类最后的考试)、GPQA
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: