AI 数学推理三强争霸:OpenAI / Anthropic / DeepMind 同解 Erdős 1946 难题
同一周内 OpenAI GPT-5.5 Pro Anthropic Claude Mythos DeepMind AlphaProof Nexus 三家各自攻克 Erdős 单位距离猜想 PoE 分布式推理 Lean 形式验证 深度对比分析
同一周内 OpenAI GPT-5.5 Pro Anthropic Claude Mythos DeepMind AlphaProof Nexus 三家各自攻克 Erdős 单位距离猜想 PoE 分布式推理 Lean 形式验证 深度对比分析
$39.9 成本 + 160 分钟,Claude Code 在离线模拟环境中自我进化,发现了比人类设计的测试时缩放策略更高效的推理算法。置信动量控制器 CMC 节省约 70% Token,精度持平。