先把最强模型改成任务分配
不要先问 Claude、GPT、Gemini 谁更强。开发者真正要解决的是:这次任务会改多少代码、要不要跑终端、上下文有多长、失败以后谁来兜底。
AI Coding 里的模型选型更像工具箱,不像排行榜。一个模型在代码修复榜单上领先,不代表它适合读 20 万 token 的内部文档;一个模型终端自动化很强,也不代表它生成的补丁一定更容易合并。
先把任务拆成三类,再选入口。
- 代码修改、代码审查、复杂重构:优先试 Claude。
- 终端自动化、仓库命令、DevOps 脚本:优先试 GPT / Codex。
- 长文档分析、低成本批量阅读、方案草稿:优先试 Gemini。
用 Claude 做代码修改和审查
Claude 更适合放在“改代码”和“审代码”的位置,尤其是你已经能给它一个明确仓库、一个失败测试、一个期望行为的时候。
适合交给 Claude 的任务:
不要把 Claude 当成完全无人值守的工程师。代码任务的平均表现没有尾部表现重要。你需要看它在最难的 5% 场景里会不会编造文件、漏跑测试、把无关重构混进补丁。
成功标准很简单:补丁能读懂,测试能跑,失败时能指出不确定点,而不是用自信语气把问题糊过去。
- 根据错误日志定位改动范围。
- 修改一组相关文件,并解释为什么只改这些文件。
- 做代码审查,找出可能破坏现有行为的地方。
- 把大任务拆成几个可合并的小补丁。
用 GPT 处理终端和工具链任务
GPT 更适合放在“会调用工具的自动化助理”位置。你需要它在终端里读日志、列文件、跑命令、改配置、再根据结果继续下一步时,GPT / Codex 往往更顺手。
适合交给 GPT 的任务:
这里最容易出问题的是“看起来很忙”。模型连续跑了很多命令,不等于它已经接近答案。每一轮自动化都要有可观察结果:哪个命令成功、哪个命令失败、下一步为什么只查这个方向。
如果终端任务开始绕圈,先让它停下来输出当前证据,不要继续追加更多命令。
- 根据 CI 日志定位失败步骤。
- 编写一次性 PowerShell、bash 或 Node 脚本。
- 对比两个命令输出,判断是哪一步环境变量没生效。
- 做仓库级搜索、整理候选文件、生成排查清单。
用 Gemini 读长上下文和控制成本
Gemini 更适合放在“长文档阅读”和“低成本批处理”的位置。你有大量文档、变更记录、接口说明、迁移指南,需要先整理出候选方向时,可以先让 Gemini 做第一轮压缩。
适合交给 Gemini 的任务:
不要把“上下文窗口大”理解成“可以不设计输入”。长上下文仍然会丢细节。你要给它明确问题、输出格式和判断边界。
成功标准不是摘要很长,而是它能指出哪些字段需要回到官方文档二次确认。
- 从长文档里提取配置项、限制条件和版本差异。
- 对比多份 changelog,整理可能影响当前项目的改动。
- 批量阅读 issue、release note 和内部说明,生成排查索引。
- 在预算敏感的场景里先做粗筛,再把关键文件交给 Claude 或 GPT。
先跑三个小任务再换主力模型
不要把整个仓库一次性交给一个模型。先选三个小任务,每个任务都要能在 10 到 20 分钟内判断结果。
每个任务只看四件事:是否解决、用了多少轮、花了多少 token、失败时有没有胡编。这个小测试比单看公开榜单更有用。
- 一个真实 bug:给错误日志、相关文件和期望行为,看模型能否改出最小补丁。
- 一个终端任务:给失败命令和环境信息,看模型能否跑出可验证的下一步。
- 一个长文档任务:给官方文档或 changelog,看模型能否提取和当前项目有关的限制。
日期: 2026-06-05
项目: 填你的仓库名
任务: 修复构建失败 / 检查 API 配置 / 阅读迁移文档
模型: Claude Opus 4.8 / GPT-5.5 / Gemini 3.1 Pro
输入范围: 错误日志 + 3 个文件 / CI 输出 / 官方文档链接
成功标准: 测试通过 / 找到失败命令 / 提取可执行配置
结果: 成功 / 部分成功 / 失败
失败原因: 编造文件 / 漏跑测试 / 没读到关键限制 / 成本过高
下一步: 继续使用 / 换模型 / 缩小上下文 / 人工处理按失败现象换模型
选型不要一次定死。看失败现象换模型,比争论哪个模型“综合最强”更有效。
记录可用组合
模型会更新,价格会变,工具链也会变。你需要记录的是“某个项目里,某类任务,用哪个组合更稳定”。
可用的默认组合:
这个分工不是信仰,是起点。每次工具更新后,用同一组小任务重新跑一遍。结果变了,就更新你的默认组合。
- Claude:核心代码修改、复杂审查、重构计划。
- GPT / Codex:终端自动化、CI 排查、脚本生成。
- Gemini:长文档压缩、低成本批量阅读、方案预处理。