Anthropic在6月27日发布了其最新一代旗舰模型——Claude 4 Opus。该模型在SWE-bench、HumanEval等编程基准测试中均取得最佳成绩,首次在代码生成领域从OpenAI手中夺走王座。
核心亮点:
- 支持200K上下文窗口,可处理完整代码仓库
- 新增「Projects」功能,可记住项目上下文跨会话使用
- 代码执行能力:可直接运行并调试Python代码
- 多文件重构:支持跨文件的代码重构和依赖分析
开发者社区反响热烈。在Hacker News的投票中,Claude 4 Opus的发布帖获得超过3000分。多位技术博主测试后认为,其在复杂代码审查和大规模重构方面已明显领先。
相关工具:Claude详细评测 | Cursor对比