
這次 Opus 4.7 最讓人印象深刻的地方,是它在處理複雜程式任務時的穩定度。根據官網的介紹,使用者現在可以把那種「以前一定要盯著看」的困難程式工作直接交給它,不需要一步一步督促。實際上,它不只是照著指令走,而是會在回報結果之前自己想辦法驗證輸出內容有沒有問題。有測試夥伴指出,在 93 個任務的程式測試中,Opus 4.7 的解決率比 Opus 4.6 提升了 13%,而且其中有 4 個任務是前兩個版本都解不開的難題。對開發者來說,這代表可以更放心地把複雜、多步驟的工作流程交給它跑。
閱讀全文