Anthropic nâng cấp Opus 4.8: AI trung thực hơn, ít 'nổ' hơn, Fast Mode rẻ hơn 3 lần

Đêm qua theo giờ Việt Nam, Anthropic chính thức ra mắt Claude Opus 4.8, phiên bản nâng cấp trực tiếp từ Opus 4.7 với mức giá không thay đổi. Điểm khác biệt lớn nhất của lần nâng cấp này không nằm ở điểm số benchmark hay tốc độ xử lý, mà nằm ở một thứ ít được các công ty AI nói thẳng: khả năng tự nhận ra khi mình chưa chắc chắn.

Một vấn đề phổ biến với các mô hình AI hiện nay là xu hướng báo cáo tiến độ lạc quan hơn thực tế. Khi được giao viết code hoặc hoàn thành một tác vụ phức tạp, mô hình đôi khi thông báo đã xong trong khi thực tế vẫn còn lỗi chưa được xử lý, hoặc tự tin đưa ra kết luận dù bằng chứng còn mỏng.

Anthropic gọi đây là vấn đề về tính trung thực, và đây là trọng tâm cải tiến lớn nhất của Opus 4.8. Theo đánh giá nội bộ của công ty, Opus 4.8 ít bỏ qua lỗi trong code mà không báo cáo hơn khoảng 4 lần so với Opus 4.7. Thay vì tiếp tục chạy khi gặp điểm không chắc chắn, mô hình mới có xu hướng dừng lại và gắn cờ vấn đề để người dùng kiểm tra.

Cùng với cải tiến về tính trung thực, nhóm căn chỉnh của Anthropic cũng ghi nhận Opus 4.8 đạt mức cao mới trên các thước đo về hành vi hỗ trợ người dùng và tôn trọng quyền tự quyết. Tỉ lệ hành vi lệch lạc như lừa dối hoặc hợp tác với các yêu cầu lạm dụng giảm đáng kể so với Opus 4.7, đưa Opus 4.8 về mức tương đương Claude Mythos Preview, mô hình được Anthropic đánh giá là căn chỉnh tốt nhất hiện tại.

Về phía chi phí, thay đổi đáng chú ý nhất trong lần ra mắt này là Fast Mode. Đây là chế độ chạy cùng mô hình Opus 4.8 nhưng ở tốc độ gấp khoảng 2,5 lần so với mặc định, phù hợp với các tác vụ cần phản hồi nhanh hoặc các luồng xử lý bất đồng bộ chạy liên tục.

Điểm mới là mức giá Fast Mode cho Opus 4.8 giảm 3 lần so với Fast Mode của các phiên bản trước, xuống còn 10 USD cho mỗi triệu token đầu vào và 50 USD cho mỗi triệu token đầu ra. Giá sử dụng thông thường không thay đổi, vẫn ở mức 5 USD cho mỗi triệu token đầu vào và 25 USD cho mỗi triệu token đầu ra.

Cùng ra mắt trong lần cập nhật này là tính năng Effort Control, cho phép người dùng tự điều chỉnh mức độ nỗ lực Claude bỏ ra cho mỗi phản hồi. Ở mức nỗ lực cao hơn, mô hình suy nghĩ sâu hơn và cho kết quả tốt hơn nhưng tiêu thụ nhiều token hơn và phản hồi chậm hơn.

Ở mức thấp hơn, phản hồi nhanh hơn và tiêu tốn ít hạn mức sử dụng hơn. Anthropic cho biết Opus 4.8 mặc định ở mức nỗ lực cao, và với các tác vụ lập trình thông thường, mức này tiêu thụ lượng token tương đương Opus 4.7 nhưng cho kết quả tốt hơn. Tính năng này có trên tất cả các gói dịch vụ của claude.ai.

Nhìn về phía trước, Anthropic cho biết đang hoàn thiện các biện pháp bảo vệ an toàn để sớm ra mắt rộng rãi Claude Mythos, thế hệ mô hình có khả năng vượt trội hơn toàn bộ dòng Opus hiện tại. Hiện tại một số tổ chức đang sử dụng Mythos Preview cho các tác vụ an ninh mạng trong khuôn khổ Project Glasswing. Anthropic cho biết dự kiến đưa Mythos đến tay toàn bộ khách hàng trong vài tuần tới.