Alibaba bị tố dùng 25.000 tài khoản để sao chép Claude, nhưng Anthropic vẫn thu tiền đều đặn

Anthropic vừa gửi thư lên Thượng viện Mỹ tố cáo Alibaba và lab AI Qwen của tập đoàn này đã thực hiện chiến dịch lớn nhất từ trước đến nay nhằm sao chép các năng lực của Claude. Nhưng đằng sau con số 28,8 triệu cuộc hội thoại qua 25.000 tài khoản giả mạo là một chi tiết đáng chú ý: trong toàn bộ quá trình đó, Alibaba vẫn trả tiền API cho Anthropic như một khách hàng bình thường.

Cuộc tấn công diễn ra trong hơn 6 tuần, từ ngày 22/04 đến ngày 05/06/2026. Mục tiêu không phải là phần mềm tổng quát, mà cụ thể là hai năng lực thương mại có giá trị nhất của Claude: khả năng lập trình phần mềm và khả năng lý luận agentic, tức khả năng tự lập kế hoạch và thực thi chuỗi tác vụ phức tạp mà không cần con người can thiệp từng bước.

Vẫn trả tiền đàng hoàng

Điểm khác biệt quan trọng giữa vụ này và các cuộc tấn công mạng thông thường: Alibaba không hack Claude hay đột nhập vào hệ thống của Anthropic. Các tài khoản liên kết với Alibaba truy cập Claude thông qua API công khai - cùng cơ chế mà hàng chục nghìn người dùng và doanh nghiệp khác đang sử dụng mỗi ngày.

Vấn đề nằm ở mục đích và quy mô. Theo điều khoản sử dụng của Anthropic, việc dùng dữ liệu đầu ra của Claude để huấn luyện các mô hình cạnh tranh - còn gọi là distillation hay "chưng cất" - là hành vi bị cấm rõ ràng. Alibaba không vi phạm bằng cách xâm nhập, mà vi phạm bằng cách đặt câu hỏi với mục đích thu thập dữ liệu training theo quy mô công nghiệp.

Minh họa cơ chế "chưng cất" AI - mô hình "giáo viên" ở đây là Claude và mô hình "học sinh" là các mô hình Trung Quốc như MiniMax, DeepSeek... - Ảnh: Internet

Về bản chất kỹ thuật, đây là kỹ thuật gọi là "chưng cất tri thức" (knowledge distillation): một mô hình lớn được hỏi hàng loạt câu hỏi được thiết kế sẵn, toàn bộ câu trả lời được thu thập và dùng để huấn luyện model nhỏ hơn nhằm đạt được năng lực tương đương với chi phí thấp hơn nhiều so với tự nghiên cứu từ đầu.

Anthropic thu tiền từ chính cuộc tấn công

Giá API của Claude dao động tùy model và độ phức tạp của tác vụ. Claude Opus 4.8 - model mạnh nhất hiện tại - có giá 5 USD/triệu token đầu vào và 25 USD/triệu token đầu ra. Claude Sonnet 4.6 rẻ hơn ở mức 3 USD và 15 USD tương ứng.

Dựa trên số cuộc hội thoại được công bố và độ dài trung bình của một phiên agentic (thường từ vài nghìn đến hơn chục nghìn token), ước tính thận trọng cho thấy Alibaba đã chi từ vài trăm nghìn đến vài triệu USD trong hơn 6 tuần đó - toàn bộ nộp thẳng vào doanh thu của Anthropic theo đúng cơ chế trả phí thông thường. Con số chính xác phụ thuộc vào model nào được dùng nhiều nhất và độ dài trung bình mỗi phiên, thông tin mà chưa được tiết lộ công khai.

Nói cách khác, Anthropic đóng vai trò vừa là nạn nhân vừa là bên thu lợi trực tiếp trong cùng một giao dịch.

"Chưng cất" không phải ma thuật

Câu hỏi đặt ra sau vụ này là liệu Qwen, dòng model AI của Alibaba, có thực sự trở nên mạnh hơn nhờ 28,8 triệu mẫu hội thoại đó hay không. Câu trả lời phức tạp hơn nhiều so với những gì người ta thường nghĩ.

"Chưng cất" từ đầu ra của model khác có giới hạn kỹ thuật rõ ràng. Quy trình này chỉ giúp model nhỏ bắt chước cách model lớn phản hồi, không tiếp thu được kiến trúc bên trong hay quá trình training gốc. Nếu kiến trúc nền của Qwen khác với Claude, dữ liệu "chưng cất" chỉ giúp cải thiện bề mặt câu trả lời, không nhất thiết giúp model tốt hơn thực chất trên mọi tác vụ.

So sánh benchmark Qwen và Claude trên bảng xếp hạng model AI công khai - Ảnh: Internet

Thêm vào đó, chiến dịch "chưng cất" kết thúc vào ngày 05/06, trong khi các phiên bản Qwen gần nhất đã ra mắt trước thời điểm chiến dịch bắt đầu (22/04). Dữ liệu thu thập được sẽ phục vụ cho thế hệ model tiếp theo của Alibaba, nếu có, với một khoảng cách thời gian đáng kể để xử lý và training.

Bức tranh rộng hơn

Vụ Alibaba không phải trường hợp đơn lẻ. Hồi tháng 2/2026, Anthropic đã công bố phát hiện ba chiến dịch tương tự từ các công ty AI Trung Quốc khác: DeepSeek với hơn 150.000 cuộc hội thoại, Moonshot AI với hơn 3,4 triệu và MiniMax với hơn 13 triệu. Gộp lại cùng vụ Alibaba, tổng số cuộc hội thoại được dùng để "thu hoạch" Claude vượt 45 triệu trong vòng chưa đầy một năm.

Anthropic cho biết công ty đã hợp tác cùng OpenAI và Google để chia sẻ thông tin về các chiến dịch "chưng cất" vi phạm điều khoản dịch vụ. Lá thư gửi ngày 10/06 cho Thượng nghị sĩ Tim Scott và Elizabeth Warren kêu gọi Chính phủ Mỹ làm rõ hướng dẫn chống độc quyền để các hãng AI Mỹ có thể chia sẻ thêm thông tin về các nỗ lực này, đồng thời tiếp tục ủng hộ kiểm soát xuất khẩu chip AI tiên tiến.

CEO Anthropic Dario Amodei tại Hội nghị thượng đỉnh G7 tổ chức vào tháng 6/2026 - Ảnh: BI

Alibaba không đưa ra bình luận về cáo buộc. Cổ phiếu ADR của tập đoàn này giảm hơn 3% ngay sau khi thông tin xuất hiện trên Bloomberg chiều 24/06.