Tiết lộ sốc: Tại sao các siêu AI ChatGPT, Gemini, Claude lại cãi nhau về tương lai của bạn?

Theo The Wall Street Journal, những con số mà giới nghiên cứu đang sử dụng để dự đoán những công việc nào có thể bị mất vào tay AI có thể không đáng tin cậy như chúng ta tưởng. Đáng chú ý, một trong những "thủ phạm" chính gây ra sự sai lệch này lại chính là bản thân công nghệ AI.

Hiện nay, nỗi lo ngại về việc AI sẽ ảnh hưởng thế nào đến thị trường lao động đã trở thành một trong những câu hỏi kinh tế cấp bách nhất của thời đại. Việc hiểu rõ những giới hạn của bất kỳ dự báo nào là vô cùng quan trọng để chúng ta có cái nhìn thấu đáo.

Các nhà hoạch định chính sách rất muốn biết chính xác nhóm lao động nào dễ bị thay thế nhất để xây dựng các phương án hỗ trợ kịp thời. Ở góc độ cá nhân, các trường học, học sinh và phụ huynh cũng đang đỏ mắt tìm kiếm những ngành nghề được coi là "miễn nhiễm với AI".

Để đánh giá rủi ro, các nhà kinh tế thường xây dựng các "điểm số tiếp xúc" dựa trên một khung làm việc theo nhiệm vụ cụ thể. Họ dựa vào cơ sở dữ liệu khổng lồ của Bộ Lao động Mỹ về những gì công nhân trong các ngành nghề thực sự thực hiện hàng ngày.

Ví dụ, một người thợ làm bánh cần trộn bột và canh lò nướng, trong khi một nhà phân tích tài chính phải đánh giá sức khỏe của các doanh nghiệp. Các nhà nghiên cứu sẽ cố gắng xác định xem AI có thể hỗ trợ đẩy nhanh đáng kể những nhiệm vụ cụ thể nào trong số đó.

Những lỗ hổng trong phương pháp đo lường rủi ro

Về lý thuyết, tỷ trọng các nhiệm vụ mà AI có thể đảm nhận trong một nghề nghiệp càng lớn thì công việc đó càng có mức độ "tiếp xúc" cao với rủi ro. Những điểm số này hiện đang lan truyền mạnh mẽ trong các báo cáo nghiên cứu, tài liệu tư vấn và báo cáo chính sách toàn cầu.

Tuy nhiên, giới nghiên cứu hiện có ba cách chính để xây dựng điểm số tiếp xúc này, và mỗi phương pháp đều tồn tại những nhược điểm khó tránh khỏi. Cách thứ nhất là sử dụng người đánh giá thủ công để xem xét mức độ AI xử lý các nhiệm vụ, nhưng cách này thường mang tính chủ quan rất cao.

Cách thứ hai là khảo sát trực tiếp những công nhân đang sử dụng các nền tảng AI. Thế nhưng, dữ liệu thu được thường chỉ phản ánh ý kiến của một nhóm nhỏ người dùng trên một vài nền tảng nhất định, không thể đại diện cho toàn bộ lực lượng lao động đa dạng.

Cách thứ ba - cũng là cách gây tranh cãi nhất - chính là để AI tự xếp hạng xem những nhiệm vụ nào dễ bị AI thay thế nhất. Phương pháp này tưởng chừng khách quan nhưng lại nảy sinh một bộ vấn đề rất đặc thù và phức tạp.

Đây là một trong những phát hiện quan trọng từ nghiên cứu mới được đăng tải trên trang web của Cục Nghiên cứu Kinh tế Quốc gia Mỹ (NBER). Nhóm chuyên gia từ Đại học Northwestern và Đại học American đã thực hiện một cuộc thử nghiệm quy mô với các mô hình ngôn ngữ lớn hàng đầu.

Các nhà kinh tế bao gồm Michelle Yin, Hoa Vu và Claudia Persico đã đặt câu hỏi cho ba mô hình AI mạnh nhất hiện nay: ChatGPT-5 của OpenAI, Gemini 2.5 của Google Deepmind và Claude 4.5 của Anthropic. Họ muốn biết những công việc nào tiếp xúc nhiều nhất với AI.

Kết quả thu được khiến giới chuyên môn bất ngờ khi các mô hình thường xuyên đưa ra câu trả lời khác biệt rõ rệt. Có những ngành nghề mà mô hình này coi là "nguy cấp" thì mô hình kia lại cho rằng vẫn rất an toàn.

Điển hình như với nghề kế toán, mô hình Claude xếp họ vào nhóm cực kỳ dễ bị tổn thương trước làn sóng AI. Trong khi đó, Gemini lại gán cho nghề nghiệp này một thứ hạng rủi ro thấp hơn rất nhiều so với đánh giá của đối thủ.

Danh sách các ngành nghề gây tranh cãi không dừng lại ở đó. Các mô hình cũng không thể thống nhất về mức độ rủi ro đối với các vị trí như quản lý quảng cáo hay thậm chí là giám đốc điều hành (CEO).

Dù ChatGPT và Gemini tỏ ra đồng điệu nhất trong các đánh giá, nhưng thực tế hai mô hình này vẫn bất đồng quan điểm tới 25% thời gian thử nghiệm. Điều này cho thấy sự thiếu ổn định ngay cả giữa các hệ thống được coi là thông minh nhất.

Hệ lụy từ dữ liệu thiên kiến và lời khuyên cho tương lai

Nhóm nghiên cứu chỉ ra rằng một phần khác biệt đến từ kiến trúc riêng của từng mô hình. Tuy nhiên, một nguyên nhân sâu xa hơn là kết quả bị ảnh hưởng bởi chính thói quen của những nhóm lao động đã sớm áp dụng AI vào công việc.

Ví dụ, các nhà phân tích tài chính vốn là nhóm sử dụng AI rất sớm và thường xuyên. Việc này vô tình tạo ra một lượng dữ liệu đào tạo khổng lồ cho các mô hình AI thế hệ tiếp theo, từ đó tác động ngược lại cách AI nhìn nhận và xếp hạng rủi ro cho chính nghề nghiệp đó.

Vấn đề cốt lõi ở đây là một số nhà hoạch định chính sách và nhà tuyển dụng có thể đang tin tưởng quá mức vào các con số này. Họ sử dụng chúng như "kim chỉ nam" mà thiếu đi sự thận trọng cần thiết đối với một công nghệ vẫn đang trong giai đoạn thử nghiệm.

Cần lưu ý rằng nghiên cứu này hiện vẫn đang ở dạng bài báo thảo luận và chưa trải qua quá trình bình duyệt chính thức bởi các chuyên gia độc lập. Tuy nhiên, nó đã gióng lên một hồi chuông cảnh báo về tính xác thực của các dự báo kinh tế hiện nay.

Nói một cách công bằng, sự bất đồng giữa các phiên bản công nghệ đang phát triển thần tốc không phải là điều quá gây sốc. Hiện tại, chúng ta cũng chưa thể khẳng định chắc chắn liệu AI đo lường rủi ro tốt hơn hay tệ hơn so với các phương pháp truyền thống của con người.

Để khắc phục tình trạng này, các nhà kinh tế đề xuất giới nghiên cứu nên nhìn nhận vấn đề từ nhiều mô hình khác nhau thay vì chỉ tin vào một cái tên duy nhất. Quan trọng hơn, cần phải thẳng thắn về mức độ không chắc chắn của các chỉ số do AI tạo ra.

Thay vì chỉ dựa vào thuật toán, các cuộc khảo sát thực tế về cách AI đang thực sự được triển khai trong nền kinh tế sẽ mang lại câu trả lời giá trị hơn. Chúng ta cần biết chính xác AI đang thay đổi những nhiệm vụ cụ thể nào và con người đang thích nghi ra sao.

Việc hiểu đúng bản chất của sự thay đổi sẽ giúp chúng ta có sự chuẩn bị tốt hơn thay vì hoảng loạn trước những con số thống kê chưa được kiểm chứng. Đầu tư vào giáo dục và kỹ năng mới vẫn là chìa khóa quan trọng nhất trong kỷ nguyên này.

Bà Michelle Yin, một trong những tác giả của nghiên cứu, chia sẻ quan điểm: "Cá nhân tôi sẽ không chỉ dựa vào một thước đo duy nhất để đưa ra quyết định đổi việc hay thay đổi định hướng ngành học cho con cái mình."

Cuối cùng, dù dự báo có sai lệch bao nhiêu, sự chuẩn bị tâm thế sẵn sàng thích nghi vẫn là vũ khí mạnh nhất của mỗi cá nhân. Chúng ta cần học cách làm việc cùng AI hơn là chỉ lo sợ bị nó thay thế hoàn toàn trong một sớm một chiều.

*Nguồn: The Wall Street Journal