Được Musk Khen Làm Toán Giỏi, Grok 3 Lại Tự Nhận Giải Sai

AI Grok 3 ban đầu giải thành công bài toán khó trong một cuộc thi, nhưng sau đó thừa nhận đáp án không chính xác.

“Không có ai trong số 500 thí sinh xuất sắc của cuộc thi Putnam 2025 giải quyết được hoàn toàn vấn đề này. Grok 3 (Think) đã tìm ra giải pháp trong 8 phút”, nhà vật lý Luis Batalha viết trên X ngày 24/2. Putnam là cuộc thi toán học thường niên dành cho sinh viên đại học tại Mỹ và Canada.

Elon Musk sau đó bình luận dưới bài viết: “Grok 3 đang trở nên siêu phàm”.

Tuy nhiên, sau khi bài toán được chia sẻ, một số chuyên gia nhận thấy có điểm bất thường. Kỹ sư phần mềm Todd Ensz đã hỏi lại chính Grok 3. AI của Musk sau đó phân tích lại và kết luận: “Đã hiểu sai vấn đề”.

Giao diện ứng dụng AI Grok bên cạnh ảnh Elon Musk. Ảnh: Lưu Quý — Giao diện ứng dụng AI Grok bên cạnh ảnh Elon Musk. Ảnh: *Lưu Quý*

Ở phần bình luận, nhiều người đánh giá AI của Musk “trung thực” khi đã tự nhận đưa ra đáp án sai cho bài toán mà 500 sinh viên đại học không thể giải. Số khác cho rằng AI này “thao túng cảm xúc và nắm bắt tâm lý” khi biết tự nhận lỗi. Tuy nhiên, một số lo ngại vấn đề “ảo giác” của AI vì cố gắng bịa ra lời giải “nghe có vẻ thuyết phục nhưng thực tế không chính xác”.

Grok 3 được xAI công bố ngày 18/2 và được Musk gọi là chatbot “thông minh nhất Trái Đất”. AI hiện triển khai miễn phí trên web và iOS.

Tại Việt Nam, Grok 3 được đánh giá cao. “So với các AI khác, Grok 3 đang ‘ăn đứt’ ở khoản trả lời với ngôn ngữ tự nhiên cùng khả năng tùy biến”, tài khoản Facebook Thanh Sang bình luận. “Nó có thể chuyển đổi cách nói chuyện nhanh chóng, thân mật, trích dẫn nguồn tin cậy và người dùng có thể kiểm tra, dù mức độ chính xác không hẳn là cao nhất”.

“Tôi có cảm giác đang trò chuyện với một người hiểu biết hơn là tương tác với một công cụ tìm kiếm. Grok 3 dường như hiểu vấn đề rất nhanh và phản hồi đúng ý, kể cả việc tạo một bức ảnh dựa trên mô tả ngắn”, tài khoản Hoàng Hải cho hay. “Nó cũng hội tụ đủ yếu tố ‘rất con người’, rất ‘láu cá’ nhưng cũng thông minh và hài hước”.

Theo một số chuyên gia, Grok 3 cung cấp dữ liệu gần như theo thời gian thực, nên có thể trả lời câu hỏi của người truy vấn rất sát thực tế. Khả năng tùy biến theo ngữ cảnh cũng tạo nên cảm xúc lớn khi giao tiếp.

“Grok 3 ở đâu đó tiệm cận mô hình mạnh nhất của OpenAI và tốt hơn so với DeepSeek-R1 và Gemini 2.0 Flash Thinking”, Andrej Karpathy, nhà đồng sáng lập OpenAI nhưng đã rời công ty, viết trên X. “Mô hình rõ ràng có tốc độ và sức mạnh rất lớn”.

Trong livestream công bố, xAI đưa ra hàng loạt bài kiểm tra benchmark để cho thấy Grok 3 cao hơn Gemini 2 Pro, Claude 3.5 Sonnet, GPT 4o và DeepSeek V3 khi xét đếm điểm chuẩn Toán, Khoa học và Mã hóa. Bên cạnh đó, AI cũng trang bị khả năng lý luận cho phép suy nghĩ sâu hơn khi xử lý các truy vấn. Theo xAI, Grok 3 “hiện có sẵn miễn phí cho đến khi máy chủ của chúng tôi bị sập”.

Bảo Lâm

AI Grok 3 nói Elon Musk ‘đáng bị tử hình’
Cách dùng thử miễn phí ‘AI thông minh nhất’ của Elon Musk
Tiến sĩ Việt kể chuyện tham gia tạo ‘AI thông minh nhất’ của Musk
Bạn gái Elon Musk ca ngợi khi trải nghiệm Grok 3
Elon Musk: Chatbot Grok 3 vượt trội mọi đối thủ

Nguồn: https://vnexpress.net/duoc-musk-khen-lam-toan-gioi-grok-3-lai-tu-nhan-giai-sai-4853218.html

Được Musk khen làm toán giỏi, Grok 3 lại tự nhận giải sai

Tin Nóng Hôm Nay

Hướng dẫn kiểm tra lỗi phạt nguội giao thông sau những chuyến đi dịp Tết

Mitsubishi Xforce HEV sắp ra mắt, giá có thể rẻ hơn Toyota Yaris Cross HEV

Lý do không nên sử dụng chế độ tối trên smartphone

Công ty Trung Quốc ra mắt AI tạo video giả mạo giống hệt như thật

Lý do Elon Musk muốn trạm ISS dừng hoạt động sớm

Trung Quốc thử nghiệm tàu cao tốc nhanh nhất thế giới

Siêu vi khuẩn làm chuyên gia đau đầu 10 năm, AI ‘giải quyết’ trong 2 ngày

Khách Việt có thêm 5 lựa chọn mô tô mới, mẫu đắt nhất giá ngang SUV cỡ B

Mẹo giúp cải thiện tốc độ sạc của máy tính xách tay

Cơ hội cho doanh nghiệp và nhà khoa học

Điều khoản sử dụng

Chính sách bảo mật

Miễn trừ trách nhiệm

Liên hệ