Công Cụ đánh Giá Năng Lực Dạy Học Của Mô Hình AI Tiếng Việt

Công cụ DeepEduBench được bốn đơn vị phối hợp xây dựng để đánh giá khả năng “dạy và học” của các mô hình trí tuệ nhân tạo (AI) tiếng Việt.

Công cụ do Học viện Công nghệ Bưu chính Viễn thông phối hợp cùng Sotatek, DopikAI và tổ chức AI for Vietnam phát triển. Đây là một phần của dự án DeepEdu – sáng kiến về mô hình ngôn ngữ lớn hướng tới xây dựng bộ dữ liệu mở tiếng Việt phục vụ giáo dục, nghiên cứu, phát triển và ứng dụng AI.

Theo nhóm phát triển, phần lớn mô hình AI hiện nay được phát triển theo hướng đa ngôn ngữ, lấy tiếng Anh làm trung tâm, dẫn đến những hạn chế khi áp dụng trong ngữ cảnh giáo dục Việt Nam. Điều này ảnh hưởng trực tiếp đến khả năng ứng dụng trong giáo dục – lĩnh vực đòi hỏi không chỉ trả lời đúng mà còn phải giải thích rõ, phù hợp với người học.

Từ thực tế đó, DeepEduBench được xây dựng như một bộ tiêu chuẩn nhằm đo năng lực sư phạm của AI, thay vì chỉ đánh giá kết quả đúng – sai. Công cụ này yêu cầu mô hình có thể giảng giải theo từng bước, điều chỉnh độ khó theo người học, đưa ra ví dụ và bài tập phù hợp, đồng thời phản hồi đúng trọng tâm.

Để đạt điểm cao, các mô hình AI cần thể hiện cách giải thích mạch lạc, ưu tiên tính sư phạm và độ chính xác, đồng thời khuyến khích tư duy sâu thay vì chỉ đưa ra đáp án ngắn gọn. Bộ tiêu chuẩn hiện gồm 13.700 mẫu dữ liệu và đã được sử dụng để đánh giá 52 mô hình AI hàng đầu.

Logo các ứng dụng AI Grok, Claude, ChatGPT, Gemini, DeepSeek, Copilot, Perplexity, AI Hay trên điện thoại. Ảnh: Lưu Quý

Theo đại diện Học viện Công nghệ Bưu chính Viễn thông, việc xây dựng một bộ tiêu chuẩn riêng cho AI trong giáo dục giúp tăng tính minh bạch trong đánh giá, đồng thời hỗ trợ các cơ sở đào tạo lựa chọn giải pháp phù hợp với nhu cầu thực tế. Vì thế, Học viện lựa chọn hướng tiếp cận tập trung vào ngôn ngữ bản địa và xây dựng các tiêu chuẩn chung cho AI trong giáo dục.

Trong thời gian tới, đơn vị này dự định cùng các đối tác dự kiến triển khai xây dựng kho dữ liệu tiếng Việt dành cho giáo dục với kích thước lên tới 150 tỷ token. Bộ dữ liệu này giúp các mô hình AI hiểu rõ hơn về văn hóa, bối cảnh và cách diễn đạt tiếng Việt, qua đó nâng cao chất lượng tương tác và độ chính xác khi triển khai trong thực tế.

Tại Việt Nam, AI đang trở thành động lực cho chuyển đổi số. Năm 2025, tỷ lệ ứng dụng AI trong doanh nghiệp Việt tăng 39% so với năm 2024, theo nghiên cứu do AWS công bố. 18% doanh nghiệp Việt, tương đương gần 170.000 doanh nghiệp, đã triển khai AI. Trong số các doanh nghiệp đã ứng dụng, 61% ghi nhận doanh thu tăng, với mức tăng trung bình 16%, trong khi 58% kỳ vọng AI giúp tiết kiệm khoảng 20% chi phí.

Trí tuệ nhân tạo cũng nằm trong 11 nhóm công nghệ chiến lược theo quyết định ban hành tháng 6/2025 của Thủ tướng. Trong bối cảnh đó, các dự án như DeepEdu và công cụ DeepEduBench được kỳ vọng góp phần nâng cao sự hiện diện của tiếng Việt trong hệ sinh thái AI.

Trọng Đạt

Biết dùng AI – tiêu chí tuyển dụng mới của công ty công nghệ Việt
Việt Nam quản lý AI thế nào theo luật mới?
Giải pháp phân tích sóng não để luyện thi giành giải hackathon AI tại Việt Nam

Góp ý kiến tạo

Bạn có thể đặt mọi câu hỏi, vấn đề về Khoa học công nghệ, Đổi mới sáng tạo, Chuyển đổi số trực tiếp cho Bộ Khoa học và Công nghệ

Gửi góp ý

Nguồn: https://vnexpress.net/cong-cu-danh-gia-nang-luc-day-hoc-cua-mo-hinh-ai-tieng-viet-5059591.html

Công cụ đánh giá năng lực dạy học của mô hình AI tiếng Việt

Tin Nóng Hôm Nay

Cảnh ‘Trái Đất mọc’ chụp bởi phi hành đoàn Artemis II

Bất ngờ tăng vọt lên 72.000 USD

Những cuộc di cư ngoạn mục và khắc nghiệt nhất hành tinh

4 sai lầm khiến pin xe điện xuống cấp nhanh, người dùng nên tránh

Meta ra mắt trợ lý ảo tự động trả lời tin nhắn bán hàng tại Việt Nam

Startup AI Việt với nỗi lo ‘chiếc xe goòng trên đường ray tàu hỏa’

Cuộc đấu nội bộ ở OpenAI tạo nên Anthropic thế nào

Tiết kiệm vài triệu đồng khi mua iPad cũ liệu có đáng?

Tại sao sau 54 năm Mỹ mới quay lại Mặt Trăng?

Việt Nam đặt mục tiêu 10 người dân có một người khởi nghiệp

Điều khoản sử dụng

Chính sách bảo mật

Miễn trừ trách nhiệm

Liên hệ