Thứ năm, Tháng mười hai 25, 2025
HomeCông NghệCMC OpenAI phát triển mô hình AI pháp lý tiếng Việt

CMC OpenAI phát triển mô hình AI pháp lý tiếng Việt

CMC OpenAI phát triển mô hình AI pháp lý tiếng Việt - Ảnh 1.

Bộ chuẩn đánh giá VLegal – Bench của nhóm nghiên cứu C-OpenAI đăng ký trên cổng arXiv của Trường đại học Cornell – Mỹ phiên bản mới nhất cập nhật ngày 25-12-2025.

CMC OpenAI, công ty thành viên của Tập đoàn Công nghệ CMC, vừa công bố mô hình ngôn ngữ lớn pháp lý tiếng Việt CMC-AI-Legal-32B cùng bộ chuẩn đánh giá VLegal-Bench. 

Đây được xem là bước tiến quan trọng nhằm đặt nền móng cho việc phát triển các trợ lý ảo pháp lý tiếng Việt có độ chính xác cao, phù hợp với hệ thống pháp luật trong nước.

Theo CMC OpenAI, cách tiếp cận đồng thời làm chủ mô hình ngôn ngữ lớn và thước đo đánh giá có ý nghĩa then chốt trong các lĩnh vực nhạy cảm như pháp lý, nơi yêu cầu cao về tính chính xác, khả năng kiểm chứng và tuân thủ chuẩn mực. Việc sở hữu cả mô hình và bộ chuẩn giúp đảm bảo rằng các ứng dụng AI không chỉ hoạt động tốt mà còn có thể được đánh giá một cách khách quan và minh bạch.

Điểm nhấn của lần công bố này là mô hình CMC-AI-Legal-32B, được xây dựng trên nền tảng kế thừa từ các mô hình ngôn ngữ lớn hiện đại và được tinh chỉnh chuyên sâu theo hệ thống pháp luật Việt Nam. Trên bộ chuẩn VLegal-Bench, mô hình này đạt vị trí dẫn đầu về hiệu năng tổng thể, đứng đầu 6 trong số 22 tác vụ và thể hiện nổi bật ở các bài toán đòi hỏi suy luận và lập luận pháp lý nhiều bước.

Nhóm nghiên cứu cho biết các mô hình thương mại tổng quát như GPT-4o, Claude hay Gemini vẫn hoạt động hiệu quả ở các nhiệm vụ phổ thông như nhận diện hoặc truy xuất thông tin.

Tuy nhiên khi chuyển sang các tác vụ yêu cầu suy luận pháp lý phức tạp hoặc tạo lập văn bản pháp lý theo cấu trúc và chuẩn viện dẫn của Việt Nam, hiệu năng của các mô hình này giảm đáng kể. 

Trong khi đó, các mô hình được huấn luyện theo ngữ cảnh và đặc thù pháp luật Việt Nam lại cho kết quả vượt trội.

Song song với mô hình, bộ chuẩn VLegal-Bench được xem là trụ cột thứ hai của hệ sinh thái này. Bộ chuẩn gồm 10.450 mẫu dữ liệu có đáp án chuẩn, chia thành 22 tác vụ và được thiết kế theo 5 cấp độ suy luận tăng dần, từ nhận diện và truy xuất điều khoản, suy luận đa bước, diễn giải và tạo sinh nội dung pháp lý cho đến đánh giá các yếu tố đạo đức, công bằng và thiên lệch của mô hình.

VLegal-Bench được xây dựng bám sát đặc thù của hệ thống pháp luật Việt Nam theo truyền thống dân luật, bao gồm cấu trúc phân cấp của văn bản quy phạm, hiệu lực pháp lý, mối quan hệ sửa đổi – thay thế và yêu cầu viện dẫn điều luật cụ thể. Mỗi mẫu dữ liệu đều gắn với nguồn văn bản pháp luật cấp trung ương, bảo đảm khả năng kiểm chứng và truy xuất nguồn gốc.

Việc doanh nghiệp theo đuổi tầm nhìn xây dựng nền tảng AI mở, an toàn và do Việt Nam làm chủ sẽ thúc đẩy cộng đồng doanh nghiệp và nhà phát triển cùng tham gia xây dựng các ứng dụng AI trên nền tảng dùng chung. 

CMC OpenAI dự kiến sẽ công bố mã nguồn, dữ liệu và quy trình đánh giá theo hướng minh bạch, đồng thời mời gọi sự tham gia của các chuyên gia trong và ngoài nước để từng bước hoàn thiện hệ sinh thái này.

Trong thời gian tới, CMC OpenAI dự kiến phát hành kho mã nguồn và dữ liệu của VLegal-Bench, mở rộng website đối sánh các mô hình và công bố các phiên bản mở theo từng giai đoạn trong năm 2026. Mục tiêu là hình thành một nền tảng tiêu chuẩn, có cơ chế kiểm chứng rõ ràng, phục vụ phát triển các ứng dụng AI chuyên ngành và đóng góp vào sự phát triển bền vững của hệ sinh thái AI Việt Nam.



Đọc tiếp



Về trang Chủ đề

Nguồn: https://tuoitre.vn/cmc-openai-phat-trien-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm

TuoiTre Logo

Hello Mình là Cải

Theo dõi
Thông báo của
0 Góp ý
Mới nhất
Cũ nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận

Tin Nóng Hôm Nay