CMC OpenAI Phát Triển Mô Hình AI Pháp Lý Tiếng Việt

CMC OpenAI, công ty thành viên của Tập đoàn Công nghệ CMC, vừa công bố mô hình ngôn ngữ lớn pháp lý tiếng Việt CMC-AI-Legal-32B cùng bộ chuẩn đánh giá VLegal-Bench.

Đây được xem là bước tiến quan trọng nhằm đặt nền móng cho việc phát triển các trợ lý ảo pháp lý tiếng Việt có độ chính xác cao, phù hợp với hệ thống pháp luật trong nước.

Theo CMC OpenAI, cách tiếp cận đồng thời làm chủ mô hình ngôn ngữ lớn và thước đo đánh giá có ý nghĩa then chốt trong các lĩnh vực nhạy cảm như pháp lý, nơi yêu cầu cao về tính chính xác, khả năng kiểm chứng và tuân thủ chuẩn mực. Việc sở hữu cả mô hình và bộ chuẩn giúp đảm bảo rằng các ứng dụng AI không chỉ hoạt động tốt mà còn có thể được đánh giá một cách khách quan và minh bạch.

Điểm nhấn của lần công bố này là mô hình CMC-AI-Legal-32B, được xây dựng trên nền tảng kế thừa từ các mô hình ngôn ngữ lớn hiện đại và được tinh chỉnh chuyên sâu theo hệ thống pháp luật Việt Nam. Trên bộ chuẩn VLegal-Bench, mô hình này đạt vị trí dẫn đầu về hiệu năng tổng thể, đứng đầu 6 trong số 22 tác vụ và thể hiện nổi bật ở các bài toán đòi hỏi suy luận và lập luận pháp lý nhiều bước.

Nhóm nghiên cứu cho biết các mô hình thương mại tổng quát như GPT-4o, Claude hay Gemini vẫn hoạt động hiệu quả ở các nhiệm vụ phổ thông như nhận diện hoặc truy xuất thông tin.

Tuy nhiên khi chuyển sang các tác vụ yêu cầu suy luận pháp lý phức tạp hoặc tạo lập văn bản pháp lý theo cấu trúc và chuẩn viện dẫn của Việt Nam, hiệu năng của các mô hình này giảm đáng kể.

Trong khi đó, các mô hình được huấn luyện theo ngữ cảnh và đặc thù pháp luật Việt Nam lại cho kết quả vượt trội.

Song song với mô hình, bộ chuẩn VLegal-Bench được xem là trụ cột thứ hai của hệ sinh thái này. Bộ chuẩn gồm 10.450 mẫu dữ liệu có đáp án chuẩn, chia thành 22 tác vụ và được thiết kế theo 5 cấp độ suy luận tăng dần, từ nhận diện và truy xuất điều khoản, suy luận đa bước, diễn giải và tạo sinh nội dung pháp lý cho đến đánh giá các yếu tố đạo đức, công bằng và thiên lệch của mô hình.

VLegal-Bench được xây dựng bám sát đặc thù của hệ thống pháp luật Việt Nam theo truyền thống dân luật, bao gồm cấu trúc phân cấp của văn bản quy phạm, hiệu lực pháp lý, mối quan hệ sửa đổi – thay thế và yêu cầu viện dẫn điều luật cụ thể. Mỗi mẫu dữ liệu đều gắn với nguồn văn bản pháp luật cấp trung ương, bảo đảm khả năng kiểm chứng và truy xuất nguồn gốc.

Việc doanh nghiệp theo đuổi tầm nhìn xây dựng nền tảng AI mở, an toàn và do Việt Nam làm chủ sẽ thúc đẩy cộng đồng doanh nghiệp và nhà phát triển cùng tham gia xây dựng các ứng dụng AI trên nền tảng dùng chung.

CMC OpenAI dự kiến sẽ công bố mã nguồn, dữ liệu và quy trình đánh giá theo hướng minh bạch, đồng thời mời gọi sự tham gia của các chuyên gia trong và ngoài nước để từng bước hoàn thiện hệ sinh thái này.

Trong thời gian tới, CMC OpenAI dự kiến phát hành kho mã nguồn và dữ liệu của VLegal-Bench, mở rộng website đối sánh các mô hình và công bố các phiên bản mở theo từng giai đoạn trong năm 2026. Mục tiêu là hình thành một nền tảng tiêu chuẩn, có cơ chế kiểm chứng rõ ràng, phục vụ phát triển các ứng dụng AI chuyên ngành và đóng góp vào sự phát triển bền vững của hệ sinh thái AI Việt Nam.

Nguồn: https://tuoitre.vn/cmc-openai-phat-trien-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm

CMC OpenAI phát triển mô hình AI pháp lý tiếng Việt

Tin Nóng Hôm Nay

6 trận động đất liên tiếp ở Quảng Ngãi rạng sáng mùng 5 Tết

Seedance 2.0 và kỷ nguyên ‘đoàn làm phim một người’

Bộ ba hãng xe Nhật tiếp tục ‘làm bạn, không về chung một nhà’

Cách đơn giản để biết điện thoại “bẻ khoá” có nguy cơ bị chặn ứng dụng ngân hàng

Các tác nhân gây hại và cách bảo vệ sơn ô tô

Những sản phẩm Apple được chờ đợi nhất có thể ra mắt ngày 4.3

Hai kiểu người dùng AI

Xe máy điện Honda UC3 đã ra mắt Việt Nam được độ ‘khủng’, nhiều đồ chơi xịn như mô tô phân khối lớn

Máy tính lượng tử có thể thương mại hóa trước năm 2030

BTC ‘phớt lờ’ thuế toàn cầu 10% của ông Donald Trump

Điều khoản sử dụng

Chính sách bảo mật

Miễn trừ trách nhiệm

Liên hệ