AI Của Meta Sẽ được Chuẩn Hóa Tiếng Việt

(PLO)- Llama (Large Language Model Meta AI), mô hình ngôn ngữ lớn được phát triển bởi Meta sẽ được chuẩn hóa tiếng Việt, hiểu hơn về văn hóa, bối cảnh và cách diễn đạt tiếng Việt.

Sáng 14-3, Meta, phối hợp cùng Trung tâm Đổi mới sáng tạo Quốc gia (NIC) tổ chức họp báo khởi động Chương trình Thách thức Đổi mới sáng tạo 2025 (VIC 2025), đánh dấu năm triển khai thứ ba của chương trình với mục tiêu thúc đẩy phát triển lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam.

Phát biểu khai mạc tại họp báo, ông Võ Xuân Hoài – Phó Giám đốc Trung tâm đổi mới sáng tạo quốc gia (NIC) – cho biết AI đang chuyển đổi thế giới.

Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách. Mục tiêu của chương trình năm nay là thúc đẩy phát triển lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam.

Theo thông tin từ BTC, chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt.

Dự án ViGen là sự hợp tác giữa Tập đoàn Meta, NIC và tổ chức “AI for Vietnam”. Sứ mệnh của dự án là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi, để mở khoá tiềm năng các ứng dụng trí tuệ nhân tạo khác tại Việt nam. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI.

Dự án ViGen sẽ đảm bảo sự phát triển trí tuệ nhân tạo ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức Việt Nam, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cách địa phương và có trách nhiệm.

TS. Trần Việt Hùng, nhà sáng lập kiêm CEO Tổ chức AI for Vietnam, nói về tầm quan trọng của dự án với tiến trình phát triển trí tuệ nhân tạo tại Việt Nam. Ảnh: MINH TRÚC

Tại họp báo, TS. Trần Việt Hùng, nhà sáng lập kiêm CEO Tổ chức AI for Vietnam khẳng định trong bối cảnh AI phát triển nhanh như hiện nay, nếu Việt Nam không tận dụng được thì sẽ tuột mất cơ hội phát triển. Các chuyên gia nghiên cứu của tổ chức “AI for Vietnam” nhận thấy rằng để Việt Nam tận dụng được AI thì việc hỗ trợ tiếng Việt đóng vai trò quan trọng.

Hiện nay, các dữ liệu đào tạo tiếng Việt trong lĩnh vực AI chỉ chiếm 0,8% – một phần rất nhỏ về đầu vào. Vì vậy, mặc dù đầu ra các mô hình AI có giá trị thông tin nhưng chưa truyền tải hết được ngôn ngữ cũng như văn hóa Việt Nam. Việc ứng dụng AI vì vậy còn chưa hiệu quả.

Chính vì vậy, các chuyên gia AI người Việt rất mong muốn đưa tiếng Việt vào AI một cách tự nhiên mà không tốn nhiều thời gian cũng như nguồn lực đầu tư. Thông tin thêm, ông Trần Việt Hùng cho biết dự kiến dự án này sẽ có khoảng 3 năm để hoàn thành hệ sinh thái.

trí tuệ nhân tạo 1403 a.jpg — Đại diện các bên triển khai dự án ViGen. Ảnh: MINH TRÚC

Tại họp báo, ông Sarim Aziz, Giám đốc Chính sách Công tại Meta nhấn mạnh, 2025 là một năm bản lề với tiến trình phát triển AI tại Việt Nam và Meta vinh dự được hợp tác cùng NIC và Tổ chức AI for Vietnam để triển khai dự án này.

Theo đại diện Meta, đây là dự án cho đất nước Việt Nam bởi để phát triển AI thì AI phải bao trùm trên cả nước và dành cho mọi đối tượng. Đó cũng chính là điều mà dự án này hướng tới.

Nhằm hỗ trợ dự án, Meta sẽ đóng góp hơn 20 bộ dữ liệu mã nguồn mở, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của AI.

Theo đó, Meta và Deloitte đã công bố cuốn cẩm nang dành cho khu vực công mang tên “Đổi mới sáng tạo trong khu vực công ở Châu Á – Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama”.

Nói về việc chuẩn hoá tiếng Việt cho Llama, PGS.TS Nguyễn Trường Thắng – Viện trưởng Viện Công nghệ Thông tin, Viện Hàn Lâm và Khoa học Công nghệ Việt Nam – một trong những đối tác của ViGen cho biết, AI là những “cậu bé” 5,6 tuổi do các tập đoàn công nghệ tạo ra có khả năng suy nghĩ hấp thụ thông tin nhanh. Và Llama là một “cậu bé” do Meta tạo ra giống như ChatGPT cho Open AI và Gemini của Google.

Tuy nhiên với việc được xây dựng trên nền tảng mã nguồn mở, khác với ChatGPT, chúng ta có thể hiểu cách hoạt động cũng dạy và huấn luyện cho Llama. Song Llama hiện chủ yếu được huấn luyện bằng tiếng Anh, tiếng Pháp (99%), và rất ít tiếng Việt.

“Với việc được tạo ra từ mã nguồn mở giúp, chúng ta có thể tiếp cận và huấn luyện để biến Llama trở thành một “cậu bé” người Việt nhiều hơn”, ông Thắng nói và nhấn mạnh, dữ liệu để dạy và huấn luyện Llama là dữ liệu sạch, tiếng Việt chuẩn hoá, có đạo đức và minh bạch.

Tổng Bí thư Tô Lâm: Phát triển trí tuệ nhân tạo, xác định AI là mũi nhọn đột phá

Theo dõi Báo Pháp Luật Tp HCM trên Google News

Nguồn: https://plo.vn/ai-cua-meta-se-duoc-chuan-hoa-tieng-viet-post838912.html

AI của Meta sẽ được chuẩn hóa tiếng Việt

Tin Nóng Hôm Nay

Bảy thay đổi quan trọng về quy định giao dịch khi áp dụng hệ thống công nghệ thông tin mới cho thị trường chứng...

Đại diện Tập đoàn NVIDIA: Các doanh nghiệp AI, bán dẫn hãy coi Việt Nam là điểm đến tin cậy

Việt Nam – Hoa Kỳ ký nhiều thoả thuận hợp tác quan trọng

Bộ Công thương ra quy định mới, bỏ Tổ liên ngành điều hành giá xăng dầu

Bộ trưởng Công Thương làm việc với Trưởng đại diện Thương mại Hoa Kỳ

Giá vàng thế giới tăng vọt lên ngưỡng cao chưa từng thấy

Xây dựng bộ dữ liệu tiếng Việt mã nguồn mở phục vụ AI

Để muối Bạc Liêu trở thành ‘gia vị’ du lịch đắt giá

Cổ phiếu công nghệ bị bán mạnh, VN-Index đuối sức ở cuối phiên

Vàng miếng, vàng nhẫn đồng loạt lập đỉnh mới

Điều khoản sử dụng

Chính sách bảo mật

Miễn trừ trách nhiệm

Liên hệ