Hiện tượng thực tế và những mảnh ghép thông tin
Viettel AI vừa công bố mô hình ngôn ngữ lớn (LLM) VT-Super-120B-A12B. Mô hình có quy mô 120 tỷ tham số.
Đây là một trong những mô hình AI tiếng Việt có quy mô lớn nhất. Nó được đội ngũ kỹ sư trong nước trực tiếp huấn luyện và tối ưu.
Mô hình đạt hiệu suất thuộc nhóm dẫn đầu trong cùng phân khúc quy mô. Kết quả này dựa trên các bài kiểm tra đánh giá.
Điểm khác biệt chính nằm ở dữ liệu huấn luyện. Mô hình sử dụng dữ liệu tiếng Việt và dữ liệu nghiệp vụ trong nước.
| Thông số kỹ thuật | Giá trị |
|---|---|
| Tên mô hình | VT-Super-120B-A12B |
| Quy mô tham số | 120 tỷ |
| Kiến trúc nền tảng | NVIDIA Nemotron 3 Super (mở) |
| Đơn vị phát triển | Viettel AI |
| Người đại diện | Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI |
Bản chất dòng vốn và chiến lược đang vận hành ra sao
Việc phát triển LLM nội địa phản ánh chiến lược làm chủ công nghệ hạ tầng. Ông Nguyễn Mạnh Quý cho rằng AI đang trở thành một hạ tầng công nghệ quan trọng.
Mô hình được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super. Chiến lược này giúp duy trì hiệu năng tiếng Anh của phiên bản gốc.
Mô hình hạn chế tình trạng suy giảm kiến thức đã học sau quá trình huấn luyện bổ sung. Đây là một thách thức kỹ thuật phổ biến trong fine-tuning LLM.
Một thế mạnh kỹ thuật khác là khả năng xử lý ngữ cảnh dài. AI có thể theo dõi và liên kết thông tin xuyên suốt nhiều tài liệu, quy trình hoặc hội thoại phức tạp.
Viettel AI cho biết đây là yếu tố quan trọng cho bài toán thực tế tại Việt Nam. Quy trình xử lý công việc thường liên quan đến nhiều loại hồ sơ, văn bản và quy định.
Dữ liệu huấn luyện bao gồm nhiều nguồn tiếng Việt:
- Dữ liệu hành chính
- Dữ liệu doanh nghiệp
- Hội thoại thực tế
- Tài liệu chuyên ngành
Quá trình huấn luyện trải qua nhiều giai đoạn: mở rộng kiến thức tiếng Việt, nâng cao khả năng suy luận, cải thiện chất lượng phản hồi.
Bối cảnh và các dữ kiện cần theo dõi
NVIDIA, với tư cách đối tác công nghệ, đánh giá việc phát triển mô hình AI dựa trên ngôn ngữ và dữ liệu bản địa. Điều này góp phần mở rộng khả năng ứng dụng AI trong nhiều lĩnh vực.
Trên nền tảng VT-Super-120B-A12B, Viettel AI đang phát triển các hệ thống AI Agent. Các agent này có khả năng tự thực hiện nhiều tác vụ liên tiếp.
Ứng dụng đầu tiên là Trợ lý AI Pháp luật. Hệ thống này hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đưa ra gợi ý xử lý.
Định hướng ứng dụng của mô hình mới bao gồm nhiều lĩnh vực:
- Hành chính công
- Chăm sóc khách hàng
- Vận hành doanh nghiệp
- Phân tích dữ liệu
Mục tiêu là xây dựng các hệ thống AI hiểu rõ ngôn ngữ, dữ liệu và nhu cầu thực tế của người dùng Việt Nam.