Trade247
      Tìm kiếm...
      Đề xuấtKhám phá
      • Về chúng tôi
      • Thỏa thuận người dùng
      • Chính sách bảo mật
      • Quảng cáo
      Business

      VT-Super-120B-A12B: Viettel AI tham gia cuộc đua mô hình ngôn ngữ lớn tiếng Việt 120 tỷ tham số

      TL;DR

      Viettel AI công bố mô hình LLM VT-Super-120B-A12B với 120 tỷ tham số, tập trung vào dữ liệu tiếng Việt. Mô hình này nhắm đến các bài toán đặc thù của cơ quan, tổ chức và doanh nghiệp trong nước, với ứng dụng đầu tiên là Trợ lý AI Pháp luật.

      Điểm chính

      • Viettel AI ra mắt VT-Super-120B-A12B, LLM 120 tỷ tham số.
      • Mô hình được huấn luyện trên dữ liệu tiếng Việt và nghiệp vụ nội địa.
      • Ứng dụng đầu tiên là Trợ lý AI Pháp luật, hỗ trợ phân tích hồ sơ và đối chiếu quy định.

      Fact-check: Verified

      Hiện tượng thực tế và những mảnh ghép thông tin

      Viettel AI vừa công bố mô hình ngôn ngữ lớn (LLM) VT-Super-120B-A12B. Mô hình có quy mô 120 tỷ tham số.

      Đây là một trong những mô hình AI tiếng Việt có quy mô lớn nhất. Nó được đội ngũ kỹ sư trong nước trực tiếp huấn luyện và tối ưu.

      Mô hình đạt hiệu suất thuộc nhóm dẫn đầu trong cùng phân khúc quy mô. Kết quả này dựa trên các bài kiểm tra đánh giá.

      Điểm khác biệt chính nằm ở dữ liệu huấn luyện. Mô hình sử dụng dữ liệu tiếng Việt và dữ liệu nghiệp vụ trong nước.

      Thông số kỹ thuậtGiá trị
      Tên mô hìnhVT-Super-120B-A12B
      Quy mô tham số120 tỷ
      Kiến trúc nền tảngNVIDIA Nemotron 3 Super (mở)
      Đơn vị phát triểnViettel AI
      Người đại diệnÔng Nguyễn Mạnh Quý, Giám đốc Viettel AI

      Bản chất dòng vốn và chiến lược đang vận hành ra sao

      Việc phát triển LLM nội địa phản ánh chiến lược làm chủ công nghệ hạ tầng. Ông Nguyễn Mạnh Quý cho rằng AI đang trở thành một hạ tầng công nghệ quan trọng.

      Mô hình được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super. Chiến lược này giúp duy trì hiệu năng tiếng Anh của phiên bản gốc.

      Mô hình hạn chế tình trạng suy giảm kiến thức đã học sau quá trình huấn luyện bổ sung. Đây là một thách thức kỹ thuật phổ biến trong fine-tuning LLM.

      Một thế mạnh kỹ thuật khác là khả năng xử lý ngữ cảnh dài. AI có thể theo dõi và liên kết thông tin xuyên suốt nhiều tài liệu, quy trình hoặc hội thoại phức tạp.

      Viettel AI cho biết đây là yếu tố quan trọng cho bài toán thực tế tại Việt Nam. Quy trình xử lý công việc thường liên quan đến nhiều loại hồ sơ, văn bản và quy định.

      Dữ liệu huấn luyện bao gồm nhiều nguồn tiếng Việt:

      • Dữ liệu hành chính
      • Dữ liệu doanh nghiệp
      • Hội thoại thực tế
      • Tài liệu chuyên ngành

      Quá trình huấn luyện trải qua nhiều giai đoạn: mở rộng kiến thức tiếng Việt, nâng cao khả năng suy luận, cải thiện chất lượng phản hồi.

      Bối cảnh và các dữ kiện cần theo dõi

      NVIDIA, với tư cách đối tác công nghệ, đánh giá việc phát triển mô hình AI dựa trên ngôn ngữ và dữ liệu bản địa. Điều này góp phần mở rộng khả năng ứng dụng AI trong nhiều lĩnh vực.

      Trên nền tảng VT-Super-120B-A12B, Viettel AI đang phát triển các hệ thống AI Agent. Các agent này có khả năng tự thực hiện nhiều tác vụ liên tiếp.

      Ứng dụng đầu tiên là Trợ lý AI Pháp luật. Hệ thống này hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đưa ra gợi ý xử lý.

      Định hướng ứng dụng của mô hình mới bao gồm nhiều lĩnh vực:

      • Hành chính công
      • Chăm sóc khách hàng
      • Vận hành doanh nghiệp
      • Phân tích dữ liệu

      Mục tiêu là xây dựng các hệ thống AI hiểu rõ ngôn ngữ, dữ liệu và nhu cầu thực tế của người dùng Việt Nam.

      LLMNguyễn Mạnh QuýVT-Super-120B-A12BNVIDIAViettel AITrợ lý AI Pháp luật

      Nguồn tham khảo

      1. PLO.vn
      2. Viettel AI (công bố chính thức)
      3. NVIDIA (đối tác công nghệ)

      Câu hỏi thường gặp

      VT-Super-120B-A12B là gì?
      Đây là mô hình ngôn ngữ lớn (LLM) tiếng Việt do Viettel AI phát triển, có quy mô 120 tỷ tham số, xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super.
      VT-Super-120B-A12B khác gì so với ChatGPT?
      Mô hình được huấn luyện chuyên sâu trên dữ liệu tiếng Việt và dữ liệu nghiệp vụ trong nước, giúp xử lý các yêu cầu gắn với thực tế tại Việt Nam tốt hơn.
      Ứng dụng đầu tiên của VT-Super-120B-A12B là gì?
      Ứng dụng đầu tiên là Trợ lý AI Pháp luật, hỗ trợ phân tích hồ sơ, đối chiếu quy định và tổng hợp dữ liệu.

      Bài nổi bật

      #1

      Từ cảnh báo khủng hoảng thừa thép của OECD: Áp lực cạnh tranh và rủi ro chu kỳ ngành thép toàn cầu

      Nguyễn Tuấn Anh

      #2

      Từ video bí ẩn của Mourinho: Bài toán quyền lực và chi phí chuyển nhượng tại Real Madrid

      Nguyễn Tuấn Anh

      #3

      Từ dự án điện rác 1.919 tỷ đồng tại Vĩnh Long: Nhìn về dòng vốn đầu tư hạ tầng xử lý chất thải và áp lực chi phí vốn

      Nguyễn Tuấn Anh

      #4

      Từ câu chuyện 10 nhà máy điện sinh khối ngành đường ngưng hoạt động: Áp lực chi phí vốn và rủi ro chính sách giá điện

      Nguyễn Tuấn Anh

      #5

      Giá dầu thế giới giảm gần 5%: Dòng tiền rút khỏi rủi ro địa chính trị, chuyển trọng tâm sang nhu cầu tiêu thụ

      Nguyễn Tuấn Anh

      #6

      Từ kiến nghị nhà ở cho người lao động: Áp lực chi phí sinh hoạt và tác động đến dòng tiền tiêu dùng

      Nguyễn Tuấn Anh