Ông có thể chia sẻ về quá trình phát triển Askonomy, đặc biệt là việc lựa chọn mô hình ngôn ngữ nhỏ (SML) thay vì các mô hình lớn hơn. Theo ông, những ưu điểm nào của SML đã đóng góp vào sự thành công ban đầu của Askonomy?
Ngay từ những ngày đầu, đội ngũ chúng tôi đã xác định rõ sứ mệnh của Askonomy: trở thành người bạn đồng hành tin cậy, cung cấp những thông tin kinh tế Việt Nam chính xác, sâu sắc và kịp thời nhất, dựa trên nền tảng dữ liệu phong phú của VnEconomy. Với mục tiêu này, chúng tôi đã tập trung phát triển một mô hình ngôn ngữ nhỏ, gọn nhưng vô cùng mạnh mẽ.
Chúng tôi không nhắm đến một AI đa nhiệm như ChatGPT hay Gemini, nên việc đào tạo một mô hình khổng lồ là hoàn toàn không cần thiết. Kích thước mô hình nhỏ giúp đào tạo mô hình nhanh hơn, rẻ hơn cũng như việc triển khai mô hình đơn giản, tiết kiệm chi phí. Nhờ đó, quá trình đào tạo và triển khai diễn ra nhanh chóng, thần tốc, tiết kiệm chi phí một cách đáng kể. Việc sở hữu một mô hình nhỏ, gọn còn giúp Askonomy hoạt động ổn định trên nhiều nền tảng khác nhau, mang đến trải nghiệm liền mạch cho người dùng, từ các chuyên gia đến những người quan tâm đến kinh tế.
Trong quá trình xây dựng Askonomy, đội ngũ Actable AI Việt Nam đã gặp phải những khó khăn gì khi làm việc với SML và các ông đã giải quyết chúng như thế nào?
Sử dụng mô hình ngôn ngữ nhỏ mặc dù có nhiều ưu điểm nhưng vẫn đi kèm với những thách thức nhất định. Mô hình SML có xu hướng “quên” thông tin nhanh hơn và đôi khi không tuân thủ chặt chẽ các hướng dẫn đã được cung cấp trong quá trình đào tạo. Để khắc phục những hạn chế này, chúng tôi đã tập trung vào việc tinh chỉnh các tham số đào tạo và xây dựng một bộ dữ liệu tăng cường đa dạng, phong phú. Điều này giúp mô hình không chỉ ghi nhớ thông tin hiệu quả hơn mà còn có khả năng suy luận và đưa ra những phản hồi linh hoạt, phù hợp với từng ngữ cảnh cụ thể.
Để huấn luyện mô hình ngôn ngữ nhỏ cho Askonomy, đội ngũ Actable AI đã sử dụng những kỹ thuật nào để cải thiện hiệu suất và độ chính xác của mô hình, đặc biệt là trong việc xử lý các câu hỏi phức tạp và ngữ cảnh đa dạng?
Việc lựa chọn và tinh chỉnh các tham số đào tạo, kết hợp với việc xây dựng một tập dữ liệu tăng cường đa dạng và phong phú là “chìa khóa” quyết định đến hiệu quả của quá trình đào tạo mô hình ngôn ngữ nhỏ. Bên cạnh đó, để nâng cao chất lượng đầu ra, chúng tôi đã tập trung vào việc trang bị cho mô hình khả năng nắm bắt ngữ cảnh dài. Nhờ đó, SML có thể truy xuất và xử lý một lượng lớn thông tin liên quan trước khi đưa ra câu trả lời, giảm thiểu đáng kể tình trạng sinh ảo giác (hallucination) và đảm bảo tính chính xác, nhất quán của thông tin.
Ngoài việc đảm bảo bảo mật dữ liệu người dùng, việc bảo vệ mô hình SML khỏi các cuộc tấn công cũng rất quan trọng. Ông có thể chia sẻ về các biện pháp bảo mật mà đội ngũ đã áp dụng cho Askonomy không?
Askonomy được xây dựng dựa trên dữ liệu công khai nên đảm bảo tính minh bạch và an toàn thông tin. Tuy nhiên, để chắc chắn rằng Askonomy chỉ cung cấp những thông tin chính xác và phù hợp, chúng tôi đã xây dựng một hệ thống lọc và đánh giá dữ liệu đầu vào một cách nghiêm ngặt. Bên cạnh đó, chúng tôi cũng tiến hành đào tạo mô hình với một tập dữ liệu chuyên biệt, tập trung vào các chủ đề kinh tế và tài chính, nhằm giúp Askonomy hiểu rõ hơn về phạm vi kiến thức của mình và tránh trả lời những câu hỏi ngoài lề hoặc nhạy cảm.
Ông đánh giá như thế nào về khả năng mở rộng của SML để đáp ứng nhu cầu ngày càng tăng của người dùng và các tính năng mới của Askonomy?
Trong cuộc đua phát triển AI, Askonomy đã tạo ra một lợi thế cạnh tranh đáng kể bằng việc sử dụng mô hình ngôn ngữ nhỏ. Nhờ kích thước nhỏ gọn, mô hình có thể được đào tạo và triển khai nhanh chóng, linh hoạt, giúp chúng tôi đáp ứng kịp thời những thay đổi của thị trường và nhu cầu đa dạng của người dùng. Đồng thời, chi phí đào tạo thấp cũng tạo điều kiện để chúng tôi liên tục cải tiến và cập nhật mô hình, đảm bảo rằng Askonomy luôn cung cấp những thông tin chính xác và hữu ích nhất.
Việc sử dụng SML có giúp giảm chi phí vận hành của Askonomy so với việc sử dụng mô hình ngôn ngữ lớn (LLM) không? Ông có thể đưa ra một số con số cụ thể để minh họa không?
Việc lựa chọn mô hình ngôn ngữ nhỏ cho phép chúng tôi triển khai Askonomy trên các GPU có cấu hình thấp hơn, giúp giảm đáng kể chi phí đầu tư phần cứng. Nhờ đó, chúng tôi có thể xây dựng một hệ thống phục vụ độc lập, không phụ thuộc vào các dịch vụ bên thứ ba như OpenAI. Kết quả là, chi phí vận hành của Askonomy giảm đến 10 lần so với việc sử dụng API, mang lại hiệu quả kinh tế cao và tính linh hoạt trong việc quản lý hệ thống.
Với kinh nghiệm phát triển Askonomy, ông có những dự định gì để nâng cao hơn nữa khả năng của Smartchat này trong tương lai, đặc biệt là trong việc tận dụng tối đa tiềm năng của SML?
Chúng tôi đang không ngừng nỗ lực để biến Askonomy trở thành một trợ lý ảo thông minh, đồng hành cùng người dùng trong cuộc sống hàng ngày. Việc triển khai Askonomy lên thiết bị di động là một bước tiến quan trọng trong việc hiện thực hóa tầm nhìn này. Điều này sẽ mang đến nhiều lợi ích, bao gồm: tính độc lập, bảo mật dữ liệu cao hơn, đặc biệt khi làm việc với dữ liệu nhạy cảm của khách hàng. Người dùng sẽ có thể truy cập và sử dụng Askonomy mọi lúc mọi nơi, ngay cả khi không có kết nối internet.
Actable AI có kế hoạch hợp tác với các nhà nghiên cứu và các công ty khác để cùng nhau phát triển cộng đồng SML tại Việt Nam như thế nào?
Với tầm nhìn mang Askonomy đến gần hơn với cuộc sống hàng ngày của người dùng, chúng tôi đang tích cực hợp tác với các đối tác công nghệ hàng đầu. Sự kết hợp này sẽ giúp chúng tôi tối ưu hóa Askonomy để hoạt động mượt mà trên các thiết bị di động, mang đến trải nghiệm người dùng liền mạch và thông minh. Qua đó, chúng tôi hướng tới mục tiêu xây dựng một hệ sinh thái dịch vụ dựa trên trí tuệ nhân tạo, phục vụ cho mọi đối tượng người dùng. Chúng tôi sẽ công bố những kế hoạch chi tiết hơn về các thỏa thuận hợp tác này trong thời gian tới.
Với sự phát triển nhanh chóng của công nghệ AI, anh có dự đoán gì về tương lai của mô hình ngôn ngữ nhỏ trong vài năm tới? Liệu mô hình ngôn ngữ nhỏ có thể trở thành xu hướng chủ đạo trong việc phát triển các chatbot thông minh và ứng dụng AI tại Việt Nam, thưa ông?
Tôi nghĩ hoàn toàn có thể. Việc gia tăng nhanh chóng của các mô hình ngôn ngữ nhỏ đang mở ra một chân trời mới trong lĩnh vực trí tuệ nhân tạo. Mặc dù có kích thước nhỏ gọn, nhưng khi được cung cấp thêm dữ liệu và được tối ưu hóa để thực hiện các nhiệm vụ cụ thể, các mô hình này đã chứng minh khả năng cạnh tranh đáng kể so với các mô hình lớn hơn. Đặc biệt, trong các lĩnh vực chuyên biệt với khối lượng dữ liệu hạn chế, các mô hình nhỏ lại trở thành một lựa chọn tối ưu, vừa đảm bảo hiệu suất cao vừa tiết kiệm chi phí.
VnEconomy 29/01/2025 14:00
Nội dung bài viết được đăng tải trên Tạp chí Kinh tế Việt Nam số 4 + 5/2025 phát hành ngày 27/1 – 9/2/2025. Kính mời Quý độc giả tìm đọc tại đây:
https://postenp.phaha.vn/tap-chi-kinh-te-viet-nam/detail/1168