Đội ngũ phát triển của VinBigdata tạo dấu ấn với các sản phẩm AI tích hợp công nghệ xử lý ngôn ngữ và tiếng nói như ViVi, ViChat, ViVoice, ViBio.
Trợ lý ảo ViVi 2.0
"ViVi 2.0 tích hợp công nghệ AI tạo sinh khá ấn tượng. Từ câu trả lời từ lịch sử, địa lý tới tư vấn quán ăn, điểm du lịch đều không làm khó được ViVi, cách trả lời cũng linh hoạt, giống như người thật", anh Hoàng Linh, một khách hàng trải nghiệm ViVi 2.0 trên VF 8 Lux Plus tại Hà Nội nói.
Trợ lý ảo ViVi 2.0 tích hợp trên xe VinFast VF 8 Lux Plus. Ảnh: VF
Giới chuyên gia và người dùng ấn tượng với chỉ số thông minh của ViVi 2.0 cũng như năng lực của đội ngũ phát triển – VinBigdata.
Theo đại diện của nhà sản xuất, sản phẩm AI thế hệ mới được đánh giá ưu việt hơn so với phiên bản trước đó ở khả năng tương tác linh hoạt theo từng ngữ cảnh. Thay vì hỏi - đáp với trợ lý ảo thông qua những câu lệnh mẫu có sẵn, giờ đây, người dùng có thể trò chuyện một cách tự nhiên với đa dạng các chủ đề khác nhau như lịch sử, văn hoá, địa lý, danh nhân....
Đại diện đội ngũ phát triển VinBigdata cho biết bên cạnh kho tri thức lên tới 3.500 TB dữ liệu đặc trưng, cùng hơn 30.000 giờ dữ liệu giọng nói chất lượng cao. Trợ lý ảo ViVi 2.0 còn có sự cải thiện về khả năng nhận dạng tiếng nói, hiểu và phân tích ngữ cảnh để phản hồi người dùng một cách chính xác và phù hợp.
Bên cạnh ViVi, một số sản phẩm của đội ngũ phát triển VinBigdata cũng gây chú ý về việc tích hợp công nghệ xử lý ngôn ngữ và tiếng nói như ViChat (Chatbot tích hợp AI tạo sinh), ViVoice (Callbot tích hợp AI tạo sinh), hay ViGPT (ChatGPT phiên bản Việt đầu tiên dành cho người dùng cuối).
"Các sản phẩm AI này hiện đang được triển khai tại hệ sinh thái Vingroup cùng hàng chục doanh nghiệp và cơ quan chính phủ trên cả nước như Bộ Thông tin và Truyền thông (thử nghiệm cùng Trung tâm Thông tin), Ngân hàng ACB, Lado Taxi... giúp hỗ trợ tự động hóa nhiều tác vụ thủ công", đại diện VinBigdata nói.
Vị này cho biết thêm, các sản phẩm được đánh giá giúp doanh nghiệp, tổ chức tối ưu nguồn lực và gia tăng trải nghiệm đồng thời giúp người dùng tiếp cận và sử dụng các dịch vụ một cách nhanh chóng, đơn giản và hiệu quả.
Công nghệ giọng nói của VinBigdata
Theo VinBigdata, chỉ sáu tháng sau khi công bố ra mắt ViGPT - "ChatGPT phiên bản Việt" đầu tiên dành cho người dùng cuối (tháng 12/2023), VinBigdata đã tiếp tục tiến thêm một bước trong việc nghiên cứu, kết hợp mô hình ngôn ngữ lớn nhằm nâng cao chất lượng của hệ thống nhận dạng tiếng nói.
Công nghệ sinh trắc học giọng nói ViBio. Ảnh: VinBigdata
Thành tựu khoa học này vừa được chấp thuận và sẽ được công bố tại Interspeech 2024 (Hội nghị toàn diện và lớn nhất thế giới về công nghệ xử lý tiếng nói) vào tháng 9 tới đây. "Trong nghiên cứu, VinBigdata đề xuất một kiến trúc mới có sử dụng mô hình ngôn ngữ lớn để cung cấp thông tin ngữ cảnh, giúp hệ thống AI cải thiện độ chính xác khi nhận dạng tiếng nói", đại diện VinBigdata nói.
Nghiên cứu mở ra một hướng đi mới có khả năng giải quyết các hạn chế hiện tại của hệ thống nhận dạng tiếng nói, đặc biệt trong các điều kiện không thuận lợi như môi trường nhiều tạp âm, giọng vùng miền, thiếu thông tin ngữ cảnh và sử dụng các từ hiếm (tên riêng, từ ngoại lai...).
Kết quả thực nghiệm khẳng định hệ thống của VinBigdata cải thiện tỷ lệ lỗi từ (Word error rate - WER) trung bình lên tới 30% so với hệ thống nhận dạng tiếng nói thông thường.
"Công bố khoa học tại hội nghị hàng đầu quốc tế Interspeech thể hiện sự đầu tư của chúng tôi cho việc nghiên cứu và làm chủ công nghệ tiếng nói từ tầng lõi đang đi đúng hướng. Với nghiên cứu này, VinBigdata kỳ vọng sẽ từng bước ứng dụng công nghệ mới nhằm gia tăng hiệu quả, độ chính xác và trải nghiệm của người dùng khi tương tác với các hệ thống AI như trợ lý ảo". TS. Nguyễn Kim Anh, Giám đốc Sản phẩm VinBigdata nói.
Bên cạnh nghiên cứu trên, ViBio - sản phẩm sinh trắc học giọng nói của VinBigdata - cũng vừa được công nhận đạt ISO 19795-1 và ISO 19795-2 theo tiêu chuẩn của Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST).
Theo công bố từ nhà sản xuất, từ kiểm thử của FIME (Phòng thí nghiệm thuộc chương trình NIST/NVLAP Hoa Kỳ), thuật toán của ViBio có độ chính xác vượt trội khi xác thực giọng nói, với tỷ lệ xác thực sai chỉ 0,00175% trên các mẫu giọng được thu thập tại Việt Nam.
Trước khi xác lập hai thành tựu mới với Interspeech hay chứng nhận của Viện Tiêu chuẩn và Công nghệ Quốc gia của Mỹ (NIST), VinBigdata đã sở hữu gần 100 công bố khoa học tại các tạp chí, hội nghị hàng đầu thế giới. Đây là nền tảng cho sự ra đời của các sản phẩm công nghệ do VinBigdata phát triển.
"Trong tương lai, chúng tôi sẽ tiếp tục đầu tư nghiên cứu công nghệ, củng cố cơ sở dữ liệu và phát triển các sản phẩm AI tiên tiến, có khả năng giải quyết những bài toán hóc búa mà người dân, doanh nghiệp Việt đang gặp phải, nhằm góp phần vào công cuộc chuyển đổi số toàn diện của đất nước và khẳng định năng lực công nghệ Việt trên trường quốc tế", TS. Nguyễn Kim Anh chia sẻ.
Hội An
Đăng thảo luận