Microsoft hôm nay thông báo hệ thống nhận dạng giọng nói hội thoại của hãng đã cán mốc 5,1% tỉ lệ lỗi, thấp nhất từ trước đến nay. Tỉ lệ này được cho là vượt xa mức 5,9% hồi năm ngoái, được nghiên cứu bởi nhóm Nghiên cứu và Trí tuệ nhân tạo Microsoft (Microsoft Microsoft Artificial Intelligence and Research).

Cả hai nghiên cứu đều tiến hành chuyển dịch lại các bản ghi âm từ kho ngữ liệu tổng đài Switchboard, vốn là một tập hợp khoảng 2.400 cuộc điện đàm, được các nhà nghiên cứu sử dụng để kiểm tra các hệ thống nhận dạng giọng nói kể từ đầu năm 1990.

Nghiên cứu mới nhất của Microsoft đã nâng độ chính xác của hệ thống này lên ngang độ chính xác của các chuyên viên chuyển biên chuyên nghiệp có khả năng nghe đi nghe lại một nội dung vài lần, nhập vai vào ngữ cảnh hội thoại và làm việc với các chuyên viên khác.

Qua nghiên cứu mới, các nhà khoa học đã làm giảm 12% tỉ lệ lỗi so với năm ngoái, nhờ vào cải tiến các mô hình ngôn ngữ và âm thanh dựa trên mạng thần kinh. Họ cũng cho phép hệ thống nhận dạng giọng nói sử dụng toàn bộ nội dung các cuộc thoại. Nhờ đó, hệ thống này có thể thực hiện việc chuyển biên phù hợp hơn với ngữ cảnh, cũng như dự đoán các từ hoặc cụm từ tiếp theo, theo cách tự nhiên mà con người giao tiếp với nhau.

Hệ thống nhận dạng giọng nói của Micosoft được dùng trong các dịch vụ như Cortana, Presentation Translator và Microsoft Cognitive Services…

Nguồn: techcrunch.com

BÌNH LUẬN

Please enter your comment!
Please enter your name here