21/03/2017 - 21:00

Phần mềm đọc tín hiệu môi hỗ trợ người khiếm thính

Các nhà khoa học Anh vừa phát triển chương trình mới dựa trên trí thông minh nhân tạo (AI), có thể đọc tín hiệu môi (hoặc khẩu hình) chính xác hơn cả con người. Tiến bộ này hứa hẹn sẽ trở thành trợ thủ đắc lực cho những người mất thính lực.

  Ảnh: ibtimes.com

Đó là phần mềm WAS (Watch, Attend and Spell – nghĩa là Xem, Chú ý và Đánh vần) do nhóm nghiên cứu tại Đại học Oxford sáng tạo. Hệ thống sử dụng thị giác máy tính và các phương pháp học máy để học cách đọc tín hiệu môi từ kho dữ liệu, được tập hợp từ các video của 6 chương trình truyền hình khác nhau (tổng thời lượng hơn 5.000 giờ, chứa hơn 118.000 câu thoại và 17.500 từ vựng).

Trong thử nghiệm, nhóm nghiên cứu đã so sánh khả năng đọc tín hiệu môi giữa một chuyên gia đọc khẩu hình và phần mềm WAS để xem nội dung chính của đoạn video câm là gì, bằng cách chỉ tập trung vào chuyển động môi của phát thanh viên. Kết quả, chuyên gia chỉ đọc chính xác 12% số từ, trong khi hệ thống WAS nhận diện đúng đến 50% số từ trong cơ sở dữ liệu. Lỗi của WAS cũng nhỏ, chẳng hạn như bỏ sót chữ "s" ở cuối từ.

Nhóm phát triển cho rằng phần mềm này có thể hỗ trợ cuộc sống của những người bị "nặng tai". Ví dụ, nó có thể giúp điện thoại thông minh hiểu được chỉ dẫn (hoặc khẩu lệnh) của họ trong môi trường ồn ào, hay lồng tiếng cho những bộ phim câm đã cũ. Ngoài ra, WAS cũng có thể được dùng để nâng cao độ chính xác của các hình thức nhận biết lời nói qua khẩu hình khác.

HẠNH NGUYÊN (Theo Zeenews, ibtimes.com)

Chia sẻ bài viết