Hệ thống tương tác người – máy thông minh Blife của các nhà khoa học trường ĐH Công nghệ, ĐHQGHN, hứa hẹn về khả năng cải thiện giao tiếp và phục hồi chức năng ngôn ngữ cho những người bị chấn thương.
Chúng ta hẳn đã quen thuộc với hình ảnh nhà vật lý lý thuyết Stephen Hawking trên xe lăn dùng cơ má để điều khiển giao tiếp với máy tính bằng cách lần lượt chọn từng chữ cái trên màn hình trước mặt, ghép lại thành các từ trong giao tiếp. Những đổi mới về công nghệ khiến quá trình này của ông diễn ra dễ dàng hơn, ví dụ cho phép chọn các từ, cụm từ trong một bộ nhớ chứa khoảng 2500-3000 lựa chọn được quét theo dòng, cột rồi được máy tính đọc ra thành tiếng.
Có lẽ ít ai hình dung là những kết quả tương tự sẽ diễn ra chính tại Việt Nam và người thụ hưởng cũng chính là người Việt Nam. Một cách lặng lẽ, nhóm nghiên cứu tại Phòng thí nghiệm tương tác Người-Máy, trường ĐH Công nghệ, Đại học Quốc gia Hà Nội, do PGS. TS. Lê Thanh Hà dẫn dắt đã theo đuổi hướng nghiên cứu này. Họ tập trung việc khai thác các tín hiệu chuyển động mắt và tín hiệu điện não nhằm giúp người bệnh tương tác với máy tính dễ dàng hơn, từ đó họ có thể thực hiện giao tiếp nhanh và hiệu quả hơn. Một trong những sản phẩm đáng chú ý của nhóm là hệ thống Blife.
Phát triển thiết bị vừa tiện dụng, vừa phải chăng
Xuất phát từ chính sự không may mắn của người thầy của mình, PGS. TS Lê Thanh Hà đã nảy ra ý tưởng tạo ra một thiết bị giúp việc giao tiếp của người đột quỵ trở nên dễ dàng hơn. Qua những lần thăm hỏi thầy, anh nhận thấy những người bị đột quỵ nặng có thể bị tổn thương cả về thể chất và tinh thần bởi vừa gặp khó khăn trong việc di chuyển lại vừa bị tạm mất chức năng nói, chức năng nhận thức, ít nhận biết xung quanh và khó diễn đạt được những nhu cầu thiết yếu của mình. Do vậy, cuộc sống của những bệnh nhân này phụ thuộc hoàn toàn vào người chăm sóc họ.
Qua tìm hiểu, anh nhận thấy trên thế giới có không ít những thiết bị tương tự nhưng giá thành của chúng ở mức khá cao với khoảng 350 – 400 triệu đồng, cao hơn hẳn khả năng chi trả của người thu nhập trung bình ở Việt Nam. Bên cạnh đó còn có thêm một rào cản không nhỏ, đó là hầu hết thiết bị nước ngoài đều không hỗ trợ ngôn ngữ tiếng Việt, khó có thể cho nhiều người Việt sử dụng. Đây cũng là những điều thôi thúc PGS. TS Lê Thanh Hà phải làm ra một thiết bị hữu ích nhưng “với mức kinh phí phù hợp nhất, tiện dụng nhất để nhiều người có nhu cầu của Việt Nam có thể dùng được”.
Trên những mục tiêu đó, anh và cộng sự đã phát triển một chiếc máy mang tên My Beautiful Life (gọi tắt là Blife), bao gồm một camera chuyên dụng đọc cử động mắt và chuyển tín hiệu đó thành tọa độ trên màn hình, giúp người dùng chọn hình ảnh hiển thị hoặc từ ngữ tiếng Việt để phát qua loa. Người dùng cũng có thể thực hiện các tương tác khác như ghi chú, tìm duyệt thông tin trên internet, viết email hay tham gia mạng xã hội. Ngoài phục vụ những người bị tổn thương chức năng vận động, các tác giả cho biết Blife cũng có thể được tùy chỉnh để hỗ trợ những người hoàn toàn khỏe mạnh nhưng ở tình huống không thể sử dụng cách thông thường để tương tác với máy tính, chẳng hạn trong môi trường thực tại ảo, du hành vũ trụ…
Có trong tay Blife, PGS. TS Lê Thanh Hà háo hức muốn xem nó có thực sự hỗ trợ được người dùng hay không. Đó là lý do anh đã kết hợp với các bác sỹ trong Bệnh viện Quân y 103 và áp dụng cho một số người bệnh. Theo dõi quá trình họ sử dụng, anh nhận thấy với những người bệnh chức năng mắt khỏe, một phút có thể nhập được trung bình 20 ký hiệu, trong khi với những người yếu hơn, tốc độ giảm xuống còn 5-6 ký hiệu/phút.
Tuy nhiên, tốc độ tương tác bằng mắt của người dùng chậm hơn rất nhiều so với tương tác bàn phím. Do vậy, anh và nhóm nghiên cứu tiếp tục phát triển các kỹ thuật khác để chuyển tương tác sang tiếng Việt nhanh hơn, trong đó có sóng điện não. Trên thực tế, dùng điện não để ‘đọc hiểu’ suy nghĩ của con người là hướng nghiên cứu mới mẻ trên thế giới. Một số ít nhóm nghiên cứu tiên phong như Viện khoa học thần kinh Weill của ĐH California San Francisco (Mỹ) dưới sự tài trợ của Facebook vào năm ngoái đã tuyên bố kết quả thử nghiệm tương tự với tốc độ viết khoảng 150 từ/phút và độ chính xác từ 47-76%.
“Hiện tại chưa có nơi nào kết hợp được hai tín hiệu mắt và điện não thành công để giúp người dùng tương tác tốt hơn” PGS. TS Lê Thanh Hà chia sẻ. Não người mặc dù suy nghĩ nhanh, nhưng việc đọc suy nghĩ người trực tiếp là điều không thể. Người ta phải sử dụng các phương pháp gián tiếp khác như phân tích tín hiệu điện não, kết hợp với dữ liệu đã xây dựng để tính toán khả năng diễn đạt một câu từ nhất định và đưa ra những gợi ý mà người dùng có thể muốn nói.
Để làm được điều này, các thí nghiệm tín hiệu phải được thiết kế đồng bộ, mẫu dữ liệu đo được phải lớn và có khả năng bao quát cao. Bên cạnh đó, các mô hình học máy cần có khả năng kết hợp nhiều dạng tín hiệu cùng với mô hình ngôn ngữ tiếng Việt một cách hiệu quả.
Do đây là một hướng đi mới và ẩn chứa nhiều vấn đề phức tạp trong kỹ thuật và công nghệ, đồng thời cần nhiều thời gian và kinh phí hơn, nên PGS. TS Lê Thanh Hà và nhóm nghiên cứu đã xây dựng đề xuất và gửi tới các quỹ tài trợ nghiên cứu khoa học lớn như Quỹ đổi mới sáng tạo VinGroup (VinIF) và Quỹ phát triển Khoa học và Công nghệ ĐHQGHN. Với sự hỗ trợ của hai quỹ này, nhóm nghiên cứu tiếp tục phát triển sản phẩm theo hướng sử dụng bổ sung tín hiệu điện não kết hợp với chuyển động mắt để người sử dụng có thể thực hiện giao tiếp bằng tiếng Việt dễ dàng hơn và có thể dễ dàng tương tác với các thiết bị trong nhà thông minh.
Bước chân vào địa hạt mới, họ sẽ phải mở rộng hợp tác hơn. Ngoài việc hợp tác với Học viện Quân Y để xây dựng kịch bản thu nhận dữ liệu, thu dữ liệu, và kiểm thử hệ thống, họ cũng đang làm việc với các chuyên gia từ Anh và Nhật để giúp phát triển các kỹ thuật học máy.
Xây dựng nền tảng phục vụ trị liệu ngôn ngữ
Blife là một hệ thống không chỉ hỗ trợ giao tiếp mà nhóm nghiên cứu còn mở rộng hệ thống này nhằm hỗ trợ phục hồi cho người bị rối loạn ngôn ngữ. Nền tảng hỗ trợ trị liệu ngôn ngữ mà nhóm nghiên cứu đang phát triển được đặt tên là Aigle – theo tên một vị thần sức khỏe của Hy Lạp.
“Ở Việt Nam và nhiều nơi trên thế giới, chúng ta mới chỉ quan tâm đến vật lý trị liệu, tức làm thế nào để vận động lại được. Nhưng vẫn còn một khoảng trống rất lớn về trị liệu ngôn ngữ chưa được quan tâm đúng mực”, PGS. TS. Lê Thanh Hà chia sẻ. Hiện tại nền tảng Aigle đã có những bài tập đơn giản giúp các bệnh nhân bị rối loạn ngôn ngữ luyện tập nhằm tăng khả năng phục hồi.
Thử nghiệm Aigle với các bệnh nhân của mình, BS. TS. Nguyễn Văn Tuấn, Chủ nhiệm bộ môn, Khoa Vật lý trị liệu và Phục hồi chức năng, Bệnh viện Quân y 103, bày tỏ niềm phấn khích với công cụ hỗ trợ điều trị mới này. “Nhóm bệnh tổn thương chức năng ngôn ngữ khá thường gặp nhưng hiện tại, chúng tôi chưa có công cụ nào hỗ trợ điều trị cho người bệnh. Ở Việt Nam, việc trị liệu ngôn ngữ hiện tại chủ yếu do các bác sĩ trị liệu ngôn ngữ thực hiện trực tiếp. Công cụ hỗ trợ như Aigle giúp giảm tải cho đội ngũ bác sĩ trị liệu ngôn ngữ với số lượng vốn đang rất ít ỏi, cũng như giúp tăng hiệu quả điều trị và tăng khả năng phục hồi ngôn ngữ của người bệnh,” ông nói.
PGS. TS. Lê Thanh Hà cùng các cộng sự đang hợp tác với các bác sĩ chuyên môn tại Bệnh viện Quân y 103 nhằm xây dựng một kho dữ liệu các bài luyện tập hỗ trợ trị liệu ngôn ngữ. Trên nền tảng nội dung này, Aigle cho phép các bác sĩ trị liệu ngôn ngữ có thể tự tạo các bài luyện tập và lộ trình điều trị phù hợp với từng bệnh nhân. Nhóm nghiên cứu cho biết họ đã xây dựng “gần như hoàn chỉnh” nền tảng nội dung và hiện đang kết nối chúng với ứng dụng trên thiết bị di động. Hệ thống này sẽ không chỉ hữu ích với những bệnh nhân trưởng thành bị rối loạn ngôn ngữ do đột quỵ (nhóm này chiếm tỉ lệ rất lớn) mà còn có thể hỗ trợ trị liệu ngôn ngữ cho trẻ em tự kỉ và nhiều nhóm đối tượng khác.
Hiện tại, hệ thống Blife đã được chấp nhận đơn đăng kí sáng chế và bảo hộ nhãn hiệu tại Cục Sở hữu trí tuệ (Bộ KH&CN) vào tháng 4/2020. Các tác giả cho biết họ sẽ tiếp tục bảo hộ sở hữu trí tuệ với những thiết kế tiếp theo.
Theo Ngô Hà/Khoa học và Phát triển
Ảnh: PGS.TS Lê Thanh Hà và một bệnh nhân đang dùng thiết bị Blife. Nguồn: VNU-Media