Mejoran la comunicación para personas con dificultades en el habla mediante la Inteligencia Artificial
Un equipo de científicos del Conicet optimizó los sistemas de comunicación basados en pictogramas y teclados virtuales, a través de los cuales, los usuarios pueden transmitir mensajes.
Un equipo de científicos del Conicet participa del desarrollo y optimización de sistemas de comunicación destinados a personas con dificultades para comunicarse mediante el habla. Están basados en pictogramas y teclados virtuales, a través de los cuales, los usuarios pueden transmitir mensajes.
Desde hace tiempo, Matías Núñez y Francis Felici, del Instituto de Investigaciones en Biodiversidad y Medioambiente (Inibioma) y Alejandro Wainselboim, del Instituto de Ciencias Humanas, Sociales y Ambientales, trabajan en conjunto con Neufitech, una empresa de Bahía Blanca que desarrolla los sistemas de comunicación y otros productos de alta tecnología vinculados a la evaluación neuropsicológica.
El proyecto fue seleccionado en la convocatoria Soluciones Innovadoras para Desafíos de Software, organizada por el Ministerio de Ciencia y Tecnología y la Fundación Sadosky, destinada a financiar iniciativas de innovación en software y servicios informáticos de empresas nacionales que brinden soluciones a demandas concretas de la sociedad.
«El objetivo es atraer a investigadores para resolver problemáticas particulares de las empresas que quizás no tienen acceso a mano de obra altamente calificada o a gente con un background científico«, resumió el doctor en Física, Matías Nuñez, investigador del Conicet.
Neufitech ofrece un sistema de interfaz para personas con discapacidad que permite la comunicación a través de la mirada, usando un detector de movimiento ocular que está conectado a computadoras o tablets para seleccionar pictogramas y expresarse.
El sistema de comunicación, describió Nuñez, «es aumentativo en tanto incrementa la capacidad de comunicarse a personas con discapacidad». ¿Cómo funciona? Un detector ocular monitorea el movimiento de los ojos y de esta forma, la persona puede mover un cursor en la pantalla y elegir pictogramas para escribir y comunicarse. Sin embargo, se trataba de un proceso lento ya que muchas veces se requería de muchos pictogramas para armar una frase.
«Todo esto lleva un tiempo de espera que hace lenta la comunicación y nuestra tarea inicial fue acelerar este proceso para mejorar la interacción del usuario con la interfaz y mejorar su comunicación”, explica Núñez que se especializa en inteligencia artificial; mientras que Wainselboim es biólogo lingüista de Mendoza.
En este caso, los investigadores usaron herramientas de procesamiento natural del lenguaje con machine learning (es parte del campo de la Inteligencia Artificial). El objetivo fue acelerar el sistema para que el usuario pueda escribir más rápido. Con machine learning se usan algoritmos de predicción para textos; de modo que el usuario escribe y un menú aporta opciones sobre posibles continuaciones del texto.
«Lo que hicimos fue un predictor de pictogramas que optimiza el sistema. Como sucede en Whats App cuando te dice cuál podría ser la siguiente palabra que escribís, aunque en este caso adaptado a pictogramas y al lenguaje para chicos ya que gran parte de usuarios de esta interfaz (personas que nacieron sin poder comunicarse) tienen un desarrollo intelectual no mayor al de un chico de 10 años», expresó.
Por otro lado, los especialistas usaron modelos más complejos de Inteligencia Artificial, similares al Chat GPT aunque eligieron modelos de uso libre y no pagos. «Usamos modelos de uso libre. Hay pocos en español y gran parte del trabajo fue tomar uno en español, entrenarlo y hacer que aprenda del lenguaje usado por chicos», especificó.
Si un cliente quiere comprar el equipo, la empresa instala el software en tablets o computadoras. A su vez, una psicopedagoga enseña a usarlo.
El proyecto cuenta con una segunda etapa aunque aún no se firmó el convenio entre el Conicet y la Fundación Sadosky. Se trata de aplicar modelos de lenguaje de gran tamaño, llamados Large Language Models, combinado con modelos de imágenes.
De esta forma, dijo Nuñez, los usuarios del sistema “podrían ampliar su interacción, expresividad y lo que pueden hacer con la computadora, no sólo como predictor de pictogramas sino también como herramienta de creatividad. Para una persona inmovilizada que solo puede comunicarse a través del movimiento de sus ojos, estas nuevas funcionalidades podrían ser un gran cambio de calidad de vida”.
Nuñez resaltó que este proyecto tiene como fin conectar el sector privado con la investigación básica. “Es un incentivo para que los investigadores apliquen sus conocimientos y habilidades en problemáticas concretas con impacto directo en la sociedad. En el grupo de investigación tuvimos en un momento, una matemática, un biólogo lingüista, un biólogo matemático, dos físicos cuánticos: una interdisciplina interesante”, concluyó.
Comentarios