Una nueva tecnología de audífonos de IA puede ayudar a las personas a «sintonizar» a personas específicas de una multitud, lo que les permite escuchar mejor a un orador incluso en ambientes ruidosos.
Con el sistema, llamado «Target Speech Hearing», un usuario que usa auriculares mira a una persona que habla durante tres a cinco segundos para «inscribirla», informan los investigadores.
Luego, la IA cancela todos los demás sonidos en el entorno y solo reproduce la voz del orador inscrito, incluso si el oyente se está moviendo y ya no mira hacia el orador.
«Con nuestros dispositivos, ahora se puede escuchar claramente a un solo hablante, incluso si se está en un ambiente ruidoso con muchas otras personas hablando», dijo el investigador sénior, Shyam Gollakota, profesor de ciencias de la computación e ingeniería de la Universidad de Washington.
El sistema de IA imita y mejora la capacidad del cerebro humano para concentrarse en el habla proveniente de una sola persona, explicaron los investigadores.
Para usar el sistema, una persona que usa auriculares listos para usar equipados con micrófonos toca un botón mientras mira directamente a alguien que habla.
Las ondas sonoras de la voz del orador llegan a los micrófonos a ambos lados de los auriculares, y la señal se reenvía a la IA instalada en los auriculares.
La IA aprende los patrones vocales del hablante y se aferra a la voz de la persona, continuando reproduciéndola incluso si el hablante y el oyente se mueven. La capacidad del sistema para concentrarse en el hablante incluso mejora a medida que sigue hablando, dijeron los investigadores.
El equipo de investigación probó el sistema en 21 personas, que calificaron la claridad de la voz de los hablantes inscritos casi dos veces más alta, en promedio, que su voz en audio sin filtrar.
Los investigadores presentaron sus hallazgos recientemente en Honolulu en la Conferencia ACM CHI sobre Factores Humanos en Sistemas Informáticos. Los hallazgos presentados en reuniones científicas deben considerarse preliminares hasta que se publiquen en una revista revisada por pares.
El código informático de su dispositivo de prueba de concepto está disponible para que otros puedan construirlo, pero el sistema no está disponible comercialmente.
Actualmente, el sistema solo puede inscribir a un orador a la vez, y no puede inscribir a un orador si hay otra voz fuerte que viene de la misma dirección, dijeron los investigadores.
El equipo está trabajando para expandir el sistema a auriculares y audífonos en el futuro.