Lo han llamado AlterEgo

Desarrollan un dispositivo que lee la mente «escuchando» la voz interna del usuario

El futuro es ahora

El futuro es ahora. Un equipo de investigadores ha creado un dispositivo portátil que puede leer la mente de las personas cuando usan su voz interna, el que les permite controlar sistemas computarizados y hacer consultas sin hablar.

El dispositivo, llamado AlterEgo, utiliza electrodos adheridos a la piel y puede transcribir palabras que los usuarios no dicen en voz alta pero verbalizan internamente, informa The Guardian.

«Nuestra idea era: ¿podríamos tener una plataforma informática más interna, que combine humanos y máquinas de alguna manera y que se sienta como una extensión interna de nuestra propia cognición?», dijo Arnav Kapur uno de los investigadores del Media Lab del MIT (Instituto Tecnológico de Massachusett), que desarrollaron el aparato.

Kapur, quien describe el auricular como un dispositivo de «aumento de inteligencia» (IA, por intelligence-augmentation), lo presentó en la Asociación de Maquinaria para Computación en Tokio.

AlterEgo es de plástico blanco y se usa alrededor de la mandíbula y el mentón, afirmado sobre la parte superior de la oreja para mantenerlo en su lugar. Cuatro electrodos debajo del dispositivo hacen contacto con la piel y captan las sutiles señales neuromusculares que se activan cuando una persona verbaliza internamente. Cuando alguien dice palabras dentro de su cabeza, la inteligencia artificial dentro del dispositivo puede unir señales particulares a palabras particulares, ingresándolas en un computador.

Entonces el computador puede responder a través del dispositivo, usando un altavoz de conducción ósea que reproduce el sonido en el oído (sin la necesidad de un auricular), permitiendo al usuario escuchar el resto del mundo al mismo tiempo. La idea es crear una interfaz de computador aparentemente silenciosa, al que solo el usuario del dispositivo pueda hablar y escuchar.

«Básicamente no podemos vivir sin nuestros celulares y dispositivos digitales, pero por el momento, el uso de esos dispositivos es muy perturbador», dijo Pattie Maes, profesora de artes y ciencias de los nuevos medios del MIT. «Si quiero buscar algo que sea relevante para una conversación que estoy teniendo, tengo que encontrar mi teléfono y escribir el código de acceso, abrir una aplicación y escribir una palabra clave de búsqueda, y todo requiere que cambie completamente la atención de mi entorno y de la gente con la que estoy», agregó Maes, quien es profesora de Kapur.

Ella y sus alumnos han estado experimentando con nuevos factores de forma e interfaces para lograr el conocimiento y los servicios de los teléfonos inteligentes sin la intromisión que implica su uso en la vida diaria.

El dispositivo AlterEgo logró una precisión promedio del 92% en la transcripción  en una prueba con 10 personas, donde cada una tuvo aproximadamente 15 minutos de personalización. Eso es varios puntos porcentuales por debajo de la eficiencia de Google y su transcriptor de voz (95%), pero Kapur dice que el sistema mejorará su precisión con el tiempo. Se cree que el umbral humano en la precisión de la palabra hablada es de alrededor del 95%.

Kapur y su equipo están trabajando en la recopilación de datos para mejorar el reconocimiento y ampliar el número de palabras que AlterEgo puede detectar. Ya se puede usar para controlar una interfaz de usuario básica, como el sistema de transmisión Roku, mover y seleccionar contenido, reconocer números, jugar al ajedrez y realizar otras tareas básicas.

El objetivo final es que la interacción con asistentes de inteligencia artificial (como Assistant de Google, Alexa de Amazon o Siri de Apple) sea menos embarazoso y más íntimo, permitiendo a la gente comunicarse con estos sistemas silenciosamente. Suena como ciencia ficción, pero parece completamente posible.

El único inconveniente es que los usuarios tendrán que usar un dispositivo atado a la cara, algo que las gafas inteligentes no pudieron superar. Sin embargo los expertos creen que la tecnología tiene mucho potencial, no solo en el espacio del consumidor –para actividades como el dictado- sino también en la industria.

«¿No sería genial comunicarse con la voz en un entorno donde normalmente no podrías?», dijo Thad Starner, profesor de informática en el Instituto de Tecnología de Georgia en Atlanta. «Puedes imaginar todas esas situaciones en las que tienes un entorno de alto ruido; lugares con mucha maquinaria, como una planta de energía o una imprenta», explicó Starner, quien también ve su utilidad en el ejército y para las personas con dificultades de habla.

Síguenos y suscríbete a nuestras publicaciones

Comparte ✌️

Comenta 💬