OPINIÓN: Deambulando por los pasillos del MWC 2023, tuve la oportunidad de probar el diseño de auriculares AR de referencia de Qualcomm. Si bien el hardware aún está en desarrollo y se enfoca principalmente en fabricantes y desarrolladores, la demostración introdujo algo que nunca antes había considerado: aprovechar la plataforma abierta de IA ChatGPT.

Qualcomm en realidad no producirá auriculares AR para los consumidores, pero la compañía ha lanzado algunos diseños de auriculares AR de referencia en los últimos años que esencialmente sirven como modelo para que otras compañías creen sus propios auriculares AR.

Poco a poco se están volviendo más compactos y menos parecidos a los voluminosos Microsoft HoloLens, pero esencialmente funcionan de la misma manera, aumentando el mundo real con elementos virtuales.

Los fabricantes ya están comenzando a aprovechar esta tecnología: Nreal Air es un buen ejemplo de un par de anteojos AR tempranos, pero aún queda un largo camino por recorrer antes de que estemos en un futuro completamente aumentado con anteojos AR delgados. El auricular que usé, por ejemplo, aún requiere una conexión por cable a un teléfono inteligente para procesar todos los datos del auricular.

Eso ha cambiado con el último AR Viewer Concept de Qualcomm impulsado por el conjunto de chips Snapdragon XR2 que usa Wi-Fi 7 para una conectividad súper rápida (Qualcomm afirma una latencia de menos de 10 ms), pero debido a la gran cantidad de dispositivos inalámbricos en la feria, no fue así. posible hacer una demostración.

Aún así, pude pasar algo de tiempo con los auriculares de referencia Snapdragon XR1, un poco más antiguos, y se me presentó un nuevo servicio de traducción y transcripción en tiempo real impulsado completamente por ChatGPT.

ChatGPT es el tema candente en tecnología en este momento, con la plataforma abierta de IA aparentemente capaz de hacer cualquier cosa, desde generar líneas de código para acelerar el desarrollo de aplicaciones hasta ayudar a los niños a hacer la tarea. Incluso hay una historia sobre ChatGPT aprobar el paso 1 del examen de licencia médica en los EE. UU.mostrando lo impresionante que es el hardware.

Con eso en mente, ChatGPT parece ser el candidato ideal para la transcripción y traducción en tiempo real con un enfoque en el modelado del lenguaje natural.

Crédito de imagen (reseñas confiables)

El auricular usó un micrófono dedicado para captar audio del área de demostración (muy alta) y transcribió casi a la perfección lo que se dijo en las gafas, y es lo suficientemente inteligente como para detectar varios oradores y dividir la transcripción entre ellos, con altavoz 0, altavoz 1 y así sucesivamente.

Todavía hay un ligero retraso mientras la API hace lo suyo, pero en uno o dos segundos, estaba viendo lo que efectivamente eran subtítulos en vivo de mi conversación a tres.

Eso puede sonar un poco engañoso a primera vista, pero podría ser un verdadero cambio de juego no solo para la traducción (imagínese poder hablar con alguien en un idioma diferente usando solo un par de anteojos), sino posiblemente más importante, un verdadero bendición para aquellos que tienen problemas de audición. La capacidad de transcribir efectivamente en tiempo real podría ser liberadora para aquellos que tienen problemas de audición, especialmente si conversan con alguien que no domina el lenguaje de señas.

Por supuesto, todavía queda mucho camino por recorrer hasta que todos usemos auriculares AR con servicios de transcripción y traducción habilitados para ChatGPT, pero es una vista previa tentadora de lo que realmente deberíamos esperar ver en el mercado en los próximos años.