Una limitación clave en la construcción de sistemas modernos de IA ha sido la falta de datos en dominios específicos de alta calidad que pueda satisfacer el voraz apetito de datos del deep learning. El anuncio de Google de su nueva generación de asistentes de IA que pueden entablar conversaciones inquietantemente reales que rayan en el material de prueba de Turing sugiere que quizás en el futuro cercano los asistentes de IA no solo puedan asumir papeles crecientes como asistentes de investigación, sino incluso llegan a comenzar a recopilar sus propios datos de entrenamiento.

Aunque limitado en los dominios conversacionales y de tareas que actualmente puede abordar, el nuevo sistema de Google es particularmente notable por la forma en que puede interactuar con fluidez con los seres humanos del mundo real, de forma tan natural que nunca sospechan que están hablando con un ser humano. Al igual que con las generaciones de bots de chat de solo texto, el sistema de Google demuestra que dentro de los límites de una tarea o dominio específico, no es tan difícil pasar la Prueba de Turing.

Como recordatorio de cuán desiguales pueden ser los dominios humanos y de máquina, el anuncio de Google señala la importancia de degradar deliberadamente la calidad de la salida del sistema a través de pausas y disfluencias del habla. Los humanos somos procesadores de información imperfectos y con frecuencia pensamos en voz alta y usamos indicadores vocales para cubrir los períodos en los que consideramos nuestra respuesta. Una máquina que responda instantáneamente a cada consulta con una gramática perfecta parecerá “demasiado perfecta” y dará lugar a una interacción incómoda con su encuestado humano. En cambio, al degradar el sistema a un nivel más humano de habla e interacción, parece mucho más natural.

 

Si bien la tecnología es un logro de los avances conversacionales de AI, quizás lo más intrigante fue la idea de que el nuevo sistema de Google podría llamar autónomamente a las empresas e indagar sus horas de operación durante momentos especiales del año como vacaciones, que no siempre se actualizan en sus sitios web. La propuesta de Google fue que su sistema podría llamar a las empresas, preguntar qué horas están abiertas y luego volver a incluir esta información en los servicios públicos de búsqueda de Google, reduciendo en gran medida el volumen de llamadas que recibiría una empresa de clientes que buscan la misma información.

Ampliando esto aún más, uno podría imaginar que este enfoque a medida que evolucione y se expanda a más dominios, adquiriendo más plantillas para una variedad de microtareas, el sistema podría ser desplegado gradualmente a formas más libres de peticiones expandiendo su rol más allá de un simple consultor de información por voz.

Eventualmente, uno podría incluso imaginar que dicho sistema identificará las limitaciones en sus datos de entrenamiento e interactuará proactivamente con humanos expertos  que que tienen información relevante para completar los puntos ciegos de información. En otras palabras, construirá por sí misma una red neuronal más perfecta.

Alternativamente, imagine un sistema de inteligencia artificial que monitorea las redes sociales, los cables de prensa y los informes de los medios e identifica una historia de última hora. Hoy en día, ese sistema, en el mejor de los casos, simplemente puede resumir lo que ya se publicó sobre la historia: no puede realizar su propia investigación llamando testigos y fuentes oficiales para aclarar elementos poco claros de la historia o reunir más información. Usando el sistema de Google, un sistema de este tipo podría conducir lo que equivale a periodismo básico, en realidad llamar por teléfono a individuos y organizaciones para reunir más información e incorporar sus detalles y puntos de vista en el artículo final.

También vale la pena señalar que el sistema de Google finalmente puede cambiar el rumbo de los sistemas de respuesta telefónica automatizados que han reemplazado en gran medida a los servicios de atención al cliente humanos. Interactúe hoy con cualquier empresa o agencia importante y probablemente deba navegar a través de un complejo sistema automático de indicaciones telefónicas que, con los sistemas peor diseñados, tarda varios minutos en llegar a donde debe estar, solo para ser retenido por una hora hasta que el próximo humano esté disponible. Imagine en cambio que podría decirle a su asistente de Google que llame a la compañía de cable para disputar un cargo en su factura y navegue por los menús, espere hasta que finalmente llegue a un humano y luego interactùe con el humano para disputar la factura, ya sea notificándolo a usted al final de la llamada que la carga se ha eliminado y todo está bien, o empatar solo al final de la conversación para atar algunos detalles complejos finales.

Hoy las empresas tienen todo el poder cuando se trata de interacciones con los clientes, construyen complejos sistemas de telefonía que están mal diseñados, apenas entienden a muchos usuarios y crean una experiencia de usuario tan intolerable que las personas están más dispuestas a renunciar que pasar una hora vagando por los menús y esperando en espera. De repente, con el nuevo asistente de Google en la mano, el poder se restablece en las personas: una máquina ahora le hablará a esa otra máquina y a los muy a menudo inútiles humanos del otro lado de la línea y resolverá la situación sin ti. tienes que perder un momento de tu tiempo.

A medida que evoluciona la síntesis de voz y la generación de lenguaje, solo será cuestión de tiempo que tengamos sistemas que puedan imitar sus patrones de voz y habla y de conversación para que funcionen como una réplica conversacional casi perfecta para manejar las tareas diarias básicas en su nombre.

Al unir todo esto, la última incursión de Google en AI conversacional demuestra cuán lejos han llegado las tecnologías subyacentes y anticipa un futuro en el que las máquinas podrán salir cada vez más del dominio de solo texto en el que quedaron atrapadas durante casi un cuarto de siglo y finalmente comienzan a interactuar con los seres humanos en entornos de la vida real realizando tareas con las que solo podíamos soñar hace unos años.