La llegada de Siri en 2011 (al iPhone) marcó una nueva tendencia en nuestra forma de interactuar con los dispositivos móviles; no fue una revolución, pero nos mostró las enormes posibilidades de los comandos de voz. Claro, todos los asistentes personales del momento necesitan evolucionar —incluidos Google Now, Cortana o el mismo Siri— para ajustarse a nuestro cambiante modo de vida y, sobre todo, para que algún día lleguen a ser tan íntimos y seductores como la Scarlett Johansson de Her.
Todas estas aplicaciones presumen de entender el lenguaje natural humano para realizar tareas: y, de alguna manera, es cierto. Tienen la capacidad para responder ante comandos de voz básicos como "llama a Mamá" o "busca fotos de gatitos en Internet". No obstante, la comunicación humana es muy compleja, y todos los asistentes palidecen ante órdenes más difíciles. Por ejemplo, si le preguntas a Google Now "¿quién era presidente de Estados Unidos en 1970?", fácilmente te responderá que Richard Nixon; pero si le preguntas "¿quién fue campeón del Super Bowl el año que Richard Nixon fue electo presidente?", la búsqueda será infructuosa. Los asistentes personales están en continuo aprendizaje y crecimiento, pero aún les queda un gran camino por recorrer.
Por fortuna ya hay gente que comprende esta problemática: el equipo detrás del desarrollo de Siri acaba de anunciar su nuevo servicio Viv, "el asistente del futuro". El startup lleva trabajando en Viv desde el 2012, pero fue apenas este 9 de mayo que lo revelaron al mundo durante el evento Disrupt NYC. Y vaya que causaron una grata sorpresa.
Dag Kittlaus, CEO de la compañía, comentó: "Vamos a utilizar esta tecnología para dar vida a objetos inanimados y los dispositivos de nuestra vida diaria a través de la conversación". Lo increíble de Viv es lo bien que entiende el lenguaje humano y los comandos complejos. Esto se logra a través del reconocimiento de voz de Nuance, una tecnología de lenguaje natural (para entender la intención del comando) y "generación dinámica de programa".
Kittlaus le preguntó a Viv: "¿La temperatura estará a más de 70 grados (Fahrenheit) cerca del puente Golden Gate, después de las 5 p.m., pasado mañana?" Como verás, es una orden compleja pues contiene muchas variables. Sin embargo, para sorpresa del público, el asistente personal respondió rápida y correctamente. Además, en las pantallas del evento se mostró un programa de 44 líneas que Viv generó en 10 milisegundos para poder responder la pregunta.
El CEO aseguró que esta característica de auto generación de código es un paso importantísimo para la evolución exponencial de los asistentes de voz. De esta manera, los asistentes del futuro podrán responder a nuestros comandos con programas generados al momento, y por ende tendrán la capacidad de realizar tareas mucho más complejas.
Otro de los problemas que tienen los servicios actuales es que trabajan en un ecosistema cerrado. Sí, Siri puede ejecutar muchas tareas en tu iPhone, o Google Now hacer cualquier acción relacionada con los servicios de Google; pero la integración con aplicaciones de terceros es ínfima o incluso nula. Buena suerte pidiéndole a Cortana que te reserve boletos para el cine.
Por otro lado, ya que el equipo detrás de Viv no es un "gigante de la tecnología" sino un ente neutral, la aplicación no tiene conflicto de intereses con otros servicios. Para comprobar esto, Kittlaus le pidió a Viv que "le mandara 20 dólares a Adam por las copas de anoche", y la aplicación Venmo apareció rápidamente con la transacción lista. De igual manera, el ejecutivo pidió un Uber, reservó una habitación para un hotel en Palm Springs y hasta pidió flores para su mamá. Viv no tuvo ningún problema para relacionarse con aplicaciones de terceros para realizar todas estas tareas.
Viv aún está en pleno desarrollo —ni siquiera tiene voz—, pero sin duda marca un parteaguas en cuanto al camino que los asistentes de voz tienen que seguir ahora. Indudablemente estos servicios han facilitado la existencia de la gente, pero las exigencias aumentan cada vez más. Viv demostró que el el futuro apunta a un entendimiento más "natural" del lenguaje humano para poder realizar tareas y responder preguntas más complicadas. Además, las empresas tendrán que abrir sus ecosistemas para que sus asistentes puedan interactuar con aplicaciones de terceros de mejor manera, y así aumentar de manera importante la cantidad de actividades con las que nos podrán ayudar.
Deja tu comentario