El año pasado me crucé varias notas sobre el fracaso de las plataformas de comandos de voz a la hora de alcanzar la masividad. Si revisábamos la trayectoria de Apple Siri, Amazon Alexa o Google, lo que encontrábamos es que el hardware asociado a estas plataformas no había crecido tanto como se esperaba, y que los usuarios no solían utilizarlo de manera muy frecuente en otras opciones, como smartphones y computadoras de escritorio. Pero con la introducción de más funcionalidades ligadas con la Inteligencia Artificial esta trayectoria estancada puede cambiar.
Un ejemplo interesante, y que va a ser muy útil para los viajeros, tiene que ver con la aparición de comandos de voz en Google Maps para ejecutar búsquedas complejas. Para ello la plataforma de Google va a combinar los modelos de lenguaje que desarrolla para Gemini con las funcionalidades de voz que ya conocemos de muchas de sus aplicaciones.
Un ejemplo sería querer encontrar un restaurante para un grupo de personas, y enumerar una serie de restricciones alimentarias de algunos de los participantes. Algo que hoy obliga a una revisión por negocio sería resuelto por el prompt -esto es, la tarea pedida al modelo de Inteligencia Artificial- y ejecutado por comandos de voz.
Para los resultados Google Maps recurre a la información almacenada bajo la forma de comentarios, calificaciones y fotos, y nos dará un resumen como resultado. Luego podemos expandir o pedir más precisiones si las necesitamos. Las novedades en Maps aparecen al mismo tiempo que Google anuncia algunos cambios en sus plataformas de inteligencia artificial, que se van a unificar bajo el nombre de Gemini. A la vez que abandonan las marcas Bard y Duet (que era el mensajero que usa herramientas de IA) lanzan un sistema por suscripción, que por 19,99 dólares por mes incluirá las opciones que ya estaban disponibles en Google One (como mayor almacenamiento) más el acceso a Gemini Pro.
Más en Engadget (en inglés)