Gemini Live es la mejor herramienta de Google en años: así puedes usarlo como un pro

Gemini Live es la mejor herramienta de Google en años: así puedes usarlo como un pro

El nuevo asistente de voz con inteligencia artificial y ojos de Google es lo que llevo años esperando

Sin comentarios Facebook Twitter Flipboard E-mail
Live
eva-rodriguez

Eva R. de Luis

Editor Senior

Decirle adiós a Google Assistant y hola a Gemini Live implica no solo una mejor contextualización y entendimiento, sino también a una nueva forma de interactuar con el móvil. Con la IA, la interacción con el móvil sube de nivel. Sí, Gemini puede ver y le puedes adjuntar documentos sobre los que basar tus preguntas, pero la conversación natural con Gemini Live es otra historia frente al asistente de voz clásico.

Llevo semanas usando Gemini Live en mi móvil, primero heredando las cuatro cosas que en la práctica le pedía a Google Assistant, pero esa forma de entender e interactuar tan natural ha hecho que le exija mucho más. Y salvo alguna excepción, ha dado la talla.

Índice de Contenidos (8)

Un traductor en vivo 2 en 1

Este uso me parece una auténtica barbaridad y además, quien más quien menos acaba necesitando un traductor en algún momento de su vida. Hay varias formas de aprovechar Gemini Live para la traducción: podemos tocar sobre la cámara para apuntar a un texto en otro idioma y tener la traducción al momento, ya sea en inglés, italiano o chino.

Esto ya lo hacía Google Lens con bastante acierto (aunque era más lento, tenías que ir por partes y a veces se comía algunas partes), pero es que también es posible invocar a Gemini Live para pedirle que traduzca en vivo de un idioma a otro en tiempo real como si fuera un intérprete profesional. Te saca del apuro en cualquier conversación en otro idioma.

A título personal la traducción en vivo me parece revolucionario, no solo por la calidad de las traducciones (depende en gran medida de la forma de hablar de la gente y de si vocalizan, pero en general no he tenido problema) sino porque el retraso es mínimo, de modo que no entorpece la conversación. Asimismo, tomando una foto de un cartel, la información que proporciona está a años luz de lo que hacía Google Lens: más precisa, con más contexto, mucho más rápido y de una vez.

Tengo mi propio manitas en el móvil

Inte

Una no sabe de todo, así que preguntarle a Gemini Live por ejemplo cómo cambiar una cadena de la bici es una buena idea, pero es mucho mejor tocar sobre le cámara, apuntar a ese elemento y que me eche una mano diagnosticando el fallo de forma visual.

Después proporciona información paso a paso para solucionarlo. Tengo que decir que aquí los resultados pueden ser dispares en función de la avería y la fotografía que hagas, pero para tareas relativamente sencillas de manitas como por ejemplo cambiar un enchufe estropeado hace el apaño de manera sorprendente. Sin ir más lejos, a mí me ayudó a reparar la cisterna de un WC. Si lo que explica me resulta demasiado complejo o fuera de mis habilidades, no hay problema: llamo a un profesional.

Un par de recomendaciones para tener los mejores resultados: tener buena iluminación y hacer fotos de detalle y si es necesario añadir un par de imágenes más y no dudar a la hora de solicitarle que vaya paso a paso con todo lujo de detalles.

Entender y repasar textos densos

Ley

De vez en cuando me toca lidiar con legislación o con textos abstractos y poco claros como por ejemplo un contrato, así que algo que suelo hacer es meterle el PDF con el texto o el URL (mejor la primera opción) para que después comience el interrogatorio. Sin lugar a dudas, para evitar fallos o imprecisiones esto es mucho mejor que cuestionarle sobre un concepto en general.

Gemini es capaz de devolverte una tabla o un resumen, pero si tienes que empaparte más y quieres resolver dudas concretas, hay otra opción mejor: mantener una conversación donde buscarle las cosquillas y aclarar conceptos. O escuchar la respuesta, como si fuera un podcast educativo.

Funciona con todo tipo de textos (filosóficos, técnicos, históricos...) y además puedes cambiar el ritmo y el estilo para adecuarlo a tus conocimientos. Mucho mejor que un tutorial es tener un tutor a medida. Ni qué decir tiene que es fantástico para que te repase la lección.

Un ejemplo: si quieres preparar un artículo sobre el Real Decreto del cargador único de la UE, siempre será mejor pasarle el enlace que simplemente mencionársela (Real Decreto 188/2016), ya que de lo contrario podría usar textos incompletos, considerar una legislación no vigente en tu zona o dejarse información. Asimismo es esencial no facilitarle datos personales. Por ejemplo, para valorar qué hipoteca me convenía más, le pasé las cifras pero omití información como el catastro o mis datos personales.

Es importantísimo verificar la respuesta, ya que por ejemplo tras pasarle la ley anteriormente mencionada en forma de URL, la tergiversó con normativa relativa a la pesca del atún rojo.

Guía de viajes improvisado y a medida

Cate

Me gusta el arte y el turismo cultural, motivo por el cual suelo recurrir a servicios de guía, pero no siempre quedaba satisfecha: a veces los guías se enrollaban demasiado, otros eran imprecisos, también hay gente que se expresa regular... así que ahora lo apaño con Gemini Live: apunto con la cámara al monumento o cuadro y le pido que me explique.

Me parece verdaderamente sorprendente que sea capaz de satisfacer a cualquier oyente: a mí, a una persona que sepa mucho o que pueda adaptar su discurso para por ejemplo dirigirse a criaturas de seis años.

Aquí resulta especialmente útil usar el truco de los roles: pedirle que funcione como guía turístico y definir el público al que se dirige para acotar la extensión y el nivel de detalle. Lo mejor es que no solo te cuenta de edificios y monumentos, sino que puedes preguntarle el estilo de un arco de buenas a primeras,fotografiar una tumba o que te dé contexto, por ejemplo para que te explique el por qué del Guernica de Picasso.

Que me ahorre tiempo viendo vídeos de YouTube

Gemini Youtube

Igual es que soy millennial, pero para mí los vídeos se me hacen demasiado largos: esos siete minutos para explicar cómo actualizar mi Android se me tornan eternos y ni siquiera la reproducción a más velocidad me alivia. Así que a grandes males, grandes remedios: le paso el enlace y le pido un resumen con lo más importante y de una forma fácil de leer y entender.

Funciona especialmente bien con los tutoriales o recetas, pero en general todo lo que le metas, por ejemplo una charla Ted Talk de Bill Gates, te la traduce y resume para que te quedes con lo importante. Y lo mejor: como no estoy suscrita a YouTube Premium, me ahorro los anuncios.

Ideas para cocinar y recetas de aprovechamiento

Salmo

No sé tú, pero yo a veces me canso de las recetas de siempre y aunque hace unos días me pareciese una magnífica idea llevarme media docena de coliflores del huerto familiar, luego no sé qué hacer con todos.

Pedir recetas de algo es una opción, pero me parece mucho más interesante usar Gemini Live para abrir la cámara después y apuntar a la nevera y que vea lo que tengo para proponerme algunas recetas. Por supuesto, luego va guiando en el paso a paso de viva voz para que no te saltes nada, lo que viene de cine cuando tienes las manos sucias.

Esto se ve mucho mejor con un ejemplo: abro el congelador y descubro unas piezas de salmón y una bolsa de alcachofas congeladas, ¿qué haría yo? Salmón a la plancha y alcachofas salteadas de guarnición, pero Gemini me abre un abanico de posibilidades. Tengo que decir que a veces para mí se pasa de creativo, pero sirve para darme la base para otras recetas.

Un asistente de moda

Look

Me gusta la moda, pero a veces me la juego demasiado. No siempre es cuestión de colores, sino que también hay estilos que encajan mejor que otros. Aunque es posible preguntarle qué se lleva, me parece mucho más útil y personalizado apuntar con la cámara a la ropa que me gustaría ponerme y preguntarle si combina y si puede sugerirme algo mejor o algún complemento.

Lo uso muy de vez en cuando, pero para la última boda que tuve yo le pasé el vestido y fue Gemini Live quien me sugirió los zapatos y el bolso que mejor se ajustaba a mi estilo y piel.

Conclusiones

Que la inteligencia artificial está a años luz de los antiguos asistentes de voz en términos de contextualización y entendimiento es una realidad que en la práctica puede ayudarnos para tareas profesionales como los resúmenes, respuestas de emails o resolución de dudas en general, pero su carácter multimodal disparan su usabilidad.

Su capacidad para ver, oír y hablar permiten otras formas de interactuar y usos tan variopintos como los que hemos mencionado más arriba y que mejoran notablemente a otros productos de Google, como Google Assistant o Google Lens. 

Siguen necesitando de cierta pericia a la hora de elaborar el prompt (en general, detallar el público objetivo y usar roles son buenas prácticas) y de tener especial cuidado a la hora de verificar información importante o dar datos personales, pero en la práctica ahorran mucho tiempo y dan buenas ideas que pueden servirnos como base. 

Parece una tontería, pero cosas como que te ayude a cambiar de menús o buscar un outfit para una boda tienen su punto y es algo mucho más directo y personalizado que buscar en internet.

En Xataka Android | Adiós, Google Assistant: usar Perplexity como asistente en mi Android lo cambia todo. Ya no me desespero hablando con el móvil

En Xataka Android | Ni Gemini ni Google Assistant: llevo una semana con ChatGPT como asistente de voz en Android. Tengo buenas y malas noticias

Portada | Ricardo Aguilar

Inicio