Google fue recuperando el espacio perdido en IA generativa con un Gemini que va sumando modelos y capacidades. El último es Gemini 2.5 Pro y Flash estable, una vuelta de tuerca al que ya podíamos probar en la aplicación y web. Con la actualización no solo gana capacidades de análisis y de creación, también un nuevo superponer: el análisis de los vídeos. Gemini es ahora una IA completa.
Con la salida al mercado de ChatGPT, OpenAI encontró la manera de llevar los grandes modelos de lenguaje al público general. La interfaz estilo chatbot demostró ser la más apropiada para interaccionar con la IA, para pedirle que creara textos y que los analizara. Con la evolución de los modelos la IA saltó al terreno multimedia: ahora hasta puede crear vídeos con sonido, como los que hace Veo 3, de Google. Y tocaba poder analizarlos.
«Gemini, ¿qué hay en este vídeo que he grabado?»

El abanico de posibilidades que ofrece Gemini es inabarcable. Supone una gran ayuda para los trabajos creativos, es capaz de encontrar cualquier dato de la web, desarrolla código con alta precisión y genera contenido multimedia de muy buena calidad. Incluso en las cuentas gratuitas; por más que Gemini Pro sea el más recomendable para aprovechar la IA, también el que recibe antes las novedades.
Google actualizó recientemente todos los modelos de Gemini 2.5 en circulación para hacerlos estables. Además, presentó Gemini 2.5 Flash-Lite, su modelo destilado más potente y económico hasta la fecha. Y tiene su miga más allá de una mayor potencia, sobre todo en lo que a vídeo se refiere.
Si hasta ahora podíamos pedirle a Gemini que analizara un vídeo de Youtube, preguntarle sobre su contenido y cualquier otra cuestión presente en el metraje, ahora ha adquirido la opción de analizar cualquiera de nuestros vídeos. Una vez subidos tras seleccionarlos, podremos resolver cualquier duda que esté relacionada con el clip.

Entre las pruebas que hemos realizado, Gemini 2.5 (tanto Flash como Pro) fue perfecta para transcribir el audio de los vídeos, por ejemplo: le pasamos fragmentos de una conferencia y nos devolvió un texto realmente fiel. También identificó lugares de los vídeos (debe aparecer algo característico), pudo contar el número de personas que aparecían en escena y describir con precisión lo que ocurre en los clips. Es justo lo que le faltaba para completar el círculo.
Gemini 2.5 Flash y Pro estables están incluidos en el plan Google AI Pro, ambos tienen habilitado el análisis de vídeo. De momento no nos ha aparecido la opción en las cuentas gratuitas: para ver si está disponible solo hay que añadir un archivo y comprobar que los vídeos también pueden seleccionarse.
Imagen de portada | ChatGPT editada
En Xataka Android | Google multiplica por 12 el precio de su mejor IA: qué ofrece Google AI Ultra para superar a ChatGPT Pro
Ver 0 comentarios