Actualidad

Google I/O 2025: cinco anuncios clave sobre IA

Google presentó Gemini 2.5, Beam, agentes inteligentes y nuevos modelos como Imagen 4 y Veo 3 que redefinirán cómo las personas interactúan con la IA.
Martes, Mayo 20, 2025

El futuro de la inteligencia artificial ya no es una promesa a largo plazo. En el marco de Google I/O 2025, la compañía mostró cómo está llevando sus avances más ambiciosos en IA del laboratorio a la vida cotidiana. Desde Gemini 2.5 y modelos generativos como Imagen 4 y Veo 3, hasta agentes inteligentes capaces de realizar tareas por el usuario, la compañía liderada por Sundar Pichai dejó claro que la IA ya no es solo una herramienta, sino una plataforma.

Estos son los cinco anuncios que marcan el inicio de una nueva etapa en la relación entre personas, empresas y máquinas inteligentes:

1. Gemini 2.5: velocidad, personalización y razonamiento profundo

La nueva familia Gemini 2.5 consolida a Google como líder en modelos de lenguaje de gran escala. El modelo Gemini 2.5 Pro ha mejorado más de 300 puntos en las métricas de razonamiento (Elo scores) frente a su versión original, y ahora incluye un nuevo modo experimental llamado Deep Think, que utiliza técnicas de razonamiento paralelo para resolver problemas complejos.

En paralelo, Gemini 2.5 Flash se posiciona como el modelo más eficiente en velocidad y costo, ideal para desarrolladores y tareas de baja latencia.

También te puede interesar leer: Google potencia Gemini con apps, planes y video IA

2. Google Beam: videollamadas inmersivas en 3D

Lo que comenzó como Project Starline, ahora es una plataforma comercial: Google Beam. Con seis cámaras y un modelo de video basado en IA, Beam convierte llamadas 2D en experiencias inmersivas 3D en tiempo real, con seguimiento milimétrico de cabeza a 60 fps y renderizado en pantallas de campo de luz.

En alianza con HP, los primeros dispositivos estarán disponibles para clientes seleccionados a finales de este año. Beam también llega a Google Meet, con traducción de voz en tiempo real que imita el tono y expresión del hablante.

3. Agentes inteligentes: de prototipo a copiloto digital

Desde el laboratorio Project Mariner, Google evoluciona su visión de asistentes con agentes capaces de ejecutar tareas complejas como navegar sitios web, ajustar filtros de búsqueda y hasta programar citas. El nuevo Agent Mode en la app de Gemini incorpora funciones multitarea, memoria contextual y herramientas como teach and repeat, donde el agente aprende nuevas tareas observando al usuario.

Estas capacidades también estarán disponibles para desarrolladores vía API, y se integrarán con plataformas como UiPath, Automation Anywhere y el nuevo protocolo MCP, que permite interoperabilidad entre agentes.

4. IA más personal: contexto y estilo propio en cada interacción

Gemini podrá utilizar, con permiso del usuario, contexto personal de apps como Gmail o Google Drive para generar respuestas más útiles y auténticas. Un ejemplo son las nuevas respuestas inteligentes personalizadas en Gmail, que pueden recuperar itinerarios antiguos y generar respuestas que reflejan el estilo del usuario.

Este enfoque de “personal context” promete una IA verdaderamente útil en la realidad de cada persona, sin comprometer la privacidad.

5. Creatividad generativa: Veo 3 e Imagen 4 abren nuevas fronteras

La creatividad impulsada por IA tuvo su espacio con el lanzamiento de Veo 3, el modelo de generación de video más avanzado de Google, ahora con capacidad de generar audio nativo. Junto a este, Imagen 4 mejora la calidad, coherencia y control en la generación de imágenes, y ambos estarán disponibles desde la app de Gemini.

Además, Google lanzó Flow, una herramienta para cineastas que permite extender clips cortos en escenas cinematográficas completas.