Ya no solo ofrece una mejora de rendimiento, sino que además llega con nuevas capacidades de aprendizaje, planificación y programación.

Este lanzamiento, calificado por la propia compañía como «el más esperado del año», se centra en superar las barreras de razonamiento y comprensión contextual que limitaban a los modelos anteriores. La idea es que se convierta en una central basada en IA para crear, programar y crear sin límites.

Gemini-X

Gemini ya ha empezado a implementarse a nivel global, y los usuarios pueden probar desde ya mismo el nuevo modelo con la opción Thinking, dentro del selector de modelos de Gemini.

Gemini 3 mejora el razonamiento y la comprensión

Donde Gemini 3 llega para marcar la diferencia es en el terreno técnico, con importantes novedades en el manejo de información compleja y compresión del contexto.

Contexto de un millón de tokens

Esta es la mejora más importante. Ahora, la ventana de contexto se amplía hasta el millón de tokens, por lo que Gemini 3 será capaz de sintetizar y analizar cantidades de información mucho más grandes en una sola consulta. Para entendernos, un token es la unidad mínima de información con la que trabajan las IA, que puede ser una palabra o un fragmento de código.

Un millón de tokens permite a la IA procesar y recordar el equivalente a cientos de miles de palabras, lo que se traduce en:

  • Análisis de larga duración: Capacidad para analizar vídeos, imágenes, documentos, texto y audio, y relacionar todos esos datos dentro de la misma conversación sin olvidar el inicio.
  • Ahora será mucho más difícil que pierda el contexto de la conversación y tendrá mucha más coherencia en sus respuestas. No perderá el hilo del chat como sucedía con el resto de modelos.

Con esta novedad, Gemini 3 se posiciona como una de las mejores inteligencias artificiales, con un razonamiento que se coloca en cabeza y soluciona uno de los dilemas de las últimas semanas, con ChatGPT fallando a raudales.

gemini-live

Comprensión multimodal y mejora para programadores

La nueva versión de Gemini también mejora la comprensión multimodal, es decir, que además de procesar texto, entenderá mucho mejor los diferentes tipos de datos. Aquí notaremos una mejora sustancial a la hora de analizar imágenes y texto al mismo tiempo.

Además, Google ha destacado que es su mejor modelo de código agéntico y de código vibe hasta la fecha. En otras palabras, será más eficiente y comprenderá mejor las tareas de programación y desarrollo de software. Ahora, además de entender la lógica del código, interpretará la intención que el desarrollador trata de transmitirle.

Nuevo asistente en Gemini

Junto al modelo mejorado, Google ha anunciado Gemini Agent, un asistente virtual diseñado para completar tareas complejas en nombre del usuario. Lo que hace es automatizar flujos de trabajo avanzados, lo que habilitará aplicaciones más sofisticadas en la atención al cliente, la gestión de ventas y la automatización de procesos empresariales.

En esencia, el Agent es una capa de IA que puede interactuar con múltiples herramientas y plataformas externas para cumplir con las instrucciones que reciba. Como resultado, tendremos una IA que ofrecerá respuestas más útiles y precisas.

Gemini 3 está comenzando su despliegue global hoy mismo. Para acceder al nuevo motor, los usuarios deben visitar la plataforma gemini.google.com y seleccionar Thinking en el selector de modelos.

 

Fuente: Google | adslzone