Google ya trabaja en Gemini, la nueva IA con la que destronará a ChatGPT

Los avances de Google en el campo de la Inteligencia Artificial han sido variados hasta el momento: desde el nuevo buscador hasta las mejoras en sus aplicaciones y servicios clave, sin olvidar Bard, su asistente personal, entre otras innovaciones destacadas. Ahora ya prepara su nuevo salto cualitativo con Gemini.

El pasado mes de mayo Google presentaba en su evento I/O 2023 una nueva Inteligencia Artificial bajo el nombre de Gemini, siendo este un proyecto que aún no estaba disponible. Sin embargo, parece que el gigante tecnológico ya se encuentra a pleno rendimiento trabajando en ella con la intención de destronar a GPT-4 y ChatGPT.

Así funciona Gemini, nueva IA de Google

Gemini es el nombre que desde Google han dado a su próxima gran apuesta en el campo de la IA. Un nuevo sistema que sus creadores esperan que sea más completo y tenga más capacidades que el que está detrás de ChatGPT, propiedad de su gran rival Microsoft tras invertir mayoritariamente en OpenAI.

El nuevo modelo de lenguaje extenso será capaz de analizar gráficos y tablas, y se implementará en servicios de Google como Cloud, además de potenciar Bard. Gemini contará con algoritmos avanzados de aprendizaje automático que le permitirán comprender el lenguaje natural y responder a las consultas de los usuarios de forma conversacional. Los vastos datos de entrenamiento de Google podrían dar a Gemini una ventaja en la carrera por el dominio de la IA. Esto se debe a que la empresa tiene acceso a una gran cantidad de información que puede utilizarse para entrenar sus modelos.

“Gemini todavía está en desarrollo, pero ya exhibe capacidades multimodales nunca antes vistas en modelos anteriores. Una vez ajustado y rigurosamente probado para comprobar su seguridad, Gemini estará disponible en varios tamaños y capacidades”, dijo Sundar Pichai, CEO de Google y Alphabet.

Las ventajas del modelo multimodal

Al contrario que otros modelos de lenguaje extenso (large language models, LLM por sus siglas en inglés), Gemini pretende ser un cambio de paradigma al tratarse realmente de un modelo multimodal. Esto significa que puede comprender y generar texto, algo clave en la aplicación de los datos para chatbots, pero también puede entender distintos códigos e imágenes, a diferencia de su competencia.

Gemini fue creado desde cero para ser multimodal, altamente eficiente en las integraciones de herramientas y API y construido para permitir innovaciones futuras, como memoria y planificación. Si bien aún es pronto, ya estamos viendo impresionantes capacidades multimodales que no se ven en modelos anteriores.

Impulsado por algoritmos avanzados de aprendizaje automático y la gran cantidad de datos de capacitación de Google, Gemini se enfrentará de tú a tú a otros sistemas populares de inteligencia artificial. Para impulsar la I+D en IA, Google tuvo que fusionar DeepMind con su principal laboratorio de IA, Brain, en abril para crear Google DeepMind. Este es el equipo que actualmente está trabajando en Gemini AI y que se espera que pueda empezar a mostrar sus resultados a partir de otoño.

Uno de los mayores problemas en este momento, según Demis Hassabis, cofundador de DeepMind y CEO de Google DeepMind, es identificar qué riesgos podría plantear una IA más capaz. “No creo que los investigadores en el campo tengan un consenso todavía sobre cuáles son esos riesgos o cómo de grandes son”.

Hassabis dijo que espera que Google asuma un papel de liderazgo en el desarrollo y despliegue de IA, y que trabaje con otras marcas y gobiernos para desarrollar reglas y estándares de protección sólidos. “Esperamos poder ser un ejemplo para toda la industria”, dijo, “y esperamos poder trabajar con otros para avanzar en el desarrollo seguro y responsable de esta tecnología”.

Fuente: Gizchina | adslzone