
La IA y los Transformers
01 de Septiembre de 2025
La aplicación mas cercana y conocida de la IA, son los Chatbots “inteligentes” que parecen saber mucho de todo, cuyo nombre es LLM, por ejemplo: Chatgpt, Gemini, Claude, entre otros, si bien, tiene diferencias de entrenamiento y enfoque entre ellos, en esencia, fueron creados de manera muy similar.
Una de las piezas clave que comparte los LLMs modernos, es el concepto de Transformer, pero, ¿qué es un Transformer? , ¿se puede pedir para llevar?.
Transformer es una arquitectura de red neuronal presentada por Google en 2017, su mecanismo permite entender el contexto de cada palabra en una oración. Imagina que estás leyendo un párrafo y tu cerebro puede mirar todo el texto al mismo tiempo para decidir qué palabras son importantes para entender cada parte.
De hecho, ChatGPT, tiene un T al final del nombre, ¿la T es de ? … adivinaste, Transformer, y Gemini también hereda esa “T”, ya que en su linaje tecnológico está BERT, otro modelo basado en Transformers que marcó un antes y un después en la comprensión del lenguaje en los LLMs.
Pero, los transformers, son lo mismo pero no son iguales.
El transformer de GTP es unidireccional, procesa tokens (palabras) de izquierda a derecha, es decir, “lee” tokens y entiende su contexto, con toda la información a su izquierda.
El transformer de Gemini, tiene un comportamiento híbrido, unidireccional y bidireccional, es decir, procesa tokens y entiende su contexto, con la información a su izquierda y a su derecha.
Este funcionamiento marca una gran diferencia de versatilidad entre ambos LLMs.
Por esta razón, Gemini, es ideal para:
- Comprensión de texto complejo.
- Análisis de documentos largos (legales, técnicos).
- Resumen y extracción de información precisa
Chatgpt, es ideal para:
- Generación creativa secuencial (storytelling, redacción)
- Simulación de personajes, coaching, tutoría personalizada
- Programación y generación de código paso a paso
A ambos LLMs, les pedí crear una historia con el siguiente prompt:
Escribe una historia de 50 palabras sobre un robot que quiere aprender a cocinar, pero accidentalmente inicia una revolución gourmet.
La respuesta de ChatGPT 4o, es más emocional y fluida.

La respuesta de Gemini 2.5Pro , es más estructurada, técnica y conceptual.
