6-Cómo Funcionan los LLMs

julio 05, 2025

Caso Práctico: Cómo Funcionan los LLMs en la Práctica (ChatGPT)

¿ChatGPT es lo mismo que GPT?

Una de las dudas más comunes entre quienes se adentran en el mundo de los modelos de lenguaje es: ¿ChatGPT y GPT son lo mismo? La respuesta es no, aunque a menudo se usen indistintamente.

ChatGPT es la interfaz web que nos permite interactuar con los modelos de lenguaje de OpenAI.
GPT (Generative Pre-trained Transformer) se refiere a las versiones de los modelos en sí, como GPT-3.5, GPT-4 o futuras iteraciones.

Cuando escribimos un prompt en ChatGPT, este lo envía a uno de los modelos GPT disponibles, que se encarga de procesar la entrada y generar una respuesta.

Funcionamiento Práctico de ChatGPT

1. El Prompt: La Clave para Interactuar

El elemento esencial para comunicarse con un LLM (Large Language Model) es el prompt. Por ejemplo, si escribimos:

"La Segunda Guerra Mundial ocurrió en"

ChatGPT toma este texto, lo envía al modelo GPT seleccionado (por ejemplo, GPT-4) y este inicia el proceso de inferencia, prediciendo las siguientes palabras más probables.

Respuesta generada:

"La Segunda Guerra Mundial ocurrió entre el 1 de septiembre de 1939 y el 2 de septiembre de 1945. Fue un conflicto global en el que participaron la mayoría de las naciones del mundo."

2. Selección del Modelo

En la interfaz de ChatGPT, podemos elegir entre diferentes modelos (por ejemplo, GPT-4, GPT-4 Turbo, etc.). Cada uno tiene sus particularidades en cuanto a capacidad, velocidad y costo.

3. El Context Window: Límite de Longitud

Los LLMs tienen un límite máximo de tokens (ventana de contexto). Si un prompt es demasiado largo, ChatGPT mostrará un mensaje de error:

"El prompt que estás intentando enviar es demasiado largo."

Esto evita que superemos la capacidad de procesamiento del modelo.

4. Organización de Conversaciones

ChatGPT permite gestionar chats previos:

Crear nuevas conversaciones.
Eliminar, renombrar o archivar chats.
Compartir interacciones con otros usuarios.

5. ¿Por Qué las Respuestas Suenan "Humanas"?

Aunque los LLMs generan texto palabra por palabra, sus respuestas suelen ser coherentes y naturales. Esto se debe a un reentrenamiento adicional (fine-tuning) que ajusta el modelo para imitar el estilo conversacional humano.

Por ejemplo, si preguntamos:

"¿En qué año ocurrió la Segunda Guerra Mundial?"

El modelo no repite la pregunta, sino que da una respuesta directa, similar a como lo haría una persona.

Conclusión

ChatGPT es una potente herramienta que, gracias a los modelos GPT de OpenAI, nos permite interactuar de manera intuitiva con la inteligencia artificial. Entender su funcionamiento básico—desde la escritura de prompts hasta la gestión del contexto—nos ayuda a aprovecharlo mejor.

En próximos artículos, profundizaremos en técnicas avanzadas como el fine-tuning y el uso de LLMs para casos más complejos.

¿Qué dudas te han surgido al usar ChatGPT? ¡Déjalas en los comentarios!

GPT vs. Whisper: ¿En qué se diferencian?

1. GPT (Generative Pre-trained Transformer)

Tipo de modelo: LLM (Large Language Model).
Función principal: Generar y procesar texto (respuestas, traducciones, resúmenes, código, etc.).
Cómo funciona:
- Entrenado con cantidades masivas de texto.
- Predice la siguiente palabra en una secuencia (autoregresivo).
- Versiones como GPT-3.5, GPT-4, etc.

2. Whisper

Tipo de modelo: Modelo de reconocimiento de voz (ASR - Automatic Speech Recognition).
Función principal: Transcribir audio a texto (multilingüe) y traducir audio a otros idiomas.
Cómo funciona:
- Entrenado con miles de horas de audio etiquetado.
- Convierte ondas de sonido en texto (no genera lenguaje como GPT).
- No es un LLM, sino un modelo especializado en audio.

Clave de la diferencia:

Característica	GPT (Ej: ChatGPT)	Whisper
Entrada	Texto	Audio (voz)
Salida	Texto generado	Texto transcrito (o traducido)
Base	Transformer (LLM)	Transformer (pero no es LLM)

Ejemplo práctico de uso combinado

Imagina que grabas un podcast y quieres:

Whisper: Transcribe el audio a texto.
GPT: Resume la transcripción o genera tweets destacados.

Ambos son modelos de IA, pero sus arquitecturas y propósitos son distintos.

Buscar este blog

SOTELO-IA