Code Interpreter de OpenAI: análisis de datos conversacional
Actualizado: 2026-05-03
Code Interpreter de OpenAI extiende ChatGPT Plus con la capacidad de ejecutar código Python en un sandbox aislado, leer ficheros subidos por el usuario y devolver resultados — incluidos gráficos — dentro de la misma conversación. Convierte un asistente de texto en un analista de datos que no solo sugiere código, lo ejecuta.
Puntos clave
- Code Interpreter ejecuta Python en un sandbox aislado dentro de ChatGPT.
- Acepta ficheros: CSV, Excel, PDF, imágenes y ZIPs — los procesa, devuelve resultados y gráficos.
- El modelo auto-corrige errores: lee la traza, ajusta el código, reintenta sin pedir permiso.
- Sin acceso a internet, sesión efímera, sin notebook exportable.
- Sustituye Jupyter para análisis ad-hoc; no lo sustituye para análisis serios o reproducibles.
Qué hace exactamente Code Interpreter
Cuando activas la opción en la configuración de ChatGPT Plus, el modelo gana acceso a un intérprete de Python con una selección de librerías preinstaladas:
pandaspara manipulación de DataFrames.numpypara operaciones numéricas.matplotlibpara gráficos.scikit-learnpara machine learning ligero.openpyxlpara Excel.
Puedes subir ficheros de varios formatos:
- CSV.
- Excel.
- PDF.
- Imágenes.
- ZIPs.
Y pedirle tareas en lenguaje natural: “resume esta hoja de cálculo”, “genera un gráfico de barras con estas columnas”, “limpia los duplicados y dame los outliers”. El modelo planifica el código, lo ejecuta dentro del sandbox, inspecciona el resultado y, si es necesario, itera sin pedirte permiso paso a paso. Si un script falla, lee el error, lo corrige y reintenta — un bucle de auto-corrección que resulta notablemente efectivo para tareas analíticas comunes.
Casos de uso donde aporta de verdad
Cuatro escenarios donde Code Interpreter destaca por encima de otros asistentes:
- Exploración rápida de datasets desconocidos — sube un CSV de 20 MB, pide resumen estadístico, distribución de columnas, correlaciones. Lo que llevaría 15 minutos abriendo un notebook se obtiene en tres o cuatro prompts.
- Limpieza de datos “sucios” — normalización de fechas inconsistentes, deduplicación inteligente, imputación de valores faltantes con heurísticas razonables.
- Visualización ad-hoc — solicita un gráfico con una intención (“quiero ver la estacionalidad mensual”) y Code Interpreter elige el tipo adecuado en la mayoría de los casos y devuelve la imagen.
- Conversión de formatos — extraer tablas de un PDF, convertir Excel a JSON, generar un CSV desde datos pegados en el chat.
Para análisis ligero y ad-hoc, el valor es evidente. Para análisis serio o reproducible, conviene matizar.
Limitaciones y precauciones
Code Interpreter no es un sustituto de Jupyter[1] o Google Colab[2] en escenarios serios. Tres limitaciones importantes:
- Sesión efímera. Cuando cierras la conversación, el estado del intérprete desaparece. No hay persistencia entre sesiones.
- Sin acceso a internet. El sandbox está aislado: no puedes hacer
pip installde librerías ajenas al set preinstalado, ni consultar APIs externas, ni descargar datasets. - Trazabilidad limitada. El código generado se muestra en línea, pero no hay notebook exportable sin copiar-pegar manualmente.
En términos de privacidad, los ficheros subidos se procesan en el sandbox y se borran al cerrar sesión, pero OpenAI declara que puede usar los datos para mejorar modelos salvo que el usuario lo desactive en configuración. Para datos confidenciales — financieros, sanitarios, personales sensibles — conviene revisar la política de datos[3] o usar la API con cuenta empresarial donde el tratamiento es distinto. El mismo análisis crítico que aplicamos en prompt engineering maduro: no fíes en defaults, lee la letra pequeña.
Code Interpreter frente a alternativas
La pregunta lógica es: ¿por qué no un notebook local con ayuda de GitHub Copilot? La respuesta depende del perfil del usuario:
- Para un analista de negocio sin experiencia técnica, Code Interpreter elimina la fricción de configurar entornos, instalar librerías y recordar sintaxis de pandas. La curva de aprendizaje es cero.
- Para un desarrollador, la ventaja es principalmente la rapidez de iteración conversacional: “cambia el eje Y a logarítmico”, “añade una línea de tendencia” se resuelve en segundos sin tocar código.
- Para tareas serias y reproducibles, un notebook con control de versiones sigue siendo superior.
Si te interesa el panorama de modelos abiertos como alternativa más privada, lee también nuestras notas sobre Llama 2 y código abierto, Bard/PaLM 2 de Google y herramientas generativas como Stable Diffusion XL para entender qué partes del stack puedes auto-hospedar.
Conclusión
Code Interpreter marca un cambio en cómo se interactúa con datos: de “escribir código que analice” a “describir lo que quieres saber”. No sustituye al tooling serio, pero reduce la barrera de entrada al análisis cuantitativo para perfiles no técnicos y acelera iteraciones para los que sí lo son.