Preprocesador IA

Fácil de usar

No necesitas saber programación. Solo sube tu archivo CSV.

IA aplicada

El sistema automatiza limpieza, normalización y evaluación con modelos IA.

Limpieza inteligente

Usa KNN, regresión y Random Forest para imputar valores faltantes.

Evaluación automática

Prueba modelos automáticamente con H2O AutoML y elige el mejor.

Sube tu CSV para comenzar

¿Qué es AutoML?

AutoML (Aprendizaje Automático Automatizado) es una herramienta que entrena y compara múltiples modelos de IA por ti. Este sistema utiliza la librería H2O AutoML, una tecnología de código abierto ampliamente usada en la industria.
Prueba de forma automática diferentes tipos de algoritmos como Gradient Boosting (GBM), XGBoost, Deep Learning, Random Forest, GLM y modelos ensamblados (combinaciones de varios modelos).
Luego, selecciona el modelo que haya obtenido el mejor rendimiento según el tipo de problema detectado (regresión, clasificación binaria o multiclase), usando una métrica adecuada para cada caso.

Modelo	Score (métrica principal)	RMSE	MAE	R²	MSE	LogLoss	AUC	Error Medio por Clase

Mejor modelo y score obtenido

El modelo fue el mejor según AutoML.
Obtuvo un score final de / 10, basado en la métrica N/A.

Esta métrica depende del tipo de problema:

Regresión: se usa R², que mide la capacidad del modelo para explicar el resultado. Cuanto más alto, mejor.
Clasificación binaria: se usa AUC, que mide qué tan bien distingue entre dos clases. Más alto = mejor.
Clasificación multiclase: se usa el Error medio por clase. Un valor bajo significa que el modelo se equivoca poco. Para que todo sea más fácil de entender, este valor se transforma en una score donde más alto siempre es mejor.

¿Qué significan todas estas métricas?

Cada modelo de inteligencia artificial se evalúa con distintas métricas. Algunas miden errores, otras qué tan bien predice, o si distingue bien entre categorías.
El sistema elige una de ellas como “principal” para darte una nota entre 0 y 10, pero las demás también dan pistas útiles sobre el rendimiento del modelo.

RMSE (Root Mean Squared Error): Es el promedio del error cometido, pero penaliza más los errores grandes. Se usa en regresión. Cuanto más bajo, mejor.
MAE (Mean Absolute Error): Es el promedio de lo que se equivoca el modelo en cada predicción. También se usa en regresión. Bajo = mejor.
R² (Coeficiente de determinación): Mide cuánto del resultado puede explicarse por las columnas. Si vale 0.8, significa que un 80 % de la predicción tiene sentido. Solo para regresión.
MSE (Mean Squared Error): Como el RMSE, pero sin sacar la raíz. Es un poco más técnico, pero sirve igual para saber el error global.
LogLoss: Se usa en clasificación. Mide cuánto se equivoca el modelo al dar probabilidades. Es útil cuando el modelo no solo dice “sí” o “no”, sino qué tan seguro está. Más bajo es mejor.
AUC (Área Bajo la Curva): Indica si el modelo puede distinguir correctamente entre dos clases (por ejemplo, enfermo/sano). Un valor de 0.9 significa que casi siempre acierta. Solo se calcula si hay dos clases.
Error medio por clase: Es el promedio de error cometido en cada una de las clases cuando hay más de dos. Sirve para problemas donde hay varias categorías (como leve, moderado, severo). Más bajo = mejor.

¿Por qué algunas métricas aparecen como "N/A"?

No te preocupes si en algunos modelos ves métricas con el valor N/A. Esto simplemente significa que esa métrica no se calculó.

Puede deberse al tipo de problema (clasificación o regresión).
O también a que el modelo concreto no la proporciona por defecto.
No es un fallo del sistema, es parte del funcionamiento interno de H2O AutoML.

Lo importante es fijarse en la métrica principal (AUC, R² o error medio), que sí se calcula siempre y es la que se usa para elegir el mejor modelo.

Un nuevo enfoque para preparar datos

Este sistema fue creado para automatizar tareas tediosas del preprocesamiento usando IA, ayudando a quienes trabajan con datos sin necesidad de conocimientos técnicos.

Sube tu archivo.
Deja que la IA lo prepare por ti.

Comienza ahora