Sube tu archivo y deja que el sistema se encargue de todo: limpieza, normalización, selección de características y evaluación automática con IA.

No necesitas saber programación. Solo sube tu archivo CSV.
El sistema automatiza limpieza, normalización y evaluación con modelos IA.
Usa KNN, regresión y Random Forest para imputar valores faltantes.
Prueba modelos automáticamente con H2O AutoML y elige el mejor.

En esta sección se muestra cómo era tu conjunto de datos al principio: qué columnas tenía y cuál se eligió como variable objetivo. La columna objetivo es aquella que el sistema intentará predecir o clasificar.
Columnas Iniciales:
No especificadas
Estas son todas las columnas que estaban presentes en el archivo original que subiste.Total de Columnas:
Número total de columnas detectadas antes de aplicar ningún cambio.Columna Objetivo:
No detectada
Es la variable que el sistema intentará predecir. Es importante que esta columna esté bien definida y sin valores faltantes.Esta fue la primera fase del preprocesamiento. El sistema detectó y completó automáticamente los valores vacíos, usando el método más eficaz.
Valores Nulos Iniciales:
No especificado
Cantidad total de valores vacíos detectados al cargar el archivo.Nulos Después de Imputación:
Método Seleccionado:
No especificado
Este fue el algoritmo elegido automáticamente por obtener mejores resultados de completado.Esta fue la segunda fase del preprocesamiento. El sistema transformó las variables numéricas para que estuvieran en una escala común usando técnicas automáticas.
Resultado de la normalización:
No se aplicó la normalización porque no había suficientes columnas numéricas.
¿Qué significa el "error de reconstrucción"?
Es una medida que indica qué tan parecidos son los datos originales y los reconstruidos por el autoencoder. Cuanto menor sea este valor, mejor ha aprendido el sistema a representar los datos.
A diferencia de técnicas clásicas como MinMax o Z-score, aquí usamos un autoencoder para refinar los datos. El error refleja la calidad de esa reconstrucción.
Un valor alto no indica necesariamente un fallo, sino que los datos eran complejos o ruidosos. El sistema lo detecta y, si fuera necesario, evita aplicar la normalización para preservar la integridad del conjunto.
En esta tercera fase, el sistema analiza todas las columnas y se queda solo con las más útiles para hacer predicciones. Esto mejora la precisión del modelo, evita el uso de columnas irrelevantes y acelera el procesamiento.
Umbral de Importancia: No especificado
Es el valor mínimo que una columna debe alcanzar para ser considerada relevante. Las que están por debajo se eliminan.
Columnas Seleccionadas:
Estos gráficos muestran las características seleccionadas según los modelos RandomForest y ExtraTrees.
Lista de columnas eliminadas:
El sistema utiliza AutoML (Machine Learning Automatizado) para probar diferentes modelos de inteligencia artificial y elegir automáticamente el mejor, sin que el usuario tenga que configurarlos manualmente.
Score obtenido:
Para este problema de tipo no determinado , el sistema usó la métrica N/A.
El score final obtenido fue: sobre 10.
Aunque algunas métricas como el Error medio por clase se interpretan “mejor cuanto más bajo”, el sistema las transforma internamente para que todos los scores estén en la misma escala: más alto = mejor rendimiento.
AutoML (Aprendizaje Automático Automatizado) es una herramienta que entrena y compara múltiples modelos de IA por ti. Este sistema utiliza la librería H2O AutoML, una tecnología de código abierto ampliamente usada en la industria.
Prueba de forma automática diferentes tipos de algoritmos como Gradient Boosting (GBM), XGBoost, Deep Learning, Random Forest, GLM y modelos ensamblados (combinaciones de varios modelos).
Luego, selecciona el modelo que haya obtenido el mejor rendimiento según el tipo de problema detectado (regresión, clasificación binaria o multiclase), usando una métrica adecuada para cada caso.
| Modelo | Score (métrica principal) | RMSE | MAE | R² | MSE | LogLoss | AUC | Error Medio por Clase |
|---|
El modelo fue el mejor según AutoML.
Obtuvo un score final de / 10, basado en la métrica N/A.
Esta métrica depende del tipo de problema:
R², que mide la capacidad del modelo para explicar el resultado. Cuanto más alto, mejor.AUC, que mide qué tan bien distingue entre dos clases. Más alto = mejor.Error medio por clase. Un valor bajo significa que el modelo se equivoca poco. Para que todo sea más fácil de entender, este valor se transforma en una score donde más alto siempre es mejor. Cada modelo de inteligencia artificial se evalúa con distintas métricas. Algunas miden errores, otras qué tan bien predice, o si distingue bien entre categorías.
El sistema elige una de ellas como “principal” para darte una nota entre 0 y 10, pero las demás también dan pistas útiles sobre el rendimiento del modelo.
No te preocupes si en algunos modelos ves métricas con el valor N/A. Esto simplemente significa que esa métrica no se calculó.
Lo importante es fijarse en la métrica principal (AUC, R² o error medio), que sí se calcula siempre y es la que se usa para elegir el mejor modelo.
Este sistema fue creado para automatizar tareas tediosas del preprocesamiento usando IA, ayudando a quienes trabajan con datos sin necesidad de conocimientos técnicos.
