Machine Learning · FIB-UPC
Clasificación de Hipotiroidismo
Pipeline de clasificación binaria de principio a fin — predice el hipotiroidismo a partir de datos clínicos utilizando 9 familias de modelos en sklearn. Las demostraciones interactivas a continuación ejecutan modelos entrenados reales directamente en tu navegador.
📂
Datos ARFF
hypothyroid.arff
🔧
Preproceso
Imputación, escalado, encoding
📊
EDA
Correlación, distribuciones
🤖
Modelos
9 familias de sklearn
✅
Evaluación
CV, ROC, matrices de confusión
Regresión LogísticaLDA / QDANaive Bayesk-NNSVM (lineal + kernel)MLP (redes neuronales)Random ForestRidge / LassoBúsqueda bayesiana de hiperparámetros
🏥
Predictor de Hipotiroidismo
Modelo LogReg real · se ejecuta en el navegador
Edad50 años
TSH2 µU/mL
TT4109 nmol/L
T32 nmol/L
✅
Negativo — saludable
Regresión Logística · 97.3% de confianza
📍
k-NN en proyección PCA
200 puntos reales de test · haz clic para clasificar
k =
Haz clic en el gráfico para clasificar un punto
Importancia de características
Edad0.11
TSH5.42
TT40.76
T30.12
|coef| de Regresión Logística en características estandarizadas — TSH domina la predicción.
Resumen del dataset
hypothyroid.arff — estilo UCI con atributos numéricos (edad, TSH, T3, TT4, FTI, T4U) y categóricos. Variable objetivo: binaryClass (P/N).
Desafíos: muchos NaN, valores atípicos en edad, TBG descartado, desequilibrio de clases — manejado mediante imputación, métricas adecuadas (F1, ROC-AUC).
▸ Vista previa de Jupyter notebook
Abrir en Nbviewer ↗▸ Ejecutar los notebooks localmente
git clone https://github.com/cuberhaus/APA_Practica.git cd APA_Practica python -m venv .venv && source .venv/bin/activate pip install -r requirements.txt jupyter lab PracticaAPA-Hipotiroidismo-PolCasacubertaMartaGranero.ipynb