Machine Learning · FIB-UPC

Clasificación de Hipotiroidismo

Pipeline de clasificación binaria de principio a fin — predice el hipotiroidismo a partir de datos clínicos utilizando 9 familias de modelos en sklearn. Las demostraciones interactivas a continuación ejecutan modelos entrenados reales directamente en tu navegador.

Pipeline ML
FIB-UPC · Aprendizaje Automático·con Marta Granero
📂
Datos ARFF
hypothyroid.arff
🔧
Preproceso
Imputación, escalado, encoding
📊
EDA
Correlación, distribuciones
🤖
Modelos
9 familias de sklearn
Evaluación
CV, ROC, matrices de confusión
Regresión LogísticaLDA / QDANaive Bayesk-NNSVM (lineal + kernel)MLP (redes neuronales)Random ForestRidge / LassoBúsqueda bayesiana de hiperparámetros
🏥

Predictor de Hipotiroidismo

Modelo LogReg real · se ejecuta en el navegador

Edad50 años
TSH2 µU/mL
TT4109 nmol/L
T32 nmol/L
Negativo — saludable
Regresión Logística · 97.3% de confianza
📍

k-NN en proyección PCA

200 puntos reales de test · haz clic para clasificar

k =
Haz clic en el gráfico para clasificar un punto

Importancia de características

Edad
0.11
TSH
5.42
TT4
0.76
T3
0.12

|coef| de Regresión Logística en características estandarizadas — TSH domina la predicción.

Resumen del dataset

hypothyroid.arff — estilo UCI con atributos numéricos (edad, TSH, T3, TT4, FTI, T4U) y categóricos. Variable objetivo: binaryClass (P/N).

Desafíos: muchos NaN, valores atípicos en edad, TBG descartado, desequilibrio de clases — manejado mediante imputación, métricas adecuadas (F1, ROC-AUC).

Vista previa de Jupyter notebook

Abrir en Nbviewer ↗
▸ Ejecutar los notebooks localmente
git clone https://github.com/cuberhaus/APA_Practica.git
cd APA_Practica
python -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
jupyter lab PracticaAPA-Hipotiroidismo-PolCasacubertaMartaGranero.ipynb