Machine Learning · FIB-UPC

Classificació d'Hipotiroïdisme

Pipeline de classificació binària de principi a fi — prediu l'hipotiroïdisme a partir de dades clíniques utilitzant 9 famílies de models en sklearn. Les demostracions interactives a continuació executen models entrenats reals directament al teu navegador.

Pipeline ML
FIB-UPC · Aprenentatge Automàtic·amb Marta Granero
📂
Dades ARFF
hypothyroid.arff
🔧
Preprocés
Imputació, escalat, encoding
📊
EDA
Correlació, distribucions
🤖
Models
9 famílies de sklearn
Avaluació
CV, ROC, matrius de confusió
Regressió LogísticaLDA / QDANaive Bayesk-NNSVM (lineal + kernel)MLP (xarxes neuronals)Random ForestRidge / LassoCerca bayesiana d'hiperparàmetres
🏥

Predictor d'Hipotiroïdisme

Model LogReg real · s'executa al navegador

Edat50 anys
TSH2 µU/mL
TT4109 nmol/L
T32 nmol/L
Negatiu — saludable
Regressió Logística · 97.3% de confiança
📍

k-NN en projecció PCA

200 punts reals de test · fes clic per classificar

k =
Fes clic al gràfic per classificar un punt

Importància de característiques

Edat
0.11
TSH
5.42
TT4
0.76
T3
0.12

|coef| de Regressió Logística en característiques estandarditzades — TSH domina la predicció.

Resum del dataset

hypothyroid.arff — estil UCI amb atributs numèrics (edat, TSH, T3, TT4, FTI, T4U) i categòrics. Variable objectiu: binaryClass (P/N).

Reptes: molts NaN, valors atípics en edat, TBG descartat, desequilibri de classes — gestionat mitjançant imputació, mètriques adequades (F1, ROC-AUC).

Vista prèvia de Jupyter notebook

Obrir a Nbviewer ↗
▸ Executar els notebooks localmente
git clone https://github.com/cuberhaus/APA_Practica.git
cd APA_Practica
python -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
jupyter lab PracticaAPA-Hipotiroidismo-PolCasacubertaMartaGranero.ipynb