Detecció de Pòlips amb Augment de Dades Generatiu
Entrena detectors Faster R-CNN, RetinaNet i SSD en dades de colonoscòpia, augmentades amb imatges sintètiques de models generatius CycleGAN i SPADE. Cerca d'hiperparàmetres via Optuna i Ray Tune.
Inferència simulada
Mock de navegador · Faster R-CNN
Simula inferència de Faster R-CNN en un frame de colonoscòpia.
Les bounding boxes són un mock del navegador, no la sortida real del model.
Traducció CycleGAN
Imatge a imatge no emparellada
CycleGAN aprèn una traducció no emparellada màscara ↔ pòlip. SPADE utilitza normalització espacial adaptativa per síntesi màscara → pòlip.
Les il·lustracions són esquemàtiques. Les sortides reals de CycleGAN són imatges fotorrealistes.
Comparació de models
10 configuracions de Faster R-CNN des d'Optuna HPO
Tots els models són Faster R-CNN (ResNet-50 FPN). Mètriques d'avaluació COCO en el test set LDPolypVideo.
Arquitectures de detecció
| Model | Backbone | Notes |
|---|---|---|
| Faster R-CNN | ResNet-50 FPN | Detector principal, millors resultats |
| RetinaNet | ResNet-50 FPN v2 | Basat en ancoratges d'una etapa |
| SSD Lite | MobileNet V3 | Lleuger / mòbil |
Tauler local
El projecte inclou un dashboard de Streamlit per exploració i inferència interactiva. Clona el repo i executa streamlit run src/app.py des de code/.