Detección de Pólipos con Aumento de Datos Generativo
Entrena detectores Faster R-CNN, RetinaNet y SSD en datos de colonoscopia, aumentados con imágenes sintéticas de modelos generativos CycleGAN y SPADE. Búsqueda de hiperparámetros vía Optuna y Ray Tune.
Inferencia simulada
Mock de navegador · Faster R-CNN
Simula inferencia de Faster R-CNN en un frame de colonoscopia.
Las bounding boxes son un mock del navegador, no la salida real del modelo.
Traducción CycleGAN
Imagen a imagen no emparejada
CycleGAN aprende una traducción no emparejada máscara ↔ pólipo. SPADE usa normalización espacial adaptativa para síntesis máscara → pólipo.
Las ilustraciones son esquemáticas. Las salidas reales de CycleGAN son imágenes fotorrealistas.
Comparación de modelos
10 configuraciones de Faster R-CNN desde Optuna HPO
Todos los modelos son Faster R-CNN (ResNet-50 FPN). Métricas de evaluación COCO en el test set LDPolypVideo.
Arquitecturas de detección
| Modelo | Backbone | Notas |
|---|---|---|
| Faster R-CNN | ResNet-50 FPN | Detector principal, mejores resultados |
| RetinaNet | ResNet-50 FPN v2 | Basado en anclajes de una etapa |
| SSD Lite | MobileNet V3 | Ligero / móvil |
Dashboard local
El proyecto incluye un dashboard de Streamlit para exploración e inferencia interactiva. Clona el repo y ejecuta streamlit run src/app.py desde code/.