Programación II · FIB-UPC

Clustering Filogenético WPGMA

Construye árboles filogenéticos paso a paso. Añade especies con secuencias de genes, mira la matriz de distancias k-mer, luego observa cómo el algoritmo WPGMA fusiona los clústeres más cercanos en un dendrograma.

Cómo funciona

1. Añadir especies — cada especie tiene un ID (nombre corto) y una secuencia de genes formada por nucleótidos (A, C, G, T).

2. Tabla de distancias — las distancias entre especies se calculan usando análisis k-mer: el gen se divide en subsecuencias superpuestas de longitud k, y las especies se comparan según cuántos k-mers comparten.

3. Clustering WPGMA — el algoritmo fusiona repetidamente los dos clústeres más cercanos, promediando sus distancias a los demás clústeres. Haz clic en Siguiente paso para verlo, o en Ejecutar todo para saltar al árbol final.

4. Dendrograma — el árbol filogenético resultante muestra cómo se relacionan las especies. Ramas más cercanas = genes más similares.

Especies

5 especies cargadas
IDSecuencia de genes
AAACTGCATGC
BAACTGCTTGC
CGGTACCATGC
DCATGCAACTG
ETTGCAACTGC
Añadir nueva especie — ID es un nombre corto, Gen es una secuencia de nucleótidos A, C, G, T

Tabla de Distancias

ABCDE
A54.5576.9222.2240.00
B54.5593.3366.6740.00
C76.9293.3376.9293.33
D22.2266.6776.9240.00
E40.0040.0093.3340.00

Clustering WPGMA

Sobre este proyecto

Originalmente un proyecto de C++17 para el curso de PRO2 en la FIB-UPC. El algoritmo calcula las distancias entre pares de especies utilizando análisis de frecuencia k-mer, luego fusiona iterativamente el par más cercano utilizando el Método del Grupo de Pares Ponderados con Media Aritmética (WPGMA) para construir un árbol filogenético.