Programació II · FIB-UPC

Clustering Filogenètic WPGMA

Construeix arbres filogenètics pas a pas. Afegeix espècies amb seqüències de gens, mira la matriu de distàncies k-mer, després observa com l'algorisme WPGMA fusiona els clústers més propers en un dendrograma.

Com funciona

1. Afegir espècies — cada espècie té un ID (nom curt) i una seqüència de gens formada per nucleòtids (A, C, G, T).

2. Taula de distàncies — les distàncies entre espècies es calculen usant anàlisi k-mer: el gen es divideix en subseqüències superposades de longitud k, i les espècies es comparen segons quants k-mers comparteixen.

3. Clustering WPGMA — l'algorisme fusiona repetidament els dos clústers més propers, promediant les seves distàncies als altres clústers. Fes clic a Següent pas per veure-ho, o a Executar tot per saltar a l'arbre final.

4. Dendrograma — l'arbre filogenètic resultant mostra com es relacionen les espècies. Branques més properes = gens més similars.

Espècies

5 espècies carregades
IDSeqüència de gens
AAACTGCATGC
BAACTGCTTGC
CGGTACCATGC
DCATGCAACTG
ETTGCAACTGC
Afegir nova espècie — ID és un nom curt, Gen és una seqüència de nucleòtids A, C, G, T

Taula de Distàncies

ABCDE
A54.5576.9222.2240.00
B54.5593.3366.6740.00
C76.9293.3376.9293.33
D22.2266.6776.9240.00
E40.0040.0093.3340.00

Clustering WPGMA

Sobre aquest projecte

Originalment un projecte de C++17 per al curs de PRO2 a la FIB-UPC. L'algorisme calcula les distàncies entre parells d'espècies utilitzant anàlisi de freqüència k-mer, després fusiona iterativament el parell més proper utilitzant el Mètode del Grup de Parells Ponderats amb Mitjana Aritmètica (WPGMA) per construir un arbre filogenètic.