Clustering Filogenètic WPGMA
Construeix arbres filogenètics pas a pas. Afegeix espècies amb seqüències de gens, mira la matriu de distàncies k-mer, després observa com l'algorisme WPGMA fusiona els clústers més propers en un dendrograma.
Com funciona
1. Afegir espècies — cada espècie té un ID (nom curt) i una seqüència de gens formada per nucleòtids (A, C, G, T).
2. Taula de distàncies — les distàncies entre espècies es calculen usant anàlisi k-mer: el gen es divideix en subseqüències superposades de longitud k, i les espècies es comparen segons quants k-mers comparteixen.
3. Clustering WPGMA — l'algorisme fusiona repetidament els dos clústers més propers, promediant les seves distàncies als altres clústers. Fes clic a Següent pas per veure-ho, o a Executar tot per saltar a l'arbre final.
4. Dendrograma — l'arbre filogenètic resultant mostra com es relacionen les espècies. Branques més properes = gens més similars.
Espècies
5 espècies carregades| ID | Seqüència de gens | |
|---|---|---|
| A | AACTGCATGC | |
| B | AACTGCTTGC | |
| C | GGTACCATGC | |
| D | CATGCAACTG | |
| E | TTGCAACTGC |
Taula de Distàncies
| A | B | C | D | E | |
|---|---|---|---|---|---|
| A | — | 54.55 | 76.92 | 22.22 | 40.00 |
| B | 54.55 | — | 93.33 | 66.67 | 40.00 |
| C | 76.92 | 93.33 | — | 76.92 | 93.33 |
| D | 22.22 | 66.67 | 76.92 | — | 40.00 |
| E | 40.00 | 40.00 | 93.33 | 40.00 | — |
Clustering WPGMA
Sobre aquest projecte
Originalment un projecte de C++17 per al curs de PRO2 a la FIB-UPC. L'algorisme calcula les distàncies entre parells d'espècies utilitzant anàlisi de freqüència k-mer, després fusiona iterativament el parell més proper utilitzant el Mètode del Grup de Parells Ponderats amb Mitjana Aritmètica (WPGMA) per construir un arbre filogenètic.