Levenshtein

November 21, 2014 in Example, Visualisation by denisb

La distance de Levenshtein, ou distance d’édition, entre deux séquences indique le nombre de “petites” modifications à faire sur la première séquences pour obtenir la seconde.

Ici, un ensemble de séquences d’actions est étudié. Deux à deux, les séquences sont analysées en calculant la distance de Levenshtein qui les sépare, le résultat est reporté dans une matrice 2D.

levenshteinDiagElec

On peut vérifier que le calcul est symétrique et que la diagonale comporte des distances nulles.

Les points clairs indiquent des couples de séquences plus différentes (que la moyenne), les points foncées des couples de séquence similaires.

Ici, on trouve une séquence éloignée de toutes les séquences (une aberration ?) et quelques couples proches, et on peut chercher une ligne un peu plus sombre qui indiquerait une “médiane” ou un comportement “type” : une séquence proche de beaucoup d’autres …