Mario Alejandro Garcia, Maria de la Paz Gimenez Pecci, Juan Bautista Cabral, Adrian Nieto Castillo et Irma Graciela Laguna
La variabilité génétique des individus d'une même espèce peut être étudiée à travers des réseaux qui représentent les distances génétiques entre eux. Nous avons étudié le cas du virus Mal de Rio Cuarto (MRCV), en définissant des mesures de distance entre les profils génomiques de différents individus et en créant un réseau d'haplotypes. Les propriétés topologiques du réseau ont été analysées et examinées en deux dimensions, formant des environnements spatio-temporels. L'examen a conduit à l'observation que, dans les premières années de culture testées, le nombre d'haplotypes et la distance entre eux étaient plus grands que dans les cultures suivantes. Un indicateur de variabilité a été calculé pour chaque environnement et comparé à sa valeur attendue, confirmant l'observation faite lors de l'examen et concluant que la variabilité du virus a diminué après une épidémie survenue au cours de la campagne 1996-97. Une analyse de la variabilité du MRCV à travers des réseaux d'haplotypes est présentée. Nous proposons l'utilisation de cet outil, inhabituel dans les processus KDD, apportant une nouvelle approche qui prend en compte les concepts de représentation des connaissances, de modélisation de données structurées, de visualisation, d'exploration et de découverte interactive.
La principale contribution de ce cas au processus KDD est la proposition d’exploration interactive des réseaux, qui s’est avérée intuitive et facile à appliquer pour l’analyse.