Georges Natsoulis, Nancy Zhang, Katrina Welch, John Bell et Hanlee P Ji
En tirant parti des capacités de séquençage ciblé en profondeur des séquenceurs de nouvelle génération, nous avons développé un nouvel algorithme de détection d'insertion/délétion (IDA) en deux étapes qui peut déterminer les indels à partir de séquences à lecture unique avec une efficacité de calcul et une sensibilité élevées lorsque les indels sont fractionnellement inférieurs à la séquence de référence de type sauvage. Tout d'abord, il identifie les positions d'indel candidates en utilisant des artefacts d'alignement de séquence spécifiques produits par des programmes d'alignement rapide. Deuxièmement, il confirme l'emplacement de l'indel candidate en utilisant l'algorithme Smith-Waterman (SW) sur un sous-ensemble restreint de lectures de séquence. Nous démontrons que l'IDA est applicable aux indels de différentes tailles à partir de données de séquençage ciblé en profondeur à de faibles fractions où l'indel est dilué par la séquence de type sauvage. Notre algorithme est utile pour détecter les variantes d'indel présentes à des fréquences alléliques variables telles que celles qui peuvent se produire chez les hétérozygotes et les tissus mixtes normaux-tumoraux.