Ilya Y. Zhbannikov, Samuel S. Hunter, Matthew L. Settles et James A. Foster
Avec l'avènement du séquençage de nouvelle génération (NG), il est devenu possible de séquencer un génome entier rapidement et à moindre coût. Cependant, dans certaines expériences, il suffit d'extraire et d'assembler une partie des lectures de séquence, par exemple lors d'études de transcriptome, de séquençage de génomes mitochondriaux ou de caractérisation d'exomes. Avec la bibliothèque d'ADN brut d'un génome complet, il semblerait que ce soit un problème trivial d'identifier les lectures intéressantes. Mais il n'est pas toujours facile d'intégrer des outils bien connus tels que BLAST, BLAT, Bowtie et SOAP directement dans un pipeline bioinformatique avant l'étape d'assemblage, soit en raison d'une incompatibilité avec les entrées de fichiers de l'assembleur, soit parce qu'il est souhaitable d'incorporer des informations qui doivent être extraites séparément. Par exemple, pour incorporer des flowgrammes d'un séquenceur Roche 454 dans l'assembleur Newbler, il est nécessaire de les extraire d'abord des fichiers SFF d'origine. Nous présentons SlopMap, un logiciel utilitaire bioinformatique qui permet une identification rapide similaire aux séquences cibles fournies par la bibliothèque d'ADN Roche 454 ou Illumnia. Avec une interface de ligne de commande simple et intuitive ainsi que des formats de sortie de fichier compatibles avec les programmes d'assemblage, SlopMap peut être directement intégré dans le pipeline de traitement des données biologiques sans aucun travail de programmation supplémentaire. De plus, SlopMap préserve les informations du diagramme de flux nécessaires à l'assembleur Roche 454.