Ilya Y Zhbannikov, Samuel S Hunter, Matthew L Settles e James A Foster
Com o advento da sequenciação de nova geração (NG), tornou-se possível sequenciar um genoma inteiro de forma rápida e barata. No entanto, em algumas experiências, basta extrair e montar uma parte das leituras da sequência, por exemplo, ao realizar estudos de transcriptoma, sequenciar genomas mitocondriais ou caracterizar exomas. Com a biblioteca de ADN em bruto de um genoma completo, pareceria um problema trivial identificar leituras de interesse. Mas nem sempre é fácil incorporar ferramentas conhecidas como BLAST, BLAT, Bowtie e SOAP diretamente em pipelines de bioinformática antes da fase de montagem, seja devido à incompatibilidade com as entradas de ficheiro do assembler, ou porque é desejável incorporar informações que devem ser extraídas separadamente . Por exemplo, para incorporar fluxogramas de um sequenciador Roche 454 no montador Newbler é necessário primeiro extraí-los dos ficheiros SFF originais. Apresentamos o SlopMap, um utilitário de software de bioinformática que permite uma identificação rápida semelhante às sequências alvo fornecidas a partir da biblioteca de ADN Roche 454 ou Illumnia. Com uma interface de linha de comandos simples e intuitiva, juntamente com formatos de saída de ficheiros compatíveis com programas de montagem, o SlopMap pode ser incorporado diretamente no pipeline de processamento de dados biológicos sem qualquer trabalho adicional de programação. Além disso, o SlopMap preserva a informação do fluxograma necessária para o montador Roche 454.