Curtis Davis, Karthik Kota, Venkat Baldhandapani, Wei Gong, Sahar Abubucker, Eric Becker, John Martin, Kristine M. Wylie, Radhika Khetani, Matthew E. Hudson, George M. Weinstock Weinstock e Makedonka Mitreva
Os recentes avanços nas tecnologias de sequenciação de nova geração exigem algoritmos de alinhamento e software que possam acompanhar o aumento da produção de dados. Os algoritmos padrão, especialmente pesquisas por similaridade de proteínas, representam estrangulamentos significativos nos pipelines de análise. Para abordagens metagenómicas em particular, é agora frequentemente necessário pesquisar centenas de milhões de leituras de sequências em grandes bases de dados. Aqui descrevemos o mBLAST, um algoritmo de pesquisa acelerada para alinhamentos traduzidos e/ou proteicos para grandes conjuntos de dados com base na Ferramenta Básica de Pesquisa de Alinhamento Local (BLAST) e mantendo a alta sensibilidade do BLAST. Os algoritmos mBLAST conseguem uma velocidade substancial em relação aos programas BLASTX, TBLASTX e BLASTP do Centro Nacional de Informação sobre Biotecnologia (NCBI) para grandes conjuntos de dados, permitindo análises dentro de prazos razoáveis em arquiteturas de computadores padrão. Neste artigo, o impacto do mBLAST é demonstrado com sequências originárias da microbiota de humanos saudáveis do Projeto Microbioma Humano. O mBLAST foi concebido como um plug-in substituto do BLAST para qualquer estudo que envolva sequências de leitura curta e inclua análise de alto rendimento. O software mBLAST está disponível gratuitamente para utilizadores académicos em www.multicorewareinc.com.