Georges Natsoulis, Nancy Zhang, Katrina Welch, John Bell e Hanlee P Ji
Aproveitando as capacidades de sequenciação direcionada profunda dos sequenciadores de nova geração, desenvolvemos um novo algoritmo de deteção de exclusão de inserção (indel) (IDA) em dois passos que pode determinar indels a partir de sequências de leitura única com alta eficiência computacional e sensibilidade quando os indels são fracionadamente mais pequenos comparados para a sequência de referência selvagem. Em primeiro lugar, identifica posições candidatas de indel utilizando artefactos específicos de alinhamento de sequências produzidos por programas de alinhamento rápido. Em segundo lugar, confirma a localização do indel candidato utilizando o algoritmo Smith-Waterman (SW) num subconjunto restrito de leituras de sequências. Demonstramos que o IDA é aplicável a indels de tamanhos variados, a partir de dados de sequenciação direcionada profunda em frações baixas, onde o indel é diluído pela sequência do tipo selvagem. O nosso algoritmo é útil na deteção de variantes indel presentes em frequências alélicas variáveis, como podem ocorrer em heterozigotos e tecido tumoral normal misto.