Jean Armengaud, Celine Bland, Joseph Christie-Oleza e Guylaine Miotello
Um consenso para definir a unidade fundamental da diversidade biológica, a espécie, ainda não foi alcançado para procariontes. Embora ferramentas moleculares de alto rendimento estejam agora disponíveis para avaliar a diversidade microbiana, estimar o número total de espécies de bactérias e arqueas na Terra ainda é um desafio devido à enorme quantidade de espécies pouco abundantes presentes em amostras ambientais. Desde o primeiro genoma celular inteiro sequenciado, o de Haemophilus influenzae em 1995, mais de sete mil genomas completos foram relatados. A avalanche de sequências de genoma está resultando em uma documentação excepcional de representantes de vários táxons. Embora a anotação desses genomas tenha ganhado precisão com novas ferramentas de predição de genes, a proteogenômica provou ajudar na descoberta de novos genes, identificando o verdadeiro códon de iniciação translacional de sequências de domínio de codificação e caracterizando eventos de maturação no nível de proteína, como o processamento de peptídeos de sinal. Além dessa anotação estrutural, a proteogenômica também pode dar origem a insights significativos sobre a função das proteínas. Basicamente, a proteogenômica consiste em obter dados massivos de sequência de proteínas por meio de grandes estratégias proteômicas shotgun e o uso de espectrometria de massa tandem de alto rendimento. Esses dados experimentais são então usados para melhorar a anotação do genoma. Resultados inesperados, como a reversão de sequências de genes em diferentes bactérias ou o uso de códons de início não canônicos para tradução em espécies de Deinococcus são apenas algumas das inúmeras correções documentadas até agora. Hoje, a análise proteogenômica de um determinado conjunto de representantes que cobrisse completamente a árvore da vida resultaria em um melhor terreno para a anotação precisa de novas cepas. Isso melhoraria os estudos de genômica comparativa e poderia ser útil para avaliar de que maneira espécies intimamente relacionadas estão diferindo.