Tengfei Yin, Mahbubul Majumder, Niladri Roy Chowdhury, Dianne Cook, Randy Shoemaker e Michelle Graham
Numa análise de dados de RNA-Seq da soja, os testes iniciais de significância utilizando um pacote de software produziram listas de genes muito diferentes das produzidas por outro. Como pode acontecer? Este artigo demonstra como as disparidades entre os resultados foram investigadas e podem ser explicadas. Este tipo de contradição pode ocorrer de forma mais geral em análises de alto rendimento. Para explorar o ajuste do modelo e o teste de hipóteses, implementámos um gráfico interativo que permite a exploração do efeito da estimação da dispersão na estimação global dos testes de variância e expressão diferencial. Além disso, propomos um novo procedimento para testar a presença de qualquer estrutura em dados biológicos.