Mario Alejandro Garcia, Maria de la Paz Gimenez Pecci, Juan Bautista Cabral, Adrian Nieto Castillo e Irma Graciela Laguna
A variabilidade genética dos indivíduos da mesma espécie pode ser estudada através de redes que representam as distâncias genéticas entre eles. Estudámos o caso do vírus Mal de Rio Cuarto (MRCV), definindo medidas de distância entre perfis genómicos de diferentes indivíduos e criando uma rede de haplótipos. Foram analisadas as propriedades topológicas da rede e esta foi examinada em duas dimensões, formando ambientes espaço-temporais. O exame levou à observação de que, nas primeiras colheitas testadas, o número de haplótipos e a distância entre eles foi maior do que nas colheitas seguintes. Foi calculado um indicador de variabilidade para cada ambiente e comparado com o seu valor esperado, confirmando a observação feita durante o exame e concluindo que a variabilidade do vírus diminuiu após a ocorrência de uma epidemia durante o ano agrícola de 1996-97. É apresentada uma análise da variabilidade do MRCV através de redes de haplótipos. Propomos a utilização desta ferramenta, pouco comum nos processos KDD, trazendo uma nova abordagem que aborda os conceitos de representação de conhecimento, modelação estruturada de dados, visualização, exploração e descoberta interativa.
A principal contribuição deste caso para o processo KDD é a proposta de exploração interactiva de redes, que se revelou intuitiva e de fácil aplicação para análise.