Bolshoy A, Salih B, Cohen I e Tatarinova T
Como as variações nos comprimentos dos genes (alguns genes tornam-se mais longos que os seus antecessores, enquanto outros genes tornam-se mais curtos e os tamanhos destas facções são aleatoriamente diferentes de organismo para organismo) dependem da evolução e adaptação do organismo ainda é uma questão em aberto. Propomos classificar os genomas de acordo com o comprimento dos seus genes e depois encontrar associação entre a classificação do genoma e várias propriedades, como a temperatura de crescimento, a composição de nucleótidos e a patogenicidade. Esta abordagem revela fatores determinantes evolutivos. O principal objetivo deste estudo é testar a eficácia e robustez de vários métodos de classificação. O método de avaliação selecionado é a medição da classificação global dos dados. Demonstramos que todos os métodos considerados fornecem resultados consistentes e o Bubble Sort e o Simulated Annealing atingem a classificação mais elevada. Além disso, o Bubble Sort é consideravelmente mais rápido do que o método Simulated Annealing.