Ahmad Maleki*, Vahid Vaezinia e Ayda Fekri
O promotor é uma parte da sequência de ADN que vem antes do gene e é fundamental como regulador dos genes. A previsão do promotor ajuda a determinar a posição do gene e a analisar a expressão do gene. Por isso, é de grande importância no âmbito da bioinformática. Na investigação em bioinformática, uma série de abordagens de aprendizagem automática são aplicadas para descobrir novos conhecimentos significativos a partir de bases de dados biológicas. Neste estudo, são utilizadas duas abordagens de aprendizagem, o agrupamento de maximização de expectativas e o classificador de máquina de vetores de suporte (EMSVM) para realizar a deteção do promotor. O algoritmo de maximização da expectativa (EM) é utilizado para identificar grupos de amostras que se comportam de forma semelhante e diferente, como a atividade de promotores e não promotores no primeiro estágio, enquanto a máquina de vetores de suporte (SVM) é utilizada no segundo estágio para classificar todos os dados na categoria de classe correta. Aplicámos este método a conjuntos de dados correspondentes aos promotores σ24, σ32, σ38, σ70 e a sua eficácia foi demonstrada numa variedade de diferentes regiões promotoras. Além disso, foi comparado com outros algoritmos de classificação para indicar o desempenho adequado do algoritmo proposto. Os resultados dos testes mostram que o EMSVM tem um melhor desempenho do que outros métodos.