Abdulrahaman A. Musa, Usman Malami Aliyu
De acordo com a agência internacional de investigação sobre o cancro, o cancro da mama feminino foi o principal tipo de cancro a nível mundial em termos do número de novos casos (aproximadamente 2,1 milhões) diagnosticados em 2018.
Prever o resultado de uma doença é uma tarefa desafiante. As técnicas de data mining tendem a simplificar o segmento de previsão. As ferramentas automatizadas permitiram a recolha de grandes volumes de dados médicos, que são disponibilizados aos grupos de investigação médica. Este estudo teve como objetivo aplicar algoritmos de aprendizagem automática utilizando o classificador de decisão três e a estatística descritiva para avaliar o desempenho do modelo na previsão da probabilidade de metástase do cancro em doentes com apresentação tardia.
Materiais e método: O conjunto de dados sobre as doenças do cancro da mama foi retirado do departamento de Radioterapia e Oncologia do Hospital Universitário Usmanu Danfodiyo, estado de Sokoto, Nigéria. O conjunto de dados tem 259 instâncias e 10 atributos. Os resultados experimentais deste estudo utilizaram o classificador de decisão três no ambiente de software IMB SPSS (versão 23). Na experiência foram utilizadas duas classes e por isso foi aplicada uma matriz de confusão 2 × 2. Classe 0=Não metastizado, Classe 1=Metástase. Aplicámos uma abordagem de aprendizagem automática supervisionada em que o conjunto de dados foi dividido em duas classes que são o treino e o teste usando validação cruzada de 10 vezes.
Resultados: Mostra que em 259 casos de cancro da mama, 218 (84,2%) casos não tiveram metástase, enquanto 41 (15,8%) casos tiveram metástase para outra região do corpo. A precisão global do modelo foi de 87%, com uma sensibilidade de 88%, uma especificidade de 75% e uma precisão de 98%.
Conclusão: Com base nestes achados, o algoritmo de aprendizagem automática utilizando classificadores de decisão três previu que 87% do tumor se apresentava no estádio IV, indicando que o tumor pode espalhar-se para outras regiões do corpo.