Rong Xu e Quanqiu Wang
A medicina personalizada consiste em entregar o medicamento certo ao paciente certo, na dose certa. A farmacogenómica (PGx), os estudos para identificar variantes genéticas que podem afetar a resposta aos medicamentos, é importante para a medicina personalizada. As abordagens computacionais no estudo das relações entre genes e resposta a medicamentos estão a emergir como uma área de investigação ativa para a medicina personalizada. Atualmente, o estudo sistemático das relações medicamento-gene é limitado porque é difícil construir e manter atualizada uma base de conhecimento da relação medicamento-gene compreensível por máquina em larga escala. A literatura científica contém informação rica sobre as relações entre medicamentos e genes, sendo, por isso, a melhor fonte de conhecimento para estudos de PGx e para a medicina personalizada. No entanto, esta informação está em grande parte oculta em texto livre com compreensão limitada pela máquina. Há necessidade de desenvolver abordagens automáticas para extrair relações estruturadas entre medicamentos e genes da literatura biomédica. Neste estudo, apresentamos uma abordagem semi-supervisionada para extrair relações entre fármacos e genes do MEDLINE. A técnica utiliza um padrão inicial e aprende iterativamente várias formas pelas quais a relação pode ser expressa em 20 milhões de resumos da MEDLINE. A nossa abordagem alcançou precisões elevadas (0,961-1,00) na extração de relações fármaco-gene do MEDLINE e encontrou muitos pares fármaco-gene que não estão disponíveis no PharmGKB, uma base de conhecimento PGx com curadoria manual em larga escala.