Elmira Katanchi Kheiavi, Asadollah Ahmadikhah e Ali Mohammadian Mosammam
Uma vez que o genoma do arroz foi totalmente sequenciado, a procura de características específicas à escala genómica é de grande importância para o estudo da evolução do genoma e aplicações subsequentes. As sequências palindrómicas são importantes motivos de ADN envolvidos na regulação de diferentes processos celulares e são uma potencial fonte de instabilidade genética. Foi aplicada uma abordagem de mineração de genomas para detetar e caracterizar as longas sequências palindrómicas no genoma do arroz. Todos os palíndromos, definidos como repetições invertidas idênticas com ADN espaçador, podem ser analisados e classificados de acordo com a sua frequência, tamanho, conteúdo de GC, índice compacto, etc. do arroz (quase 51.000 palíndromos), que cobrem totalmente 41,4% do genoma nuclear do arroz, com maior e menor número de palíndromos, pertencem respectivamente aos cromossomas 1 e 12. O número do palíndromo poderia explicar bem a expansão cromossómica do arroz ( R2> 92%). O conteúdo médio de GC das sequências palindrómicas é de 42,1%, indicando a riqueza de AT e, portanto, a baixa complexidade das sequências palindrómicas. Os resultados mostraram também diferentes índices compactos de palíndromos em diferentes cromossomas (43,2 por cM no cromossoma 8 e 34,5 por cM no cromossoma 3, como maior e menor, respetivamente). A análise de co-localização mostrou que mais de 20% dos genes do arroz se sobrepunham às regiões palindrómicas, concentrando-se principalmente nos braços cromossómicos. Com base nos resultados desta investigação pode-se concluir que o genoma do arroz é rico em longas sequências palindrómicas que desencadearam uma maior variação durante a evolução. Geralmente, ambas as secções de sequências palindrómicas, incluindo as hastes e as alças, são ricas em AT, indicando que estas regiões estão localizadas nos segmentos de baixa complexidade dos cromossomas do arroz.