Touati R, Mignotte M, Dahmane M
Este artigo aborda a problemática da deteção de alterações em pares de imagens de deteção remota heterogéneas bitemporais. Em diferentes disciplinas, a multimodalidade é a solução chave para a melhoria do desempenho num contexto de deteção colaborativa. Particularmente, nas imagens de deteção remota ainda existe uma lacuna de investigação a ser preenchida com a multiplicação de sensores, juntamente com capacidades de partilha de dados e disponibilidade de dados multitemporais. Este estudo tem como objetivo explorar a multimodalidade numa configuração multitemporal para uma melhor compreensão da completação colaborativa de informação em todo o sensor; propomos uma abordagem de aprendizagem emparelhada que consiste numa arquitetura de rede pseudo-siamesa baseada em dois fluxos de rede paralelos parcialmente desacoplados. Cada fluxo representa uma Rede Neural Convolucional (CNN) que codifica os patches de entrada. O modelo geral do Change Detector (CD) inclui um estágio de fusão que concatena as duas codificações numa única representação de características multimodal que é então reduzida a uma dimensão inferior utilizando camadas totalmente conectadas e, finalmente, uma função de perda baseada na entropia cruzada binária é utilizada como uma camada de decisão. A arquitetura de aprendizagem pseudo-siamesa proposta permite ao modelo CD capturar as dependências espaciais e temporais entre pares de imagens de entrada multimodais. O modelo processa os dois patches de entrada multimodais ao mesmo tempo, sob diferentes resoluções espaciais. Os desempenhos de avaliação em diferentes conjuntos de dados multimodais reais, refletindo uma mistura de condições de CD com diferentes resoluções espaciais, confirmam a eficácia da arquitetura de CD proposta.