Touati R, Mignotte M, Dahmane M
Cet article aborde la problématique de la détection de changements dans des paires d'images de télédétection hétérogènes bitemporelles. Dans différentes disciplines, la multimodalité est la solution clé pour améliorer les performances dans un contexte de détection collaborative. En particulier, dans l'imagerie de télédétection, il existe encore un manque de recherche à combler avec la multiplication des capteurs, ainsi que les capacités de partage de données et la disponibilité des données multitemporelles. Cette étude vise à explorer la multimodalité dans une configuration multitemporelle pour une meilleure compréhension de la complétude collaborative des informations à l'échelle du capteur ; nous proposons une approche d'apprentissage par paires consistant en une architecture de réseau pseudo-siamois basée sur deux flux de réseau parallèles partiellement découplés. Chaque flux représente lui-même un réseau neuronal convolutionnel (CNN) qui encode les patchs d'entrée. Le modèle global de détecteur de changement (CD) comprend une étape de fusion qui concatène les deux encodages dans une seule représentation de caractéristiques multimodales qui est ensuite réduite à une dimension inférieure en utilisant des couches entièrement connectées et enfin une fonction de perte basée sur l'entropie croisée binaire est utilisée comme couche de décision. L'architecture d'apprentissage pseudo-siamois par paires proposée permet au modèle CD de capturer les dépendances spatiales et temporelles entre les paires d'images d'entrée multimodales. Le modèle traite les deux patchs d'entrée multimodaux en même temps sous différentes résolutions spatiales. Les performances d'évaluation sur différents ensembles de données multimodales réelles reflétant un mélange de conditions CD avec différentes résolutions spatiales confirment l'efficacité de l'architecture CD proposée.