COllaboration, CLassification, Incrémentalité et COnnaissances

COllaboration, CLassification, Incrémentalité et COnnaissances

Domaine

De COllaboration, CLassification, Incrémentalité et COnnaissances
Révision datée du 22 avril 2013 à 16:53 par Pgancarski (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche
 Présentation générale  
 Domaines D'applications 
 Objectifs scientifiques et caractère ambitieux/novateur du projet 

Programme scientifique et structuration du projet

Deux domaines d'applications privilégiés

Les contributions théoriques et algorithmiques en fouille de données se sont toujours nourries des grands domaines d’application. Nous pensons que la confrontation de méthodes et de concepts génériques en fouille de données avec les besoins exprimés pour l’étude des dynamiques spatiales et temporelles des formes urbaines d’une part, et de la biodiversité en région de colonisation agricole d’autre part, pourra avoir un impact important, tant pour les spécialistes de ces processus, que pour l’ensemble des scientifiques et industriels devant « extraire du sens » à partir de grands volumes de données. Dans le cadre de ce projet, nous nous focaliserons sur ces deux domaines pour lesquels les laboratoires strasbourgeois et montpelliérain participants disposent déjà de nombreuses données (décrites en annexe) ainsi qu’une forte expertise de terrain.

Analyse des formes urbaines et de leurs dynamiques

L’amélioration des connaissances sur les formes et les dynamiques urbaines constitue un véritable enjeu de recherche, mais également une nécessité pour répondre à la demande d'évaluation et de suivi de l'artificialisation et de l'urbanisation, de la consommation d'espaces agricoles, forestiers, etc. Il apparaît également que les analyses opérationnelles de type diagnostic prospectif des formes urbaines doivent maîtriser les processus de croissance du tissu urbain et de l'évolution de ses formes.


Dans ce domaine, les bases de données vectorielles (par exemple, la BDTopo® de l’IGN) constituent une ressource de référence depuis le début des années 80 car elles donnent une information sur la géométrie et la topologie des objets géographiques. Ce type de données permet donc d’analyser les formes urbaines à différentes échelles (du bâtiment à la tache urbaine) et d’extraire des informations utiles pour comprendre leurs dynamiques. Toutefois, elles restent spectralement et spatialement incomplètes par rapport à la diversité des types d'occupation du sol (les espaces ouverts, les éléments arborés de petites superficies, etc.) ne permettant pas de saisir la richesse et la complexité du milieu urbain. Elles sont également insuffisamment mise à jour (actuellement tous les 5 ans pour les grandes agglomérations) et leur disponibilité, notamment au travers des mises à jour, est aussi soumise à d’importantes variations.

Pour pallier ces deux manques (richesse et disponibilité), les analyses doivent s’effectuer à partir de toutes les informations spatiales disponibles provenant de sources variées. Ainsi, les photographies aériennes donnent une vision objective (sans interprétation) des territoires à partir des années 30/50 alors que les images satellites permettent d’obtenir une information sur le comportement spectral des objets (le plus souvent du visible à l’infrarouge) depuis le début des années 70. Ces données multisources constituent donc un support essentiel pour établir une connaissance pertinente permettant d’analyser les structures urbaines (et leurs dynamiques) bien qu’elles soient hétérogènes, disponibles à des échelles d'analyse différentes, bruitées et avec parfois des valeurs manquantes. De plus, les volumes à traiter sont de plus en plus importants selon la résolution spatiale et spectrale (par exemple, 26 Go pour une image satellitaire et son modèle numérique de terrain).

Afin de tester et valider les approches proposées, les expérimentations seront menées sur l’aire urbaine de Strasbourg (plus de 400 000 habitants). En effet, l’agglomération de Strasbourg est représentative d’une agglomération, dans un contexte de plaine, soumise à l’influence transfrontalière et à une urbanisation continue au cours du dernier siècle avec un étalement urbain qui atteint actuellement la troisième couronne de l'unité urbaine.

Analyse des paysages pour le suivi de la biodiversité dans des zones de déforestation

Nous souhaitons comprendre l’érosion de la biodiversité sur une zone de déforestation. Pour cela, nous adoptons une démarche de suivi des dynamiques spatiales de la biodiversité survenues durant ces 40 dernières années en Amazonie brésilienne, zone dans laquelle ESPACE DEV, partenaire du projet dispose d’une implantation en pied d’antenne satellite à Cayenne.

Il est crucial de comprendre précisément quand et où se produisent des changements dans les paysages de cette région, mais aussi de connaître les superficies concernées par ces changements et pourquoi ils interviennent. L’objectif visé est de contribuer à l’évaluation de l’impact de politiques de colonisation sur ces dynamiques. Les données produites à la fois sur les disparités spatiales et sur les rythmes de ces transformations sont un apport qui devrait enrichir les connaissances sur l’évolution de ces régions peu étudiées. En effet, ses changements ont des conséquences importantes sur la biodiversité lors de la mise en culture des terres forestières, qu’il est nécessaire de prendre en compte pour faciliter la prise de décision en aménagement durable du territoire.

La première zone d’étude concerne la communauté agricole de Benfica (État du Pará, Brésil), située au cœur de l’arc de déforestation. Les procédés de suivi du territoire et d’estimation des dynamiques de biodiversité seront développés en premier lieu sur cette micro région. Conçues pour être reconductibles dans le temps et l’espace en exploitant des images satellites d’autres régions forestières (images LANDSAT de 120 km x 120 km,) les méthodes développées seront ensuite testées sur un deuxième site.

Ce deuxième site situé près de Santarem dans la partie occidentale de l’État du Pará (Brésil), au confluent des fleuves Amazone et Tapajos est beaucoup plus diversifié en terme d’occupation du sol. Alors que la conservation de la forêt devrait représenter 80% des terres conformément aux lois brésiliennes, le déboisement s’est poursuivi et a même augmenté avec l’installation récente d’une zone portuaire qui favorise l’accès aux marchés de la production agricole. Ce site a été choisi car il concentre une grande diversité de situations en lien avec une agriculture familiale et une exploitation industrielle des ressources naturelles. Il est considéré comme particulièrement intéressant pour l’analyse de ses paysages très contrastés combinant : l’hétérogénéité de la fragmentation du massif forestier, la diversité des composants agricoles, la disparité de la maille foncière et la rapidité des changements d’occupation des sols dans l’espace et dans le temps. Il est prévu de valide l’approche à plus grande échelle en l’appliquant sur une partie du bassin de l’Oyapock à la frontière entre la Guyane et le Brésil.

Pour les deux domaines d’application, nous proposons de fournir au cours de ce projet une étude et le premier prototype d’une ontologie des objets géographiques (formes urbaines ou paysages) à destination des utilisateurs finaux, contenant une définition formelle (1) des composants géographiques (formes urbaines ou paysagères), de leurs relations spatio-temporelles, et (2) des méthodes permettant leur extraction, afin de proposer la catégorisation des objets d’étude selon une échelle de représentation spatiale et temporelle adaptée au suivi des dynamiques spatiales urbaines ou de la biodiversité et permettre ainsi l’enrichissement et le développement de la base de connaissances.

De plus, une plate-forme intégrant les méthodes proposées au cours du projet et dédiée aux scientifiques non informaticiens sera développée. Elle s’appuiera sur la plate-forme Mustic actuellement développée par le LSIIT.