COllaboration, CLassification, Incrémentalité et COnnaissances

COllaboration, CLassification, Incrémentalité et COnnaissances

FICHE ANR

De COllaboration, CLassification, Incrémentalité et COnnaissances
Aller à la navigation Aller à la recherche

Voila la fiche "produit"/résumé/présentation du projet que vous devez relire/corriger/valider.

Je vous rappelle que le nombre de mots est limité ... (soumission impossible en cas de dépassement)


Version française

  • Argument du projet (500 caractères)

Coclico est un projet de recherche visant à étudier et proposer une méthode générique innovante permettant une analyse multi-échelle de grands volumes de données spatio-temporelles fournies en continue de qualité très variable, mettant en œuvre une approche multistratégie incrémentale guidée par des connaissances. Elle garantira un objectif de qualité finale prenant en compte la qualité des données et celles des connaissances.

  • Titre de la partie enjeux et objectif :

Une méthode d'extraction de connaissances adaptées à la complexité et à l’évolution rapide de grandes masses de données spatio-temporelles multisources


  • Enjeux et objectifs (2000 caractères)

Le projet Coclico vise à développer des méthodes automatiques ou semi-automatiques adaptées à la complexité et à l’évolution rapide de grandes masses de données spatio-temporelles multisources, en s’appuyant sur des méthodes avancées issues de la fouille des données et de l’apprentissage artificiel pour l’analyse et le suivi de phénomènes complexes. Il se doit donc de répondre à de nombreux défis dont entre autres : Les données constituent d’énormes volumes et le problème du passage à l’échelle des algorithmes est primordial notamment pour le développement des approches incrémentales permettant une mise à jour continue des modèles. Les données peuvent contenir des aberrations ou des erreurs dont la détection et la prise en compte dans le processus d’analyse sont complexes. Les processus naturels et anthropiques sont complexes et en constante évolution, les données utilisées sont dynamiques. L’analyse se fait à plusieurs niveaux sémantiques : il faut en effet être en mesure de mener une analyse à un niveau global autant que local et d’articuler ces niveaux. Les connaissances à la fois sur les phénomènes et processus à étudier et sur les méthodes à mettre en œuvre dans ce but sont complexes et peu formalisées.


  • Titre de la partie Méthodes / Approches :

Une approche globale basée sur la collaboration entre méthodes d’analyse « classiques » monostratégies


  • Méthodes / Approches

Quatre facettes originales ((2000 caractères)) - La méthode sera multistratégie et multi-échelle. Nous proposons d’étendre les méthodes collaboratives classiques afin de pourvoir utiliser de nouvelles familles d’algorithmes (segmentation, ranking ...). L’objectif est d’améliorer la qualité des résultats et de permettre une analyse multi-échelle des données - Elle sera incrémentale. Il n’est plus envisageable de reconstruire ex nihilo la connaissance sur le phénomène étudié à chaque nouvelle donnée. Nous proposons de mettre en œuvre une méthode incrémentale permettant la confrontation de la connaissance extraite à de nouveaux résultats d’expériences ou à de nouvelles hypothèses sur les données. L’objectif est de permettre la remise en question continue de ces connaissances extraites afin de répondre précisément aux besoins des scientifiques et thématiciens - Elle sera guidée par la connaissance. Pour réduire l’implication de l’utilisateur dans le processus, il est nécessaire d’utiliser ses connaissances sur le entités et leurs relations mutuelles, de définir leurs représentations et les mécanismes nécessaires à leur extraction et à leur reconnaissance. Nous proposons d'étudier et mettre en œuvre une telle base de connaissances. L’objectif est permettre de guider mais aussi de remettre en cause le processus collaboratif en fonction de cette connaissance - Elle sera guidée par la qualité des données et des connaissances : Nous proposons d’étudier et de mettre en œuvre une méthode intégrant une base de connaissance sur le processus collaboratif lui-même et permettant de choisir au mieux les données à traiter en fonction de leurs qualités propres et relatives mais aussi de sélectionner les méthodes de prétraitement les plus adaptées, les « meilleures » méthodes monostratégies et la meilleure configuration de collaboration multistratégie pour celles-ci. L’objectif est de rendre la méthode robuste face au bruit et aux erreurs de formalisation dans les connaissances du domaine

Version anglaise

  • Argument du projet (500 caractères)

Coclico is a research project aiming at studying and proposing a generic and innovative method for large volumes of multi-scale, spatiotemporal data streams(?) of variable quality, by using a incremental knowledge-guided multi-strategy approach. It will ensure a quality final goal that takes into account the quality of data and of knowledge.

  • Titre de la partie enjeux et objectif :

A knowledge extraction method adapted to the complexity and rapid evolution of large masses of multi-source spatiotemporal data

  • Enjeux et objectifs (2000 caractères)

The Coclico project aims to develop automatic or semi-automatic methods, tailored to the complexity and rapid evolution of large masses of multi-source spatiotemporal data, relying on advanced methods from data mining and the machine learning for the analysis and monitoring of complex phenomena. It must therefore meet several challenges, including:

  • The data volumes are huge and the problem of scaling algorithms is particularly important for the development of incremental approaches allowing for continuously updating models.
  • The data may contain errors or aberrations whose detection and consideration in the analysis process are complex.
  • Natural and anthropogenic processes are complex and constantly evolving, the data are dynamic.
  • The analysis is done in several semantic levels: it must indeed be able to conduct an analysis on both the global and local levels and articulate these levels.
  • The knowledge about both the phenomena and processes under study and the methods to be implemented for this purpose are complex and barely formalized.


  • Titre de la partie Méthodes / Approches :

Une approche globale basée sur la collaboration entre méthodes d’analyse « classiques » monostratégies, A comprehensive approach based on collaboration between "classical" mono-strategy methods


  • Méthodes / Approches

Four original facets ((2000 caractères)):

  • The method will be multi-strategy and multi-scale. We propose to extend the traditional collaborative methods in order to be able to use new families of algorithms (segmentation, ranking ...). The goal is to improve the quality of results and enable a multi-scale data analysis
  • It will be incremental. It is no longer possible to reconstruct knowledge from scratch from the phenomenon under study at each new data. We propose to implement an incremental method for the comparison of the extracted knowledge to new experimental results or new hypotheses about the data. The objective is to allow for a continuous questioning of the extracted knowledge to meet the specific needs of the scientists and the thematicians(?)
  • It will be guided by knowledge. To minimize the involvement of the user during the process, it is necessary to use her knowledge of the entities and their mutual relations, define their representations and mechanisms for their extraction and recognition. We propose to study and implement such a knowledge base. The goal is help guide, but also to challenge, the collaborative process based on this knowledge
  • Elle sera guidée par la qualité des données et des connaissances : Nous proposons d’étudier et mettre en œuvre une méthode intégrant une base de connaissance sur le processus collaboratif lui-même et permettant de choisir au mieux les données à traiter en fonction de leurs qualités propres et relatives mais aussi de sélectionner les méthodes de prétraitement les plus adaptées, les « meilleures » méthodes monostratégies et la meilleure configuration de collaboration multistratégie pour celles-ci. L’objectif est de rendre la méthode robuste face au bruit et aux erreurs de formalisation dans les connaissances du domaine
  • It will be guided by the quality of data and knowledge: We propose to study and implement a method integrating a knowledge base with the collaborative process itself, enabling to choose the best data to be processed according to their own and related qualities but also to select the most appropriate pre-treatment methods, the "best" mono-strategy methods, and the best configuration for multi-strategy collaborative for the latter. The goal is to make the method robust to noise and errors in the formalization of domain knowledge