DOCTORANT-E : INDEXATION ET RECHERCHE À GRANDE ÉCHELLE DANS LES CONTENUS MULTIMÉDIAS ET GÉOSPATIAUX

Réf. 20251031-1457
Ville Champs-sur-Marne
Région Ile-de-France
Type d'emploi Thèse
Modalités de recrutement Thèse
Durée du contrat 3 ans
Type de temps de travail Temps complet
Domaine Recherche et Enseignement
Sous-domaine Recherche et Enseignement
Catégorie du poste A
RIFSEEP A4
Etat du poste Poste vacant
Date souhaitée de prise de poste 01/01/2026
Déplacement à prévoir Déplacements occasionnels
Télétravail Télétravail partiel possible

L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution.

Grâce à son école d’ingénieurs, l'ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).

Contexte

L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu’à leur évolution. Grâce à son école d’ingénieurs, Géodata Paris, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).

Le laboratoire LASTIG (Laboratoire en Sciences et Technologies de l’Information Géographique pour la ville intelligente et les territoires durables) est une unité mixte de recherche rattachée à l’Université Gustave Eiffel, à l’IGN (Institut national de l’information géographique et forestière) et à l’EIVP (École des Ingénieurs de la Ville de Paris). Il constitue une structure de recherche unique en France et même en Europe, réunissant environ 80 chercheurs couvrant l’ensemble du cycle de vie des données géographiques ou spatiales, depuis leur acquisition jusqu’à leur visualisation, en passant par leur modélisation, intégration et analyse. Parmi eux, environ 30 chercheurs travaillent en analyse d’images, vision par ordinateur, apprentissage automatique et télédétection.

Les membres du LASTIG collaborent étroitement avec l’IGN qui, en tant qu’établissement public administratif rattaché au Ministère de la Transition Écologique, est l’opérateur de référence national pour la cartographie du territoire français. Les chercheurs et doctorants du LASTIG peuvent également être impliqués dans les activités d’enseignement de l’école d’ingénieurs de l’IGNGeodata Paris (ex-ENSG, École Nationale des Sciences Géographiques), offrant un accès à des étudiants de niveau licence et master dans des domaines liés aux sciences de l’information géographique : géodésie, photogrammétrie, vision par ordinateur, télédétection, analyse spatiale, cartographie, etc.

DALEAS (2026-2028) est un projet de recherche français financé par l’appel à projet ASTRID visant à concevoir une infrastructure capable d’analyser en temps réel des volumes très importants de données multimédias (images, vidéos, textes, 3D, etc.), afin de détecter automatiquement les données non géoréférencées avec une base géoréférencée de référence. En s’appuyant sur des données de référence fiables, telles que celles de l’Institut national de l’information géographique et forestière (IGN), et sur les principes FAIR4RS [Barker et al., 2022], DALEAS aspire à fournir un outil collaboratif, flexible, transparent et durable, réutilisable dans tout contexte nécessitant l’analyse à grande échelle de flux de données géospatiales. Cette preuve de concept, mise en œuvre avec le framework Apache Spark™, est conçue pour permettre une montée en charge transparente. Elle constitue un socle pour de nouvelles recherches sur la détection d’anomalies en temps réel, centrée sur l’indexation et la recherche multimodale à grande échelle — c’est-à-dire la capacité à interroger rapidement des bases de données massives selon des critères potentiellement complexes et des types de données variés.

Le consortium réunit l’IJCLab et le LASTIG, deux laboratoires disposant d’expertises avancées et complémentaires dans le traitement de données massives, en particulier spatiales. Ils fourniront des solutions logicielles et algorithmiques innovantes pour le traitement de données multimédias massives, s’appuyant sur l’architecture Fink [Möller et al., 2021], sous les principes de transparence, d’adaptabilité, de reproductibilité et d’accessibilité. Grâce à la conception de cette infrastructure, DALEAS vise à répondre aux besoins de secteurs variés : le projet ambitionne de démontrer ses capacités dans la lutte contre la désinformation avec France Télévisions, le soutien à la sécurité et défense avec la Gendarmerie nationale, la mise à jour de jumeaux numériques avec l’IGN, et l’observation spatiale avec l’IJCLab.

Le doctorant contribuera à la conception et à l’évaluation de stratégies d’indexation et de recherche multimodale évolutives dans le cadre de DALEAS. En particulier, il soutiendra le cas d’usage sur la lutte contre la désinformation par géolocalisation de flux de données, via l’analyse de contenus, leur fusion et alignement, reposant sur la recherche de documents caractérisant le même lieu que celui de la requête, en exploitant les modalités disponibles - textes, images et nuages de points 3D (LiDAR) dans notre cas.

 

Missions

Réalisée dans le cadre du projet DALEAS, la thèse porte sur l’indexation et la recherche dans les contenus multimédias à grande échelle. Les contenus considérés, tels qu’images, textes et nuages de points 3D, documentent une zone géographique (une ville, une rue, un monument, etc.). Les travaux de recherche consisteront à concevoir des représentations et des stratégies d’indexation efficaces et flexibles, permettant une recherche rapide et précise dans ces contenus, en fonction des données disponibles dans la requête ainsi que dans la base interrogée. La recherche permettra d’identifier des documents liés à une même zone géographique, dans le but de localiser la requête si la base interrogée est géoréférencée. S’appuyant sur les travaux antérieurs sur les représentations LiDAR-vers-texte réalisés au sein du laboratoire LASTIG, ainsi que sur les modèles multimodaux de grande taille (Multimodal Large Language Models) en général, le candidat proposera des stratégies de fusion et d’alignement des modalités disponibles. Intégrés à l’infrastructure d’indexation et de recherche de DALEAS reposant sur celle d’Apache Spark™, ces travaux permettront la recherche à grande échelle dans les collections multimédias, avec une application à l’analyse géospatiale des médias des réseaux sociaux en partenariat avec France Télévisions, dans le cadre de la lutte contre la désinformation.

L’indexation et la recherche dans une collection multimédia reposent à la fois sur une étape d’indexation, c’est-à-dire sur la description du contenu de la requête et de chaque élément de la collection, et sur une étape de recherche, c’est-à-dire sur la structuration de ces descriptions afin de permettre une comparaison rapide au sein de la collection. Lorsqu’on considère plusieurs modalités dans la requête ou dans la collection interrogée, il est nécessaire d’introduire une étape de fusion de l’information, qui peut être réalisée de différentes manières : au niveau des descripteurs (dite fusion précoce, par ex. [Gadzicki et al., 2020]), au niveau de l’étape de recherche elle-même (dite fusion intermédiaire, par ex. [Valenzuela et al., 2014]), au niveau des réponses retournées (dite fusion tardive, par ex. [Neshov, 2013 ; Ye et al., 2012]), ou même de manière séquentielle lorsque les modalités sont utilisées hiérarchiquement pour filtrer et affiner les ensembles de candidats (fusion dite séquentielle, par ex. [Mai et al., 2019]). De plus, si la modalité de la requête n’est pas la même que celle des éléments de la collection, il est nécessaire d’introduire une étape d’alignement des modalités ; à noter que l’alignement peut également être utilisé pour résoudre le problème de fusion. 

La thèse se concentre sur les problèmes de fusion et d’alignement dédiés à la recherche de contenus multimédias à grande échelle. Nous nous inspirerons des avancées récentes sur les modèles multimodaux de grande taille (Multimodal Large Language Models, MLLMs [Caffagni et al., 2024 ; Zhang et al., 2024]), tels que TEAL [Yang et al., 2024], où les interactions entre toutes les modalités sont traitées comme une séquence de tokens et apprises dans un espace d’encodage commun. L’équipe encadrante a par ailleurs exploré l’indexation et la recherche dans des jeux de données LiDAR, en exploitant un modèle génératif Image-to-Text [Wang et al., 2022] afin de générer des représentations textuelles de nuages de points 3D pour la reconnaissance de lieux à grande échelle [Zede et al., 2025]. S’appuyant sur ces résultats et sur la dernière génération de MLLMs, l’objectif de ces travaux de recherche est de les généraliser à un éventail plus large et variable de modalités, incluant images, textes et/ou données 3D, à la fois dans la requête et dans la base de données interrogée, en développant une stratégie unifiée de tokenisation et des méthodes d’indexation capables de supporter la recherche à grande échelle dans des collections multimédias.

Les concepts développés seront intégrés à l’infrastructure DALEAS fondée sur Apache Spark™, et appliqués à la géolocalisation, de manière à retrouver des documents géoréférencés similaires à celui de la requête. Cette étape sera exploitée pour géolocaliser des flux de données, dans le but final de fact-checking reposant sur la vérification de la géolocalisation, en partenariat avec France Télévisions. Selon les données multimédias disponibles, il est probable que le candidat ait à étudier et à comparer différentes stratégies de fusion - fusion conjointe (c’est-à-dire précoce, intermédiaire ou tardive) ou fusion séquentielle, optimisées pour cette tâche en aval et suffisamment flexibles pour accepter diverses modalités, plutôt que de s’engager dès le départ sur une approche unique.

Jeux de données considérés

Dans le cadre du consortium DALEAS, le doctorant aura accès à une variété de jeux de données hétérogènes et à grande échelle, combinant informations multimédias et géospatiales. Cela inclut des données géospatiales ouvertes et des collections de référence fournies par les partenaires du projet, telles que le jeu de données LiDAR HD de l’IGN, issue de la campagne d’acquisition nationale de nuages de points aériens à haute densité (10 points/m²), ou des couples d’images stéréo issus du système de cartographie mobile Stereopolis de l’IGN [Paparoditis et al., 2012], ainsi que des ressources publiques définies par le cas d’usage du projet, comme les médias sociaux tels que X (anciennement Twitter).

Profil recherché

Diplôme Bac+5 en informatique, mathématiques appliquées ou géomatique (master ou école d’ingénieur). Une solide formation en apprentissage automatique est souhaitée, des connaissances ainsi qu’une expérience en recherche d’information, indexation et recherche d’images, ou vision par ordinateur seront fortement appréciées. Le candidat retenu devra posséder de bonnes compétences en
programmation (Python, C/C++). La connaissance des outils et pratiques d’ingénierie logicielle, tels que Docker, Apache Spark™, etc., sera particulièrement appréciée.

Une excellente maîtrise de l’anglais est nécessaire ; la maîtrise du français est souhaitée. La curiosité, l’ouverture d’esprit, la créativité, la persévérance et la capacité à travailler au sein d’une équipe pluridisciplinaire sont également des qualités personnelles essentielles

Conditions particulières

Déplacements ponctuels dans le cadre de séminaires, de conférences et pour l'acquisition de données terrain.

Début: flexible, idéalement au premier trimestre 2026.

Financement: entièrement financé (contrat doctoral de 3 ans avec prise en charge des missions).

Lieu: la thèse sera réalisée dans la région du Grand Paris, au laboratoire LASTIG, situé sur le campus de l’Université Gustave Eiffel à Champs-sur-Marne. Le doctorant sera rattaché à l’École Doctorale MSTIC (ED 532).

Les dossiers de candidatures doivent comporter, dans un unique fichier PDF, les documents suivants :

  • un CV détaillé ;
  • une lettre de motivation centrée sur le sujet ;
  • les notes et classements des 3 dernières années d’études ;
  • les coordonnées de 2 référents pouvant vous recommander.

Atouts de l'environnement de travail

  • Cadre académique de la recherche au sein du laboratoire LASTIG et de l'université Gustave Eiffel
  • Liens avec les services d'innovation et de production de l'IGN pour l'identification de verrous scientifiques à fort impact sociétal
  • Pratique possible du télétravail après une période de prise de poste
  • Équipements sportifs disponibles sur site
  • Restauration d’entreprise
  • Remboursement transport 75% et indemnités kilométriques vélo

Contact

  • Laurent Caraffa – Laurent.Caraffa@ign.fr, Chargé de recherche au LASTIG (encadrant de la thèse), IGN, Univ. Gustave Eiffel
  • Valérie Gouet-Brunet – Valerie.Gouet@ign.fr, Directrice de recherche au LASTIG (directrice de la thèse), IGN, Univ. Gustave Eiffel
  • Lucas Martinie - lucas.martinie@ign.fr, chargé de développement des ressources humaines
Postuler
Ce site web utilise des cookies pour la réalisation des statistiques de visites. Ils nous permettent également d'assurer un bon fonctionnement de nos services. En poursuivant votre navigation, vous acceptez l'utilisation de ces cookies.
Pour plus d'informations, Lire la politique des cookies >>.