DOCTORANT-E EN GÉODÉSIE - MODÉLISATION DE SÉRIES TEMPORELLES PAR APPRENTISSAGE AUTOMATIQUE

Réf. 20260319-1601
Ville Champs-sur-Marne
Région Ile-de-France
Type d'emploi Thèse
Modalités de recrutement Thèse
Durée du contrat 3 ans
Type de temps de travail Temps complet
Domaine Recherche et Enseignement
Sous-domaine Recherche et Enseignement
RIFSEEP A4
Etat du poste Poste vacant
Date souhaitée de prise de poste 01/09/2026
Déplacement à prévoir Déplacements occasionnels
Télétravail Télétravail partiel possible

L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution.

Grâce à son école d’ingénieurs, l'ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).

Contexte

Géodata Paris (Ecole nationale des sciences géographiques) est une grande école publique d'ingénieurs, au carrefour des sciences des sciences de la Terre, des datasciences, de l’informatique, de la géographie et de la cartographie. Elle forme des étudiants du post-bac jusqu'au doctorat sur l'ensemble du champ et des disciplines de l'information géographique et forestière, de la géolocalisation et de la donnée géolocalisée. Elle est la direction de l'enseignement supérieur et de la recherche de l'IGN. Elle est également école membre de l'Université Gustave Eiffel. Elle a pour rôle de former en formation initiale les 400 étudiants inscrits dans les différents cycles de l'école: ingénieur, licence professionnelle de géomètre-géomaticien et divers diplômes de niveau bac+5 (masters). Parmi ces élèves, certains sont élèves-fonctionnaires destinés à intégrer l'IGN et la fonction publique d'Etat au sortir de leur formation. Géodata Paris assure également des formations professionnelles, y compris à distance et pour des formations longues et diplômantes. Géodata Paris est également chargée de définir et conduire les recherches finalisées dans les domaines de compétences de l'IGN (100 chercheurs) et de contribuer, sur ces domaines, à l'animation de la recherche au niveau national et international. Géodata Paris apporte son expertise à l'IGN et plus largement aux politiques publiques de son ministère de tutelle (écologie). Elle soutient l'organisation d'événements scientifiques et techniques dans le domaine de compétences de l'IGN. 

 Le centre de compétences géodésie et métrologie dimensionnelle (CC GMD) est chargé du pilotage des activité de géodésie et topométrie de Géodata Paris. Les agents du CC GMD réalisent leurs activités d'enseignement à Géodata Paris située à Champs Sur Marne et effectuent leurs activités de recherche au sein de l’Unité Mixte de Recherche (UMR) IPGP sur le campus des Grand Moulins de l’Université Paris Cité à Paris. L’équipe de recherche « géodésie » mène des recherches sur l’amélioration des référentiels géodésiques (géométrique et gravimétrique), sur la modélisation des déformations du sol et l’interprétation géophysique et climatique des produits de la géodésie. 

Contexte scientifique de la thèse :

La géodésie spatiale exploite des données satellitaires pour décrire la surface terrestre, le champ de pesanteur et l’orientation de la Terre. Cette discipline est essentielle tant pour les géosciences que pour de nombreuses applications civiles. En effet, elle permet la mesure de déformations d’origines variées, allant des déformations aux frontières et à l’intérieur des plaques tectoniques (Kreemer et al., 2014) aux déformations élastiques induites par la redistribution des enveloppes fluides (White et al., 2010) en passant par le rebond post-glaciaire. La géodésie spatiale joue aussi un rôle essentiel dans la réalisation des références (inter-)nationales pour le positionnement précis, dont le repère international de référence terrestre (ITRF) (Altamimi et al., 2023) qui constitue une référence mondiale stable et précise dans laquelle exprimer les coordonnées d’objets à la surface et autour de la Terre.

En pratique, la plupart des produits de géodésie spatiale sont diffusés sous forme de séries temporelles géolocalisées. Or, pour être exploitées dans des applications scientifiques, de telles séries temporelles doivent souvent être modélisées à l'aide de modèles de trajectoire (Bevis and Brown, 2014). Ces modèles de trajectoire sont formés d’une base de fonctions mathématiques paramétriques dont, typiquement, une tendance à long terme, des signaux périodiques, des signaux transitoires et des discontinuités pouvant être dues à des tremblements de terre, des changements instrumentaux ou des problèmes dans les données. Les paramètres de ces fonctions, qui représentent, par exemple, les vitesses tectoniques des stations ou des déplacements cosismiques, sont les quantités d’intérêt pour diverses applications géophysiques.

Depuis plusieurs décennies, nous faisons face à une augmentation importante du nombre de séries temporelles à analyser, et plusieurs services mettent à disposition des bases de données contenant des milliers, voire des millions, de séries à étudier. Le nombre croissant de séries disponibles rend caduque l’approche “manuelle” classique, qui consiste à analyser visuellement chaque série géodésique afin d’en définir un modèle de trajectoire approprié. Pour exploiter pleinement ces données massives, il devient indispensable de développer des méthodes de modélisation automatiques.

Or, malgré plusieurs décennies d’efforts, aucune approche automatique n’a su atteindre un consensus au point d’être largement employée pour la modélisation de séries temporelles géodésiques. Au contraire, les approches automatiques existantes semblent toujours moins performantes qu’un opérateur expérimenté (Gazeaux et al., 2013). En particulier, une difficulté centrale de ces approches réside dans la détection automatique de discontinuités dans les séries temporelles. Cependant, des développements récents en matière d’intelligence artificielle ouvrent de nouvelles voies vers des approches automatiques plus performantes. 

Missions

L’objectif principal de cette thèse est de développer une approche automatique innovante pour la modélisation  de séries temporelles géodésiques, avec l’ambition d’approcher, voire de dépasser, les performances d’un opérateur humain. Les séries géodésiques ciblées dans cette thèse seront les séries de positions de stations GNSS. Cependant, l’objectif à plus long terme est de disposer d’une méthodologie adaptable à d’autres types de séries temporelles (séries de déplacements InSAR, de variations de gravité GRACE(-FO), ou de variables climatiques).

Les modèles basés sur l’apprentissage automatique reposent fortement sur les données d’entraînement et d’évaluation. Or, en matière de séries GNSS, les jeux de données labelisés existants sont limités en taille (à quelques milliers de stations) et par la précision humaine (les discontinuités les plus petites ne sont pas forcément détectées). Pour surmonter ces problèmes, nous développons actuellement un simulateur de séries de positions de stations GNSS synthétiques réalistes. Ce générateur bénéficie de progrès récents en matière de modélisation de séries GNSS par l’équipe de géodésie de l’IGN et de l’IPGP. Sur la base de ce générateur de séries synthétiques réalistes, nous proposons un déroulement de thèse en trois étapes :

1. Evaluation d’approches de modélisation automatique existantes

Cette étape vise à évaluer et comparer les approches existantes de manière objective, ce qui n’est actuellement pas possible faute de banc de comparaison standardisé. Ce premier travail est d’autant plus essentiel que la seule campagne d’intercomparaison standardisée de méthodes de détection de discontinuités dans les séries de positions de stations GNSS a eu lieu il y a près de 13 ans (Gazeaux et al., 2013). De plus, cette évaluation définira un objectif de performance à dépasser avec des approches alternatives développées lors de la thèse (partie 2). Ce travail pourra également mettre en évidence des faiblesses spécifiques aux approches existantes et orienter l’entraînement du modèle développé dans la thèse afin de les pallier.

2. Développement d’une nouvelle approche basée sur l’apprentissage automatique

La seconde étape de cette thèse consistera à développer une approche alternative, basée sur l’apprentissage automatique, pour la modélisation de séries temporelles géodésiques.  Le/La doctorant.e explorera différents paradigmes d’apprentissage automatique afin de produire un modèle idéalement capable d’analyser simultanément plusieurs séries temporelles présentant des variations aléatoires possiblement corrélées entre elles. Ce travail additionnel permettra d’exploiter les dépendances spatiales des séries géodésiques pour améliorer la détection de discontinuités, et peut-être dépasser les performances humaines. Enfin,  le/la doctorant.e validera l’algorithme développé à l’aide de jeux de données réelles labelisées. Si l'algorithme est jugé efficace, il sera utilisé pour la valorisation de séries temporelles de positions de stations diffusées en ligne.

3. Application de l’approche à des données réelles

L’objectif de ce dernier axe de travail sera de démontrer l’intérêt de l’algorithme développé en modélisant des séries GNSS (non étiquetées) telles que celles issues du projet SPOTGINS (Santamaría-Gómez et al., 2025) ou produites par le laboratoire de géodésie du Nevada (NGL).  Les modèles de trajectoires ainsi obtenus pourront être mis à disposition de la communauté, mais aussi être utilisés pour la production de produits dérivés facilement exploitables par les chercheurs non-spécialistes, tels que des séries corrigées d’effets indésirables (discontinuités, signaux périodiques parasites, etc.), ou des cartes de paramètres d’intérêt (vitesses, déplacements saisonniers, déplacements co- et post-sismiques, etc.).

Profil recherché

Le candidat doit être titulaire d’un diplôme de master (ou équivalent) avec une formation en analyse de données, en statistiques et en programmation. Le candidat doit maîtriser le langage Python (ou langage proche) et le calcul scientifique. Une familiarité avec les géosciences, la géodésie et/ou l’intelligence artificielle constitue un atout. Le candidat doit également avoir un bon niveau d’anglais.

Conditions particulières

Déplacements occasionnels à prévoir en France (Géodata Paris, Saint-Mandé, Forcalquier) ou à l’étranger (congrès, atelier, réunions scientifiques).
Bureau dans les locaux de l'Université Paris Cité.
Profil horaire: forfait.
A de rares occasions, travail un jour férié (congrès, éventuelle participation au groupe d'instruction Géodata Paris).

Atouts de l'environnement de travail

Geodata-paris.fr se situe au cœur d'un campus universitaire verdoyant à 20 minutes de Paris, la Cité Descartes. L'école est localisée au sein d'un bâtiment monumental imaginé par les architectes Chaix et Morel prenant le parti pris d'un système unique de barres reliées par un atrium central.  

Composé d'écoles et d'une université reconnue internationalement, le campus oriente ses formations et sa recherche autour de la ville durable. Disposant d'équipements de pointe en terme d'enseignements et de recherche, le campus propose plusieurs avantages aux personnels de l'école grâce à sa proximité et à son partenariat avec l'Université Gustave Eiffel ainsi que l'Ecole des Ponts ParisTech.      

  • Un espace d'innovation pédagogique La Centrif'    
  • De nombreux laboratoires de recherche    
  • Un accès au restaurant d'entreprise et à la cafétéria    
  • Une mise à disposition de l'ensemble des équipements sportifs du campus (salle de sport et de musculation, cours collectifs, piscine...)    
  • Une possibilité d'adhérer aux associations des personnels proposant des activités créatives et billetterie    
  • Un accès au centre de documentation de l'IGN    
  • La prise en charge dès votre arrivée d'une formation autour de la Fresque du Climat 

Contact

GOBRON Kévin, directeur de recherche junior, 01 57 27 53 21, kevin.gobron@ign.fr

MARTINIE Lucas, chargé de développement des ressources humaines, lucas.martinie@ign.fr

Aucune candidature transmise par mail ne sera traitée

Postuler
Ce site web utilise des cookies pour la réalisation des statistiques de visites. Ils nous permettent également d'assurer un bon fonctionnement de nos services. En poursuivant votre navigation, vous acceptez l'utilisation de ces cookies.
Pour plus d'informations, Lire la politique des cookies >>.