Description : LE CRID Le CRID est une structure de soutien à la recherche de la Délégation à la Recherche Clinique et à l’Innovation (DRCI) du Département Recherche et Innovation. Il est constitué de deux Unités Fonctionnelles : le Centre Données de Santé (CDS) et l’Unité de Méthodologie Data-Management et Statistiques (UMDS), qui regroupe des compétences en méthodologie de la recherche clinique et épidémiologique, en biostatistique, en data‐management et data-sciences, et en chefferie de projets de recherche sur données existantes. L’activité principale du CDS est d’accompagner les chercheurs à la conception, la mise en œuvre et l’exploitation de projets de recherche à partir de données hospitalières existantes, regroupées dans un entrepôt de données de santé (EDS). Cet entrepôt contient les données (démographiques, cliniques, biologiques et thérapeutiques) de tous les patients passés par le CHRU de Nancy depuis 2014. LE POSTE SERVICE : Centre de recherche interventionnelle et sur données (CRID) HORAIRES : 39h minimum par semaine FONCTIONS ET ACTIVITÉS Dans ce cadre, l’ingénieur de données contribuera à l’amélioration de l’exploitation des données textuelles du dossier patient, en s’appuyant notamment sur OpenSearch comme moteur d’indexation et de recherche. Il aura pour mission de valoriser ces données en développant des méthodes d’extraction et de structuration de l’information issue des comptes rendus médicaux, en tenant compte du contexte clinique (négation, niveau de certitude, antécédents, traitements, etc.). Il participera au développement et à l’intégration de méthodes de traitement automatique du langage naturel (NLP) et d’intelligence artificielle, notamment des approches récentes d’IA générative (LLM). ACTIVITÉS PRINCIPALES : * Mise en œuvre de méthodes d’analyse de texte médical (normalisation, synonymie, extraction de concepts) * Intégration de modèles NLP dans les pipelines d’indexation (embeddings, recherche sémantique, vector se