Domaine / Métier : Numérique/Data engineer
Nature de l’emploi : Emploi ouvert aux titulaires et aux contractuels
Description du poste :
La personne recrutée sera chargée des missions suivantes, sous la responsabilité du responsable du Lab et dans le cadre de la mise en œuvre de la stratégie R&D de l’institution :
procéder à la mise en qualité (réconciliation y compris en utilisant des référentiels externes ; normalisation ; restructuration en conformité avec les modèles métier ; sémantisation) de données des Archives nationales, en développant et documentant les scripts nécessaires, et le cas échéant les workflows permettant de mettre à jour les données ainsi produites. Ces données incluent notamment des métadonnées décrivant les archives conservées par l’institution et produites par le Lab dans le cadre de divers projets.
participer aux travaux de conception et de réalisation d’applications ou logiciels menés par le Lab avec un ou plusieurs partenaires extérieurs. En 2025 il pourra notamment s’agir de contribuer aux spécifications, aux tests et à la documentation d’évolutions de l’éditeur de requêtes SPARQL Sparnatural (https://sparnatural.eu/) et à la maîtrise d’ouvrage d’une application web de recherche et de consultation des référentiels sémantisés des Archives nationales ;
participer aux projets de recherche dans lesquels les Archives nationales sont partenaires (tels que projets ANR) et dans lesquels le Lab est impliqué au titre de son expertise en ingénierie des documents, des données et des connaissances dans le domaine métier des archives ;
piloter un ou plusieurs projets de mise en œuvre de l’intelligence artificielle sur des jeux de données des Archives nationales, depuis la réflexion préalable et l’état de l’art jusqu’à la réalisation de prototype, à son évaluation et à la rédaction de bilan prospectif, et à la valorisation des résultats. Ces projets pourront en particulier explorer des solutions de type RAG visant à permettre aux usagers d’effectuer des recherches en langage naturel. Ils impliqueront le plus souvent de travailler avec des partenaires hors de l’institution (notamment équipes de recherche en informatique ou SSII) ;
contribuer activement à la veille technologique assurée par le Lab dans ses domaines d’expertise ;
contribuer aux actions de communication interne et externe du Lab et à la valorisation scientifique des travaux réalisés (rédaction d’articles, participation à des conférences, organisation d’événements divers sur place, en mode hybride ou en ligne) ;
contribuer à l’élaboration de la stratégie R&D des Archives nationales.
Liaisons hiérarchiques : La personne recrutée sera placée sous la responsabilité directe de la responsable du Lab (issue du corps des conservateurs généraux du patrimoine), et travaillera étroitement avec cette personne.
Liaisons fonctionnelles : La personne recrutée travaillera en collaboration avec les agents des autres départements de la DINUC et de la direction des fonds (DIRF). Elle sera conduite à travailler avec certains services du ministère de la Culture et avec des entités extérie
Ce poste pourra s’avérer très intéressant pour un(e) spécialiste en ingénierie des données, des documents et des connaissances ayant déjà une expérience concrète solide dans ce domaine. La personne recrutée travaillera en effet dans une équipe s’occupant de R&D numérique et menant des projets innovants, au sein d’une institution prestigieuse dont l’activité scientifique est importante et multiforme et les données massives, hétérogènes et riches en contenu. Les missions qui seront confiées à la personne recrutée se situent au carrefour de l’ingénierie et de la science des données ; elles conduiront cette personne à travailler avec de nombreux partenaires et à participer à plusieurs projets de nature variée. Elle doit avoir au minimum un intérêt pour le patrimoine et les données culturelles, en particulier pour le patrimoine écrit et ses utilisations en histoire, en sciences humaines et sociales ou par la société civile ; des connaissances de base en archivistique lui seront utiles. La pratique des technologies XML (XML étant le principal format de stockage des données des AnF) et sémantiques (certains projets à mener à bien étant fondés sur ces technologies) est requise. Une bonne maîtrise d’un langage de programmation comme Python est également hautement souhaitable, ainsi que celle des techniques de développement web. La personne recrutée devra faire preuve de capacités d’adaptation, de créativité, de rigueur, d’autonomie, d’agilité technique et de bonnes capacités relationnelles et pédagogiques – tous les projets menés à bien le sont pour et avec les agents et usagers de l’institution, et le plus souvent avec des partenaires extérieurs.
Niveau d’études / Diplôme : Niveau 7 Master/diplômes équivalents
Langue / Niveau :
Anglais : Autonome
Langue / Niveau :
Français : Maîtrise