Stage -Développement d'une solution IA de conformité (H/F)

Date: 17 Nov 2025

Location: Lyon, FR

Company: newcleo

A propos de newcleo 

Depuis sa fondation en 2021, newcleo s'est rapidement imposé comme un acteur innovant dans le domaine de l'énergie nucléaire. newcleo ambitionne de concevoir, construire et exploiter des réacteurs modulaires avancés de génération IV (AMR) refroidis par du plomb liquide et alimentés par des matières nucléaires valorisables. 

Grâce à une combinaison innovante de technologies reconnues et éprouvées, et en capitalisant sur un modèle industriel nucléaire basé sur la fabrication et le multi-recyclage du combustible MOX, newcleo vise à fermer le cycle du combustible nucléaire tout en produisant de manière sûre une énergie plus propre, accessible et pratiquement inépuisable, indispensable aux économies bas-carbone. 

Avec un chiffre d'affaires de 70 millions d'euros en 2024, plus de 570 millions d'euros de financements privés et plus de 100 partenariats et collaborations stratégiques, la croissance du groupe newcleo est soutenue par l'acquisition ciblée d'entreprises clés dotées d’une solide expertise dans les domaines de l’ingénierie, de la fabrication d’équipements ou encore de la gestion des déchets nucléaires.  

Avec plus de 900 collaborateurs hautement qualifiés répartis en France, au Royaume-Uni, en Italie, en Suisse et en Slovaquie, newcleo dispose des compétences et services nécessaires à la réalisation de son ambitieux programme de déploiement. Le groupe contribue également à l’essor d’une filière industrielle nucléaire dédiée aux petits réacteurs modulaires, en Europe et au-delà. 

 

CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE :

newcleo, société implanté principalement en France et en Italie, développe en parallèle un réacteur nucléaire innovant de 4e génération refroidi au plomb, et une usine de fabrication de combustible MOX.

Tout développement d’installation nucléaire requière l’application d’un grand nombre de normes, qui nécessitent des analyses de conformité rigoureuses. Il est pressenti qu’une IA pourrait être d’une grande aide et faire gagner en efficacité et en qualité.

Ainsi, l’objectif du stage est de développer un prototype d’outil basé sur une IA hébergé sur les serveurs Newcleo, pour réaliser la tâche d’analyse de conformité.

 

Le candidat sera intégré dans une équipe d’ingénierie du réacteur nucléaire, encadré par un responsable d’unité, et accompagné par des personnes expérimentées en développement d’outils IA.

 

Objectif de l’outil

 

L’outil « Analyse de Conformité basé sur l’IA » doit pouvoir prendre

 

En donnée d’entrée :

  • quelques centaines de normes ou autres documents contenant des exigences,
  • quelques dizaines de documents d’ingénierie ayant pour but de répondre à ces exigences

 

En donnée de sorite :

  • une matrice de traçabilité liant les exigences sources et les exigences ou réponses à exigences filles,
  • une justification de la couverture pour les exigences sources (justifiant de la couverture totale ou partielle)

 

 

Phases de développement du Prototype V1

 

Toutes ces phases se font en 100% local, les exécutions doivent se faire sans accès internet.

Les technos proposés sont pressenties et non imposées étant donné le changement rapide des technos liées aux LLM

 

Phase 1 : Parsing et Extraction

 

  1. Utiliser 3-4 documents Word/PDF représentatifs (type AIEA, document public…).
  2. Découper → extraction texte (pressenti unstructured).
  3. Identifier exigences par regex (shall/must/should et équivalent FR).
  4. Stocker dans un fichier «.json » les exigences trouvées ou autre bdd.
  5. Export basique depuis json (ou autre bdd) vers Excel.

 

Validation : Vérifier manuellement qu’environ 95%+ des exigences sont capturées (Valeur à redéfinir)

 

Phase 2 : Détection Doublons

 

  1. Générer embeddings pour chaque exigence (pressenti FastEmbed).
  2. Stocker le vecteur dans une base de données vectorielle (pressenti Qdrant).
  3. Afficher top 10 doublons potentiels avec scores (pressenti Qdrant).
  4. Validation manuelle en vérifiant que les doublons le sont bien.

 

Validation : Taux de vrais positifs > 90%

 

Phase 3 : Analyse LLM de la réponse à l’exigence

 

  1. Implémenter détection de conflits via Ollama et un LLM type Mistral, Qwen ou Llama. (Ollama permet de faire tourner le modèle sur le PC)
  2. Tester sur 5-10 paires connues
  3. Mesurer temps de réponse
  4. Ajuster prompts en fonction

 

Validation : Temps < 10s par analyse, pertinence > 60%

 

Phase 4 : Matrice Conformité

 

  1. Générer matrice vide
  2. Export des exigences vers Excel
  3. Interface basique pour remplissage manuel éventuel

 

Validation : Vérification de la matrice de conformité

 

 

NOUS IMAGINONS QUE VOUS AVEZ DEJA :

 

  • Formation en école d’ingénieur dans le domaine du développement logiciel, avec une spécialisation en intelligence artificielle,
  • Autodidacte et force de proposition dans les technologies de l’IA.
  • Maîtrise de l'anglais.
  • Vous êtes une personne sérieuse et attachée à produire des résultats concrets,

 

CONTEXTE DE TRAVAIL

Poste basé à Lyon