Alternant
Marcoule
CEA
Le CEA est un acteur majeur de la recherche, au service de l'État, de l'économie et des citoyens. Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies...Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
2025-36213Description du poste
Domaine
Valorisation promotion gestion information
Contrat
Alternance
Durée du contrat (en mois)
24
Description de l'offre
Vous souhaitez enrichir vos compétences dans le domaine du nucléaire et acquérir de l'expérience professionnelle grâce à un expert dans votre domaine ?
N'hésitez plus, et rejoignez le CEA !
Au sein de la Direction des Energies (DES) du CEA, l'Institut des sciences et technologies pour une économie circulaire des énergies bas-carbone (ISEC) apporte des réponses aux challenges de la transition énergétique associant nucléaire et nouvelles technologies pour l'énergie. Il met en avant une utilisation durable des ressources primaires et secondaires en développant des procédés de traitement/recyclage, fabrication de matériaux avancés à propriétés contrôlées, dépollution et conditionnement des déchets industriels dans une démarche d'écoconception. Rattachée à l'ISEC/DIR, la CVI a notamment en charge de piloter la promotion et la valorisation des activités de R&D effectuées dans les laboratoires de l’ISEC auprès de partenaires extérieurs ainsi qu’auprès des autres Directions et Centres du CEA, de coordonner la mise en place des partenariats industriels et veiller à leur pertinence en lien avec les stratégies scientifiques et techniques portées par l’ISEC, de participer à la construction et au développement d’une démarche d’innovation au sein de l’ISEC, de coordonner les projets collaboratifs pertinents dans le cadre de la stratégie régionale, nationale et internationale via les appels à projets en contribuant à l’identification et au développement d’actions croisées avec les partenaires académiques, institutionnels et industriels en lien avec les assistants scientifiques de l’ISEC.
L’ISEC mène au CEA de Marcoule un projet exploratoire visant à développer une solution d’assistance intelligente capable de traiter de larges volumes de documents hétérogènes (PDF, images, tableaux, vidéos…) dans le but de générer des livrables opérationnels sur des thématiques industrielles stratégiques (ex. : étude sur les flux de cuivre pour l’industrie française).
Ce projet exclut volontairement les approches classiques de fine-tuning ou d’entraînement de modèles, ainsi que la RAG (Retrieval Augmented Generation), pour se concentrer sur une architecture hybride innovante , combinant base de données SQL structurée et modèles de langage (LLM)
L’alternant(e) interviendra au sein de cette démarche en forte collaboration avec l’équipe projet pour concevoir, tester et améliorer le fonctionnement du démonstrateur technique, tant sur les aspects data engineering que sur l’interfaçage avec les modèles LLM. Les missions confiées incluent :
• Contribution à la conception d’un démonstrateur d’assistant IA localisé (pas d’usage cloud)
• Analyse des flux documentaires et uniformisation des formats (text mining, extraction d’entités)
• Définition du schéma de base SQL permettant une interrogation optimisée des données extraites
• Mise en œuvre de modèles LLM open-source spécialisés dans la conversion du langage naturel en requêtes SQL
• Développement de scripts
Profil du candidat
De notre côté, nous cherchons un(e) candidat(e) :
- Diplôme préparé : Bac+4 en Economie Circulaire, Développement Durable, Transition
- Compétences techniques et/ou spécifiques : Bonne connaissance de l'IA
- Outils et logiciels utilisés :
• PostgreSQL ou équivalent
• Python (pandas, spaCy, transformers, etc.)
• Outils d’extraction documentaire (ex. : PDFMiner, Tesseract, OCR)
• Modèles LLM open-source (ex. : LLaMA, Mistral, TinyLlama, etc.)
Qualités : Autonomie, Sens de l'organisation, Intégrité...
De votre côté,vous cherchez une entreprise :
- Qui développe vos compétences et construit votre parcours professionnel
- Qui donne une possibilité d'être en télétravail
- Qui prône la mixité et la diversité
- Qui est acteur majeur de la recherche dans le nucléaire
Le CEA est un acteur engagé dans l’accueil, l’insertion et le maintien dans l’emploi des salariés en situation de handicap. Ainsi, si vous le souhaitez, vous pouvez également joindre tous documents justifiants de votre situation de handicap (RQTH, carte mobilité inclusion, pension d’invalidité, etc).
Localisation du poste
Site
Marcoule
Localisation du poste
France, Occitanie, Gard (30)
Ville
30200 - Chusclan
Critères candidat
Langues
- Français (Courant)
- Anglais (Courant)
Diplôme préparé
Bac+5 - Master 2
Demandeur
Disponibilité du poste
01/09/2025
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: Architecture Engineering LLaMA LLMs OCR Open Source Pandas PostgreSQL Python R RAG R&D spaCy SQL Transformers
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.