Alternance
France, Ile-de-France, Hauts-de-Seine (92)
Framatome
Framatome’s teams design and build nuclear power plants, present at every stage of the process on all types of reactor technologies.Informations générales
Entité légale
Chez Framatome, filiale d'EDF, nous concevons et fournissons des équipements, des services, du combustible, et des systèmes de contrôle-commande pour les centrales nucléaires du monde entier.Nos 20 000 collaborateurs permettent chaque jour à nos clients de produire un mix énergétique bas-carbone toujours plus propre, plus sûr et plus économique.
Nos équipes développent également des solutions pour les secteurs de la défense, de la médecine nucléaire et du spatial.
Implantée dans une vingtaine de pays, Framatome rassemble les expertises d'hommes et de femmes passionnés et convaincus que le nucléaire est une énergie d'avenir.
Entreprise responsable, nous développons des actions pour former et accompagner les premières expériences professionnelles (label Happy Trainees), intégrer tous les talents, dont les personnes en situation de handicap, œuvrer pour l'égalité professionnelle et la mixité de nos métiers (94/100 à l'index de l'égalité hommes-femmes) et concilier les temps de vie.
Pour suivre notre actualité, retrouvez-nous sur www.framatome.com, LinkedIn, Instagram et X.
Référence
2025-21893Date de parution
07/04/2025Description du poste
Métier
IS - SYSTEMES D'INFORMATION - IS5 - Digital
Intitulé du poste
Alternance - Ingénieur en Science des Données et IA : OCR et VLM F/H
Contrat
Stage
Fourchette de rémunération
salaryrange">Barème Alternance, Stage et VIE
Description de la BU
Au sein de FRAMATOME, la Direction Technique et Ingénierie assure le développement, la conception et le licensing des chaudières nucléaires et des équipements associés. Elle propose également aux exploitants des études d'ingénierie de conception, de réalisation et de services. Elle intervient, à ce titre, comme autorité technique en apportant toute son expertise afin d'offrir un haut niveau de sûreté et de performance.
Description de la mission
Contexte
L'équipe DSAM a développé une pipeline d’OCR avancée permettant l'extraction automatique et l’exploitation de données structurées à partir d'une grande base documentaire. Basée sur des architectures CNN pour la détection [1] et Transformers pour la reconnaissance [2] de texte, cette pipeline nécessite désormais une consolidation : amélioration des performances, validation approfondie, tests de robustesse et intégration d'une interface utilisateur, avant son déploiement industriel.
Les missions
Votre travail s'articulera autour de trois axes :
1- Amélioration des méthodes OCR
• Revue détaillée de la littérature, avec une attention particulière sur les architectures à l’état de l’art Transformers tels que TrOCR [3] ou GOT [4] et les Vision Language Models (VLM) tel que olmOCR [5].
• Expérimentation de ces nouveaux modèles et comparaison avec la solution actuelle.
2- Exploitation des données extraites
Développement d'algorithmes avancés issus de l’Information Retrieval [6] (Semantic Search, Word embedding, BERT, etc.) permettant un requêtage performant des données extraites.
3- Validation des performances
• Annotation d'un échantillon représentatif de documents Framatome pour une validation approfondie des méthodes.
• Analyse fine des performances, de la robustesse et diagnostic des cas d’échecs (compromis faux positifs / faux négatifs) en tenant compte des spécificités métiers.
Rejoignez notre équipe de R&D en IA et Data Science
Vous intégrerez le Centre de compétences en Data Science et Mathématiques Avancées (DSAM) de Framatome. L'équipe, composée d'experts en IA, apprentissage machine et ingénierie nucléaire, développe des solutions innovantes appliquées à des domaines tels que les systèmes critiques embarqués, les méthodes statistiques pour la démonstration de sûreté nucléaire, l’analyse de données multiphysiques expérimentales, la robotique ou l’IA générative.
Profil
Etudiant(e) en Master 2 ou équivalent, spécialisé(e) en science des données et intelligence artificielle, vous possédez :
• De solides compétences en apprentissage statistique et apprentissage profond.
• Une grande maîtrise de python, ses librairies usuelles et d’un framework Deep Learning (PyTorch, TensorFlow).
• Une maîtrise théorique des architectures Transformers et LLM, idéalement appuyée par une expérience sur un projet réel.
• Très bon niveau d'anglais technique.
Vous aimez évoluer en équipe, êtes dynamique, curieux(se), créatif(ve), impliqué(e), et souhaitez rapidement monter en compétences dans un environnement stimulant de recherche appliquée industrielle.
Localisation du poste
Localisation du poste
France, Ile-de-France, Hauts-de-Seine (92)
Site
La Défense
Déplacements
Non
BU
DTI - DTIP
Critères candidat
Niveau d'études min. requis
Bac+5
Niveau d'expérience min. requis
Etudiant
Niveau d'emploi
Etudiant
Langues
Anglais (Opérationnel)
Informations additionnelles
Poste soumis à enquête administrative
Oui
Poste soumis à autorisation au titre du contrôle des exportations
Non
Tags: Architecture BERT Deep Learning LLMs OCR Python PyTorch R R&D TensorFlow Transformers
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.