Stage - Ingénieur(e) Data Scientist / IA Gen - Industrie - Toulouse
Toulouse, France
Sopra Steria
Sopra Steria, a European Tech leader recognised for its consulting, digital services and software development, helps its clients drive their digital transformation to obtain tangible and sustainable benefits.Description de l'entreprise
Référencé par le Capital Magazine figurant parmi les « Meilleurs employeurs 2023 », CS est une société filiale indépendante de Sopra Steria GROUP avec un rayonnement en France et à l’international (plus de 2500 collaborateurs). Experts des systèmes critiques pour les secteurs de la Défense, l'Industrie, le Spatial, la Cybersécurité et l'IA.
La Business Unit INDUSTRIE contribue aux développements de programmes dans les domaines de la simulation, la transformation digitale et le développement de systèmes critiques. Elle est un acteur référent sur l’Intelligence de la donnée (Data Engineering & Data Science), la digitalisation des processus (PLM), la simulation numérique, le développement de logiciels embarqués & certifiés ainsi que la sécurisation des systèmes (cybersécurité).
Description du poste
Nous recrutons un.e stagiaire Ingénieur.e Data Scientist / IA Gen pour rejoindre notre Business Unit INDUSTRIE au sein de la Business Line Data & Process Intelligence, spécialisée dans l'accompagnement de nos clients dans leurs problématiques associées à la transformation digitale. Nos offres se déclinent autour de la data intelligence & de la maintenance prédictive, de la digitalisation des processus industriels et du SI Métiers.
Votre mission :
Vous rejoignez notre équipe du pôle Data Analytics et participez à la création d'un outil innovant, destiné à transformer la manière dont nous exploitons les données issues des salons professionnels.
Vous serez donc en charge du développement d'un outil d'analyse sémantique pour l'industrie de pointe, et donc des missions suivantes :
- Collecte et préparation des données : Concevoir un pipeline d'ingestion de données audio et vidéo hétérogènes afin de constituer une base de données textuelles riche et structurée.
- État de l'art et choix technologiques : Effectuer une veille technologique approfondie sur les dernières avancées en matière de traitement automatique du langage naturel (TALN), notamment sur les techniques de transcription automatique (Speech-to-Text), d'embedding de texte et de modèles de langage de grande taille (LLM).
- Développement d'un moteur de recherche sémantique : Implémenter une architecture de recherche augmentée par récupération (RAG) afin de permettre aux utilisateurs de poser des questions naturelles sur le contenu des transcriptions et d'obtenir des réponses pertinentes et précises.
- Création d'une interface utilisateur intuitive : Développer une interface web permettant aux utilisateurs non-techniques d'interagir facilement avec l'outil et de visualiser les résultats de manière claire et concise.
Qualifications
Etudiant(e) en Bac+5, en data science, informatique ou mathématiques, à la recherche d’un stage d’une durée de 6 mois, vous avez le souhait de vous spécialiser en Machine Learning appliqué au traitement du langage.
Vous avez une maîtrise des langages de programmation Python et des outils de traitement de données (Pandas, Numpy, etc.), ainsi que des connaissances solides en TALN et en apprentissage automatique.
Vous avez également un intérêt certain pour les technologies émergentes telles que les LLM et les modèles de représentation sémantique.
Ce que nous vous offrons :
- L'opportunité de travailler sur un projet innovant à fort impact.
- Un environnement de travail stimulant et collaboratif.
- L'accompagnement de spécialistes du domaine aéronautique.
- La possibilité d'acquérir une expérience significative dans le domaine de la data science appliquée à l'industrie.
Vous êtes curieux.se ? Vous avez l'esprit d'équipe et êtes rigoureux.se ? Vous souhaitez façonner l'avenir de l'analyse des données dans l'industrie de pointe ? Alors, vous êtes la pépite que nous recherchons !
Informations supplémentaires
Intégrer CS GROUP, c’est aussi :
- Des formations dès votre arrivée et tout au long de votre carrière : la CS Academy et la Sopra Steria Academy vous proposent des parcours de formations spécifiques aux métiers et à votre environnement (4400 jours de formation en 2023, 5700 jours de formation prévus sur 2024)
- Des espaces de travail collaboratifs modernes, lumineux, flexibles
- Des facilités d’accès : ligne de bus et TER depuis le centre-ville (transports en commun avec prise en charge à 50%), parking privé pour les automobilistes, les cyclistes et les motocyclistes
- Une mutuelle prenant en charge votre famille
- Un restaurant d'entreprise
- Un comité d’entreprise offrant des avantages culturels, sportifs et des remboursements sur vos hébergements et transports lors de vos vacances
- Une prime vacances et de cooptation
LA SUITE DES EVENEMENTS
Si votre profil correspond, vous aurez un entretien technique avec avec un de nos Responsables opérationnels.
#CSGROUP #hiring #LI-EQ1 #Stage #DataScience #IAGen
Employeur inclusif et engagé, notre société œuvre chaque jour pour lutter contre toute forme de discrimination et favoriser un environnement de travail respectueux. C’est pourquoi, attachés à la mixité et à la diversité, nous encourageons toutes les candidatures et tous les profils.
https://www.soprasteria.fr/nous-connaitre/nos-engagements
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: Architecture Data Analytics Engineering LLMs Machine Learning NumPy Pandas Python RAG
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.