Data scientist : génération et évaluation de données synthétiques en dermo-cosmétique - Alternance - H/F
France - Toulouse - Hotel-Dieu Saint-Jacques
Pierre Fabre Group
"We are developing the drugs and care of tomorrow with the inexhaustible resources of our imaginations" Mr. Pierre FabrePierre Fabre is the 2nd largest dermo-cosmetics laboratory in the world, the 2nd largest private French pharmaceutical group and the market leader in France for products sold over the counter in pharmacies.
Its portfolio includes several medical franchises and international brands including Pierre Fabre Oncologie, Pierre Fabre Dermatologie, Eau Thermale Avène, Klorane, Ducray, René Furterer, A-Derma, Naturactive, Pierre Fabre Oral Care.
Established in the Occitanie region since its creation, and manufacturing over 95% of its products in France, the Group employs some 10,000 people worldwide. Its products are distributed in about 130 countries. 86% of the Pierre Fabre Group is held by the Pierre Fabre Foundation, a government-recognized public-interest foundation, while a smaller share is owned by its employees via an employee stock ownership plan.
In 2019, Ecocert Environment assessed the Group’s corporate social and environmental responsibility approach in accordance with the ISO 26000 sustainable development standard and awarded it the “Excellence” level.
Pierre Fabre is recognized as one of the "World's Best Employers 2021" by Forbes. Our group is ranked in the Top 3 in the cosmetics industry and in the Top 10 in the pharmaceutical industry worldwide.
Au sein du service Data Science et Intelligence Artificielle du pôle de Recherche Appliquée de la R&D et rattaché à un data scientist, vous travaillerez sur la génération de données synthétiques dans le domaine de la dermo-cosmétique.
Les données synthétiques sont des données générées artificiellement par des algorithmes d’intelligence artificielle à partir de données « réelles » collectées sur des patients. La génération de telles données permet d’accroître la taille des jeux de données sans collecte supplémentaire de données « réelles ». Ces données sont de plus en plus utilisées dans différents secteurs, en particulier celui de la santé, pour des applications telles que l’entrainement d’algorithmes d’intelligence artificielle.
Dans notre contexte, les données « réelles » sont des données issues d’études cliniques. Ces études évaluent l'efficacité et la tolérance des produits Dermo-Cosmétique ou permettent de mieux comprendre les altérations de la peau et du cheveu. Différents types de données sont collectés, en particulier des données cliniques et des données biologiques à partir desquelles seront générées des données synthétiques.
Dans le cadre de la génération de données synthétiques en dermo-cosmétique, vous serez amené à :
- Réaliser un travail de recherche bibliographique sur les méthodes de génération de données synthétiques existantes
- Comprendre et appliquer ces méthodes sur des jeux de données issues d’études cliniques Pierre Fabre dermo-cosmétique
- Evaluer la qualité des données synthétiques générées
- Comparer ces méthodes entre elles en terme d’impact sur les résultats d’études cliniques et les performances de modèle d’Intelligence artificielle
- …etc
Les analyses seront menées sous les logiciels R et/ou Python.
Who you are ?Etudiant souhaitant intégrer une formation en alternance de niveau Bac+5 type Master II ou dernière année d'école d’ingénieur spécialité statistiques/mathématiques appliquées/Intelligence artificielle
Le lieu de travail est jusqu’à fin 2025 : Laboratoires Pierre Fabre, Hôtel Dieu, 2 rue Viguerie Toulouse.
A partir de fin 2025, ce sera Laboratoires Pierre Fabre, 3 avenue Hubert Curien, Toulouse.
Pour postuler, merci de joindre CV et lettre de motivation. Une lettre de motivation sera fortement appréciée
We are convinced that diversity is a source of fulfillment, social balance and complementarity for our employees, which is why our offers are open to all, without restriction.
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.