Assistant Data scientist H/F

apartmentCrédit Mutuel Arkéa placeBrest descriptionStage/Alternance calendar_month 

Stage de 6 mois à compter du 03/03/2025

Le stage se découpera en trois grandes phases :

Recherche et conception du modèle à faible précision :

Étudier l'état de l'art des modèles à faible précision (binarisation, quantification extrême) et des architectures compatibles.
Identifier les configurations optimales pour un modèle de type Mamba2 utilisant une précision de 1,58 bit.
Proposer une architecture qui tire parti de cette faible précision pour réduire l'utilisation mémoire tout en assurant une convergence stable durant l'entraînement.
Livrable : un rapport de conception technique détaillant les choix d'architecture, les contraintes d'entraînement à faible précision et les hyperparamètres utilisés.

Développement et entraînement du modèle :

Implémenter un pipeline d'entraînement en utilisant des frameworks adaptés (PyTorch) et les outils nécessaires pour gérer la faible précision (arithmétique customisée, simulateurs de précision).
Entraîner le modèle sur un large jeu de données bilingue français/anglais.

Effectuer des itérations pour optimiser la convergence du modèle, en ajustant les hyperparamètres et les techniques de régularisation spécifiques aux architectures à faible précision.

Livrable : un code Python structuré permettant d'entraîner le modèle à précision 1,58 bit ainsi que les checkpoints et logs d'entraînement

Évaluation des performances et validation :

Évaluer le modèle sur des tâches de génération de texte, en utilisant des métriques standard telles que BLEU, perplexité, mais également de nouvelles approches de type jugement par LLM, etc.
Comparer les performances du modèle nativement quantifié à celles de modèles de précision standard (16 et 32 bits).

Analyser les compromis entre performance linguistique et consommation mémoire/énergie, en tenant compte des applications industrielles potentielles.

Livrable : un rapport final avec une analyse comparative et des recommandations d'utilisation.

Voici le profil idéal de notre futur.e stagiaire :
Étudiant(e) en dernière année de Master ou d'École d'Ingénieurs avec une spécialisation en Data Science, Machine Learning ou NLP.
Solides compétences en Python et expérience avec des frameworks de Deep Learning (PyTorch, Accelerate, Transformers, etc.).
Connaissances des techniques d'entraînement à faible précision ou intérêt pour les architectures de modèles conventionnelles.

Esprit analytique, curiosité et envie de travailler sur des projets de recherche appliquée.

Quelques mots sur notre processus de recrutement : Le Chargé de recrutement étudiera votre candidature dès réception

Si votre CV est cohérent avec les attendus du poste, votre profil est analysé par le manager

Si le manager valide votre profil, il vous contactera pour convenir d'une date d'entretien

thumb_up_altOffre recommandée

Assistant Data scientist H/F

apartmentCrédit Mutuel ArkéaplaceBrest (29)
Voici le profil idéal de notre futur.e stagiaire : En formation bac+4 ou bac+5, vous recherchez un stage en data science d'une durée de 3 à 6 mois maximum. De bonnes compétences en mathématiques appliquées et en programmation sont attendues...
apartmentEmploi Orthoptiste Brest 29200placeBrest (29)
Offre emploi Orthoptiste H/F à Brest , proposant d'excellentes conditions d'exercices. Plus d'informations sur ce poste ? Contactez-nous au 06 30 19 54 06 Emploi Orthoptiste H/F Brest 29 : REF 3798 Un centre de santé proposant l'accès au soin...
apartmentManpower CABINET DE RECRUTEMENT DE BRESTplaceBrest (29)
Le poste de Secrétaire administratif (H/F) Secrétaire administratif H/F en CDI ? Région de Brest (29) Type de contrat : CDI Secteur d'activité : Santé Temps de travail : 30 heures par semaine Horaires : Du lundi au vendredi, de 9h à 12h et de 14h...