Assistant Data scientist H/F

apartmentCrédit Mutuel Arkéa placeBrest descriptionStage/Alternance calendar_month 

Stage de 6 mois à compter du 03/03/2025

Le stage se découpera en trois grandes phases :

Recherche et conception du modèle à faible précision :

Étudier l'état de l'art des modèles à faible précision (binarisation, quantification extrême) et des architectures compatibles.
Identifier les configurations optimales pour un modèle de type Mamba2 utilisant une précision de 1,58 bit.
Proposer une architecture qui tire parti de cette faible précision pour réduire l'utilisation mémoire tout en assurant une convergence stable durant l'entraînement.
Livrable : un rapport de conception technique détaillant les choix d'architecture, les contraintes d'entraînement à faible précision et les hyperparamètres utilisés.

Développement et entraînement du modèle :

Implémenter un pipeline d'entraînement en utilisant des frameworks adaptés (PyTorch) et les outils nécessaires pour gérer la faible précision (arithmétique customisée, simulateurs de précision).
Entraîner le modèle sur un large jeu de données bilingue français/anglais.

Effectuer des itérations pour optimiser la convergence du modèle, en ajustant les hyperparamètres et les techniques de régularisation spécifiques aux architectures à faible précision.

Livrable : un code Python structuré permettant d'entraîner le modèle à précision 1,58 bit ainsi que les checkpoints et logs d'entraînement

Évaluation des performances et validation :

Évaluer le modèle sur des tâches de génération de texte, en utilisant des métriques standard telles que BLEU, perplexité, mais également de nouvelles approches de type jugement par LLM, etc.
Comparer les performances du modèle nativement quantifié à celles de modèles de précision standard (16 et 32 bits).

Analyser les compromis entre performance linguistique et consommation mémoire/énergie, en tenant compte des applications industrielles potentielles.

Livrable : un rapport final avec une analyse comparative et des recommandations d'utilisation.

Voici le profil idéal de notre futur.e stagiaire :
Étudiant(e) en dernière année de Master ou d'École d'Ingénieurs avec une spécialisation en Data Science, Machine Learning ou NLP.
Solides compétences en Python et expérience avec des frameworks de Deep Learning (PyTorch, Accelerate, Transformers, etc.).
Connaissances des techniques d'entraînement à faible précision ou intérêt pour les architectures de modèles conventionnelles.

Esprit analytique, curiosité et envie de travailler sur des projets de recherche appliquée.

Quelques mots sur notre processus de recrutement : Le Chargé de recrutement étudiera votre candidature dès réception

Si votre CV est cohérent avec les attendus du poste, votre profil est analysé par le manager

Si le manager valide votre profil, il vous contactera pour convenir d'une date d'entretien

apartmentBEST WESTERNplaceBrest (29)
Le poste de Serveur / Serveuse de restaurant-petits déjeuners (H/F) temps partiel - 24H Autre Vous serez en charge du service des plats pour les petits déjeuners Vos missions :  •  Accueillir, prendre la commande, conseiller et servir le client,
apartmentEmploi Orthoptiste Brest 29200placeBrest (29)
Offre emploi Orthoptiste H/F à Brest , proposant d'excellentes conditions d'exercices. Plus d'informations sur ce poste ? Contactez-nous au 06 30 19 54 06 Emploi Orthoptiste H/F Brest 29 : REF 3798 Un centre de santé proposant l'accès au soin...
check_circleNuovelle offre

Magasinier cariste (f/h) - Brest (29)

apartmentRandstad BrestplaceBrest (29)
Randstad vous ouvre toutes les portes de l'emploi : intérim, CDD, CDI. Chaque année, 330 000 collaborateurs (f/h) travaillent dans nos 60 000 entreprises clientes. Rejoignez-nous ! Nous recherchons pour le compte de notre client, acteur majeur sur...