Stagiaire Assistant IA / DATA - Chaîne RAG H/F

Détail de l'offre

Informations générales

Entité

Le Crédit Mutuel Arkéa est un groupe bancaire coopératif, territorial et collaboratif de 10 500 collaborateurs.
Depuis toujours, le Crédit Mutuel Arkéa innove pour répondre aux défis croissants d'un secteur bancaire en pleine mutation. C'est un modèle original aux performances reconnues.
C'est aujourd'hui un groupe puissant et diversifié, avec une trentaine d'entités et une centaine de métiers différents, principalement dans des fonctions commerciales, mais aussi dans l'IT, les risques, la comptabilité, le contrôle/audit, le marketing, le digital ou encore la finance… Toute une palette de métiers, de compétences, de savoir-être pour lesquels le Crédit Mutuel Arkéa accompagne ses collaborateurs pour les faire évoluer et révéler de nouveaux talents


Le Groupe Crédit Mutuel Arkéa s'engage en faveur de l'inclusion, afin de garantir un cadre de travail respectueux de la diversité de chacun. Nous formons et sensibilisons l'ensemble des acteurs de l'entreprise par le biais d'une stratégie inclusion groupe dédiée et nous nous appuyons sur une communauté de salariés engagés, les ambassadeurs inclusion, pour faire vivre et rayonner cette dynamique au sein du groupe.  

Description du poste

Métier

METIERS - Data

Intitulé du poste

Stagiaire Assistant IA / DATA - Chaîne RAG H/F

Contrat

STAGE

Votre mission

Stage de 6 mois à pourvoir sur Brest à compter de mars 2026.

  • Axe 1 : Indexation Hybride (Sémantique + Mots-clés)
    • Mettre en œuvre une stratégie de retrieval hybride combinant :
    • La recherche sémantique (via embeddings) pour la compréhension du sens.
    • La recherche lexicale (ex: BM25, TF-IDF) pour garantir la remontée des documents contenant des termes métiers ou des acronymes spécifiques (que le sémantique seul peut manquer).
    • Évaluer l'équilibre entre ces deux approches.

 

  • Axe 2 : Expansion de Requête (Multi-Query)
    • Explorer les techniques de "query expansion" pour reformuler la question initiale de l'utilisateur.
    • Développer une approche Multi-Query où un LLM génère plusieurs variantes de la question, en y injectant des synonymes et, surtout, des termes du vocabulaire métier pertinent, afin d'augmenter les chances de "toucher" le bon document.

 

  • Axe 3 : Filtrage Métadonnées & "Routage Métier"
    • Mettre en place un système de filtrage par silos métiers (ex: produits, périmètres fonctionnels, ...).
    • L'enjeu sera d'associer la requête utilisateur au bon silo avant l'étape de retrieval pour éviter la "contamination" contextuelle.
    • Vous explorerez des méthodes pour :
    • Induire les métadonnées (le silo) à partir de la question de l'utilisateur.
    • Guider l'utilisateur (via l'interface) pour qu'il précise son périmètre de recherche.
    • Synthèse et Benchmark : Mener une campagne d'évaluation rigoureuse pour mesurer l'apport de chaque brique et leur combinaison.

 

Et si c'était vous ?

  • Étudiant(e) en Master 2 ou dernière année d'École d'Ingénieur en Informatique, Data Science ou Intelligence Artificielle.
  • Compétences solides en Python
  • Connaissances en NLP.
  • Une première expérience (même via des projets) avec les systèmes RAG (ex: LangChain) et les bases de données vectorielles est un atout majeur.
  • Qualités : Curiosité technique, pragmatisme, autonomie et esprit analytique.

Qui sommes-nous ?

L'IA Factory, intégrée au Data Office d’Arkea Service Informatique, agit comme le moteur d’expérimentation et d'industrialisation de l'IA pour le groupe.
Sa mission est de développer et déployer des solutions IA robustes, sécurisées et scalables, en réponse directe aux besoins métier.
Elle pilote la mise en œuvre de la feuille de route IA du groupe, inscrite dans le plan moyen terme du Crédit Mutuel Arkea.
Elle maîtrise un large spectre technologique : du Machine Learning classique aux solutions d'IA Générative.


L'IA Factory gère le cycle de vie complet des modèles (MLOps) : de l'expérimentation, l'entraînement et le "fine-tuning", au déploiement continu (CI/CD) et à l'intégration dans le SI.


Elle est la garante de la gouvernance des modèles, et standardise les plateformes, les architectures (ex: RAG) et les bonnes pratiques (incluant le "prompt engineering").
Son efficacité repose sur une équipe pluridisciplinaire et centralisée :

  • Data Scientists : Conception des algorithmes, R&D, expertise NLP/LLM.
    ML/Data Engineers : Industrialisation, construction des pipelines de données (structurées/non structurées), gestion MLOps et architectures RAG.
  • Product Owners/chefs de projet IA : Pilotage des cas d'usage et interface (traduction) entre les exigences métier et la réalisation technique.

Localisation du poste

Lieu

Brest

Critères candidat

Niveau d'études min. requis

BAC+4