CDIFull remote (France)CDI ou freelance — TJM à convenir selon profil

Ingénieur(e) Data / ML

Société de conseil en IA, partenaire officiel Anthropic en France. On embarque chez nos clients — industrie, médias, banque, luxe — pour mettre des cas d'usage IA en production, sans boîte noire ni dépendance à un éditeur. On cherche un(e) ingénieur(e) Data / ML pour des corpus textuels et scientifiques exigeants : extraction d'information, scoring, NLP, RAG, évaluation de sorties LLM — du notebook à l'intégration backend.

Responsabilités

  • Développer des pipelines de traitement de corpus textuels et scientifiques, reproductibles et auditables
  • Explorer, nettoyer et structurer des données issues de publications, bases bibliographiques ou documents métier
  • Concevoir des méthodes de scoring, classification, filtrage ou priorisation
  • Extraire de l'information structurée depuis des documents, abstracts ou métadonnées
  • Tester et comparer différentes approches ML / NLP sur des cas d'usage réels
  • Produire des analyses reproductibles et documentées
  • Évaluer les résultats sérieusement : pertinence, robustesse, biais, limites
  • Traduire des besoins métier en solutions techniques avec les équipes scientifique, technique et produit
  • Intégrer certains modules dans des services backend ou API

Prérequis

  • Python : pandas, numpy, scikit-learn
  • Data / ML : traitement de données textuelles, NLP, text mining, ML
  • SQL
  • Git / GitLab : versioning, CI/CD
  • Environnement : notebooks et scripts reproductibles
  • Bonus — Intégration backend : FastAPI, pydantic, transformers / Hugging Face
  • Bonus — LLM appliqué : embeddings, vectorisation, RAG, prompt engineering, évaluation de sorties structurées
  • Bonus — Modèles locaux : Ollama, llama.cpp, vLLM ou équivalents
  • Bonus — MLOps léger : packaging, pipelines, suivi d'expériences, déploiement de prototypes
  • Bonus — Expérience avec des corpus scientifiques ou bibliographiques

Stack technique

Pythonpandasnumpyscikit-learnSQLNLPFastAPIpydanticHugging FaceRAGembeddingsOllamavLLMGit/GitLab

Postuler à cette offre

Remplissez le formulaire ci-dessous ou partagez simplement votre profil LinkedIn.