Consultant en Intelligence Artificielle
il y a 2 jours
Aix-en-Provence
SENIOR MACHINE LEARNING ENGINEER RAG (H/F) Contexte Dans un contexte d’accélération forte des usages autour de l’IA générative, nos clients grands comptes et industriels de la région marseillaise et PACA structurent et industrialisent des architectures RAG (Retrieval-Augmented Generation) à l’échelle. L’objectif n’est plus le simple POC, mais la mise en production sécurisée, scalable et performante d’assistants IA métiers, intégrés aux systèmes existants (on-premise et cloud). Dans ce cadre, Wolsome Provence recherche un(e) Senior Machine Learning Engineer RAG pour intervenir sur des projets à très forte valeur ajoutée, au cœur des équipes Data, IT et Innovation. VOS MISSIONS Architecture & RAG avancé • Prendre en responsabilité des architectures RAG complexes et industrialisées., • Concevoir des pipelines complets : ingestion, chunking, embeddings, indexation, retrieval, reranking et prompting avancé., • Transformer des modèles IA/GenAI en services robustes, sécurisés et scalables., • Mettre en œuvre des architectures orientées “factory” pour accélérer le time-to-market., • Optimiser les performances d’inférence (latence, throughput, GPU, coûts)., • Implémenter des mécanismes de monitoring, observabilité, qualité et dérive des modèles., • Travailler en étroite collaboration avec les équipes métiers, Data et IT., • Participer à la définition des standards techniques IA et MLOps., • Être force de proposition sur les choix d’architecture et d’outillage. VOTRE PROFIL Formation & Expérience • Bac+5 (école d’ingénieur, université ou équivalent)., • Minimum 5 ans d’expérience en Machine Learning Engineering, Software Engineering ou Data., • Python (expert) – PyTorch / TensorFlow., • Frameworks RAG : LangChain, LlamaIndex., • Bases vectorielles et moteurs de recherche : FAISS, Pinecone, Qdrant, Weaviate, OpenSearch, Elasticsearch., • APIs & services ML : FastAPI., • Conteneurisation & orchestration : Docker, Kubernetes, OpenShift / OpenShift AI., • MLOps / CI-CD : MLflow, GitLab CI, Argo, Kubeflow, Elyra., • Optimisation & serving : vLLM, Triton Inference Server, OpenVINO., • Forte autonomie et capacité à auditer et améliorer des architectures existantes., • Rigueur d’ingénierie et culture production., • Capacité à vulgariser et interagir avec des équipes métiers., • Des projets IA concrets, industrialisés et à impact réel., • Une expertise Data & IA reconnue localement (Aix / Marseille / PACA)., • Une structure à taille humaine, agile, réactive et exigeante techniquement. Wolsome est une société de conseil multi-spécialiste créée en 2020, intervenant dans des secteurs variés : Banque, Finance, Assurance, Industrie, Cybersécurité, Énergie. Sa filiale Wolsome Provence accompagne des clients régionaux et nationaux sur leurs projets Data, IA et transformation digitale, avec une forte exigence de proximité, de qualité et d’impact opérationnel. Dans le cadre de sa politique Diversité & Inclusion, tous nos postes sont ouverts aux personnes en situation de handicap. Wolsome s’engage à garantir l’égalité des chances.