IA en Production : Modèles performants et évolutifs
Présentation sur l'utilisation efficace de l'IA et GenAI en production, avec cas d'usages et scalabilité par Yannick Lambruschi et Luis Blanche 📕

Devoxx France
2.5K views • May 13, 2025

About this video
Présentation par : Yannick Lambruschi (Mirakl), Luis Blanche (Mirakl)
📕 Résumé :
Les différents cas d’usages de modèles d’IA et de GenAI en production sont sujets à des contraintes de déploiement spécifiques qui nécessitent des approches adaptées. Par exemple, pour un cas d’usage e-commerce basse latence, nous avons déployé nos modèles sur KServe, une solution cloud-native qui exploite Kubernetes pour permettre une colocalisation efficace et optimiser les coûts. À l’opposé, pour un cas d’usage de transformation de catalogues avec des modèles LLM fine-tunés, nous avons réussi à intégrer une architecture Multi-LoRA sur Anyscale grâce à RayLLM, répondant à des besoins de traitement à haut volume avec coût maîtrisé.
Cette présentation abordera ces deux approches distinctes en mettant en lumière les défis techniques, les critères de choix des solutions et les enseignements tirés pour optimiser le déploiement et l’orchestration de modèles d’IA selon leurs contraintes spécifiques en production
Enregistré en avril 2025 à Paris, Palais des Congrès, Porte Maillot.
🔥 Pour rester informé sur l'actualité de Devoxx France, suivez nous sur
LinkedIn : https://www.linkedin.com/company/devoxx-france/
Bluesky : https://bsky.app/profile/devoxx.fr
consultez notre site web https://www.devoxx.fr/
📕 Résumé :
Les différents cas d’usages de modèles d’IA et de GenAI en production sont sujets à des contraintes de déploiement spécifiques qui nécessitent des approches adaptées. Par exemple, pour un cas d’usage e-commerce basse latence, nous avons déployé nos modèles sur KServe, une solution cloud-native qui exploite Kubernetes pour permettre une colocalisation efficace et optimiser les coûts. À l’opposé, pour un cas d’usage de transformation de catalogues avec des modèles LLM fine-tunés, nous avons réussi à intégrer une architecture Multi-LoRA sur Anyscale grâce à RayLLM, répondant à des besoins de traitement à haut volume avec coût maîtrisé.
Cette présentation abordera ces deux approches distinctes en mettant en lumière les défis techniques, les critères de choix des solutions et les enseignements tirés pour optimiser le déploiement et l’orchestration de modèles d’IA selon leurs contraintes spécifiques en production
Enregistré en avril 2025 à Paris, Palais des Congrès, Porte Maillot.
🔥 Pour rester informé sur l'actualité de Devoxx France, suivez nous sur
LinkedIn : https://www.linkedin.com/company/devoxx-france/
Bluesky : https://bsky.app/profile/devoxx.fr
consultez notre site web https://www.devoxx.fr/
Video Information
Views
2.5K
Likes
26
Duration
44:16
Published
May 13, 2025
User Reviews
4.3
(2) Related Trending Topics
LIVE TRENDSRelated trending topics. Click any trend to explore more videos.
Trending Now