ATLANTA : Joe FERNANDES : « Nous définissons le standard ou…
Partager :
ATLANTA : Joe FERNANDES : « Nous définissons le standard ouvert pour l’exécution de l’IA en entreprise »
Lors du Red Hat Summit, l’éditeur a dévoilé Red Hat AI 3.4, une plateforme visant à industrialiser le déploiement des agents d’IA en entreprise.
ATLANTA – Annoncée ce 12 mai 2026 à l’occasion du Red Hat Summit, la nouvelle version de la plateforme Red Hat AI (https://www.redhat.com/en/products/ai) entend combler le fossé entre l’IA expérimentale et un contrôle opérationnel adapté à la production. Selon le premier fournisseur mondial de solutions open source, Red Hat AI 3.4 propose une base unifiée, de l’infrastructure matérielle aux agents logiciels (« metal-to-agent »), pour permettre aux organisations de déployer à grande échelle des systèmes d’intelligence artificielle autonomes, tout en conservant la maîtrise et la sécurité exigées par le monde de l’entreprise.
Réconcilier innovation et contrôle opérationnel
La transition des chatbots vers des systèmes autonomes de production crée une tension entre les développeurs, en quête d’agilité, et les administrateurs d’infrastructure, soucieux de stabilité, de coûts et de sécurité. D’après Red Hat, cette friction freine l’innovation ou, à l’inverse, favorise l’émergence d’une « IA fantôme » (shadow AI) qui introduit des risques non maîtrisés. La plateforme Red Hat AI 3.4 a été conçue pour aligner ces deux rôles en offrant un socle commun pour l’inférence évolutive et le déploiement d’agents, avec la transparence et la gouvernance nécessaires. « L’ère agentique représente une évolution de notre plateforme qui passe de l’exécution d’applications traditionnelles à la mise en œuvre de systèmes intelligents autonomes. Nous définissons le standard ouvert déterminant la façon dont l’entreprise exécute l’IA », a déclaré Joe Fernandes, vice-président et directeur général de la division AI Business Unit chez Red Hat.
Une architecture complète pour l’IA agentique
Au cœur de cette nouvelle version se trouve le concept de Modèle sous forme de service (Model-as-a-Service, MaaS). Il fournit aux développeurs une interface unique et contrôlée pour accéder aux modèles d’IA, tout en permettant aux administrateurs de superviser leur utilisation et d’appliquer des règles de gouvernance. Cette fonctionnalité s’appuie sur une infrastructure d’inférence distribuée à haute performance, optimisée par des technologies comme vLLM et llm-d.
Pour accompagner le cycle de vie des agents, Red Hat AI 3.4 introduit les outils AgentOps, qui assurent le traçage, l’observabilité, la gestion d’identité et le suivi depuis le développement jusqu’à la mise en production. La plateforme intègre également MLflow pour le traçage expérimental et la gestion des artefacts, ainsi qu’une gestion des prompts, désormais traités comme des actifs de données essentiels, et un hub d’évaluation de la qualité, de la précision et de la sécurité des modèles.
La sécurité et la gouvernance, piliers de la confiance
Alors que les agents d’IA opèrent avec une autonomie croissante, la traçabilité de leurs décisions devient un enjeu de sécurité critique. Red Hat AI 3.4 répond à ce défi en permettant de suivre les actions, les étapes de raisonnement et les appels d’outils pour vérifier le cheminement d’un agent. La plateforme intègre une gestion d’identité cryptographique (SPIFFE/SPIRE), liant chaque action à une identité vérifiée et remplaçant les clés statiques par des jetons éphémères.
La sécurité est renforcée par des tests automatisés et des attaques fictives (« red-teaming »), s’appuyant sur la technologie issue de l’acquisition de Chatterbox Labs (https://www.redhat.com/en/about/press-releases/red-hat-accelerates-ai-trust-and-security-chatterbox-labs-acquisition) et le projet open source Garak. Ces outils permettent de déceler les vulnérabilités comme les injections de prompts ou les biais, en complément de solutions comme NVIDIA NeMo Guardrails pour la sécurité en fonctionnement.
Un écosystème ouvert et performant
Red Hat AI 3.4 est conçue pour la flexibilité, avec un support dès le premier jour pour les nouvelles architectures matérielles comme les GPU NVIDIA Blackwell (https://www.nvidia.com/en-us/data-center/technologies/blackwell-architecture/) et AMD MI325X. Cette approche s’étend aux partenariats stratégiques. « Les agents autonomes et persistants en entreprise exigent davantage de contrôle d’infrastructure et de sécurité. Red Hat AI Factory with NVIDIA offre une base open source unifiée apportant la gouvernance et la confiance nécessaires pour l’avenir agentique », a affirmé John Fanelli, Vice President, Enterprise Software chez NVIDIA.
La collaboration avec des fournisseurs de cloud spécialisés est également mise en avant. « Ensemble, nous avons établi un plan de déploiement de Red Hat AI Inference sur CoreWeave Kubernetes Service pour exécuter la même pile d’inférence sur site et dans le cloud », a expliqué Urvashi Chowdhary, Vice President of Product Management – AI Services chez CoreWeave. Cette cohérence opérationnelle est un atout majeur pour les entreprises des secteurs réglementés.
Red Hat AI 3.4 sera disponible d’ici la fin du mois de mai 2026. Pour plus de détails, l’entreprise invite à consulter son blog (https://www.redhat.com/en/blog/inference-agentic-ai-scaling-enterprise-foundation-red-hat-ai-34).
