VCF 9.1 permet aux entreprises de déployer plus rapidement des workloads IA à moindre coût, avec un niveau de sécurité renforcé et un écosystème technologique ouvert et interopérable
PALO ALTO, Californie — Broadcom Inc. (NASDAQ: AVGO), acteur technologique mondial spécialisé dans la conception, le développement et la fourniture de solutions logicielles d’infrastructure et de semi-conducteurs, annonce aujourd’hui VMware Cloud Foundation (VCF) 9.1, une plateforme d’infrastructure sécurisée et optimisée en coûts pour les workloads d’IA en production.
VCF 9.1 propose une plateforme de cloud privé native IA et Kubernetes, intégrant des mécanismes de sécurité avancés et la prise en charge d’infrastructures de calcul hétérogènes reposant sur AMD, Intel et NVIDIA. Les entreprises peuvent ainsi déployer des applications d’inférence et d’IA agentique à des coûts significativement réduits, avec un niveau de sécurité accru et une liberté de choix parmi les meilleures architectures GPU et CPU du marché.
Un aperçu du rapport Private Cloud Outlook 2026 de Broadcom révèle que le cloud privé s’impose comme la plateforme privilégiée pour l’IA en production. Plus de la moitié des organisations interrogées (56 %) exécutent ou prévoient d’exécuter des workloads d’inférence en production sur cloud privé. À l’inverse, l’usage du cloud public pour ces mêmes cas recule à 41 %, soit une baisse de 15 points sur un an. Par ailleurs, 62 % des responsables IT se déclarent très ou extrêmement préoccupés par les coûts d’infrastructure liés à l’IA générative, tandis que 36 % indiquent que l’IA impose de nouvelles exigences en matière de protection des données, de confidentialité, de sécurité et de gestion des risques.
VMware Cloud Foundation offre une alternative plus performante au cloud public pour les workloads en production, grâce à une couche logicielle intelligente qui maximise l’efficacité des infrastructures existantes tout en garantissant contrôle architectural et conformité réglementaire, des éléments critiques pour les déploiements d’IA.
VCF 9.1 permet aux entreprises de déployer des workloads de production, incluant l’inférence et l’IA agentique, avec :
- Jusqu’à 40 % de réduction des coûts serveurs grâce à une gestion intelligente de la mémoire pour les clusters mixtes IA / non-IA¹
- Jusqu’à 39 % de réduction du TCO stockage via des mécanismes avancés de compression et de déduplication des pipelines de données IA¹
- Jusqu’à 46 % de baisse des coûts opérationnels Kubernetes pour l’exécution de workloads IA à grande échelle¹
- Des mises à niveau de clusters 4 fois plus rapides et une capacité de gestion multipliée par 2 pour accélérer le passage à l’échelle¹
“Alors que de plus en plus d’entreprises misent sur l’IA pour renforcer leur avantage compétitif, trois défis majeurs émergent : la protection des données et de la propriété intellectuelle, la hausse des coûts d’infrastructure et la préparation à l’ère de l’IA agentique”, déclare Krish Prasad, senior vice president and general manager, VMware Cloud Foundation Division, Broadcom. “VCF 9.1 répond à ces trois enjeux au sein d’une plateforme unifiée et propose l’une des infrastructures les plus avancées pour l’IA privée. Elle permet de mettre en œuvre une sécurité zero-trust pour l’IA, de réduire les coûts grâce à une optimisation intelligente de l’infrastructure et du choix technologique, et d’exécuter à la fois des workflows agentiques et de l’inférence accélérée sur une même plateforme.”
Une infrastructure efficace et scalable pour les workloads IA
VCF 9.1 maximise la densité des workloads IA, qu’ils soient virtualisés ou conteneurisés, sur les infrastructures existantes tout en réduisant fortement la complexité opérationnelle. Grâce à une gestion intelligente des ressources et à l’automatisation, les entreprises peuvent déployer davantage de workloads sur leurs serveurs actuels, évoluer efficacement dans des environnements distribués et éviter des investissements matériels coûteux dans un contexte de tension sur les composants.
Parmi les principales capacités :
- Optimisation intelligente des ressources, permettant de maximiser l’utilisation de l’infrastructure grâce à une gestion avancée de la mémoire et à des mécanismes de compression de nouvelle génération pour les pipelines de données d’IA, afin d’augmenter la densité des workloads d’IA sans compromettre les performances ni nécessiter de renouvellement matériel coûteux.
- Automatisation des opérations à grande échelle, avec une capacité de gestion portée à 5 000 hôtes et des mises à niveau de clusters jusqu’à quatre fois plus rapides dans des environnements distribués et isolés (air-gapped), réduisant les opérations de patching manuel tout en accompagnant l’extension rapide des infrastructures IA.
- Infrastructure multi-tenant pour l’isolation des workloads d’IA, permettant aux entreprises et aux fournisseurs de services d’exécuter plusieurs projets d’IA et de servir plusieurs clients sur une infrastructure partagée avec des niveaux de sécurité stricts, tout en maximisant l’utilisation de ressources GPU et CPU coûteuses et en garantissant la souveraineté des données pour les modèles sensibles.
- Intégration dans un écosystème ouvert, offrant un large choix d’accélérateurs GPU entre AMD et NVIDIA, la prise en charge des principales plateformes CPU AMD et Intel, ainsi qu’une interopérabilité EVPN et VXLAN basée sur des standards avec Arista Networks Universal Cloud Network, illustrant l’engagement de VCF à fournir la connectivité haute performance et la flexibilité de calcul requises pour l’IA en production.
- Réseau à haute performance pour les workloads d’IA, grâce à la prise en charge par VCF des cartes réseau NVIDIA ConnectX-7 et de NVIDIA BlueField-3 avec Enhanced DirectPath I/O. Cette évolution permet l’entraînement de modèles d’IA multi-hôtes à haute vitesse ainsi que des transferts de données rapides, indispensables pour les workloads exigeants d’IA générative.
- Équilibrage de charge et sécurité virtualisés, avec VMware Avi Load Balancer² et VMware vDefend², supprimant le recours à des équipements matériels dédiés pour les endpoints d’inférence IA et les applications agentiques, réduisant les dépenses d’investissement tout en assurant une résilience de niveau entreprise et une gestion automatisée du cycle de vie.
Accélération du delivery applicatif : une plateforme unifiée pour IA, containers et VMs
VCF 9.1 unifie l’exécution des workloads IA, des applications agentiques, des services conteneurisés et des machines virtuelles sur une même couche d’infrastructure. Cette approche élimine la fragmentation opérationnelle et réduit les coûts liés à la gestion de stacks multiples.
Capacités clés :
- Scalabilité et performance Kubernetes pour l’IA, avec une capacité de cluster multipliée par 2,6, des déploiements 70 % plus rapides et des fenêtres de mise à niveau réduites de 75 % par rapport aux versions préliminaires¹, ainsi qu’une montée en charge fluide permettant d’assurer une continuité de service sans interruption pour les services d’IA en production.
- Gestion des ressources de calcul hétérogènes, permettant de prendre en charge efficacement à la fois des workflows d’IA agentique fortement consommateurs en CPU et des workloads d’inférence accélérés par GPU sur une plateforme unifiée, en réponse à la réalité selon laquelle les workloads agentiques requièrent significativement plus de capacité CPU que GPU pour l’exécution des workflows et l’orchestration des décisions.
- Observabilité et gouvernance de l’IA, offrant des métriques détaillées telles que le temps jusqu’au premier token, le débit de tokens et l’utilisation des GPU sur différents types d’accélérateurs, afin de permettre aux entreprises d’optimiser le retour sur investissement de leur infrastructure grâce à un suivi précis de l’utilisation des ressources matérielles, tandis que l’injection centralisée de politiques et les mécanismes de souveraineté des données assurent la conformité des usages de l’IA et un accès sécurisé aux modèles.
- Modèles de déploiement applicatif (“blueprints”) dynamiques, permettant de capturer des applications multi-VM sous forme de templates réutilisables pour un déploiement rapide des environnements, en éliminant les erreurs de configuration manuelles et en évitant les dérives de configuration entre les environnements de développement, de test et de production, tout en accélérant la mise à disposition des infrastructures.
Une architecture zero-trust pour la souveraineté et la sécurité des données IA
VCF 9.1 intègre la sécurité au cœur de l’infrastructure afin de protéger les workloads IA, les modèles propriétaires et les données d’entraînement.
Principales fonctionnalités :
- Reprise après ransomware en environnement on-premises, avec des environnements de restauration isolés et des outils de validation intégrés, incluant la prise en charge de CrowdStrike Falcon® Endpoint Security, permettant de protéger les modèles d’IA et les données d’entraînement — des actifs de propriété intellectuelle critiques — contre les transferts transfrontaliers, tout en évitant des coûts de bande passante élevés lors des opérations de restauration en situation de crise.
- Application continue de la conformité², garantissant le respect des exigences réglementaires grâce à un monitoring centralisé et à des mécanismes automatisés de remédiation de l’état cible pour les workloads et les composants de la stack VCF, permettant aux entreprises de démontrer leur conformité et leur capacité d’audit pour les déploiements d’IA en production sans surcharge opérationnelle ni recours à des outils dédiés.
- Patching à chaud sans interruption de service, couvrant jusqu’à 80 % des cas d’usage sans nécessiter l’évacuation des hôtes ni de fenêtres de maintenance, éliminant ainsi toute interruption des services d’inférence IA en production et des applications agentiques qui requièrent une disponibilité continue dans le cadre des engagements de niveau de service¹.
- Sécurité latérale zero-trust², étendant pour la première fois la protection distribuée IDS/IPS aux workloads d’IA sous Kubernetes, avec une capacité d’inspection des menaces atteignant 9 Tbps pour les environnements d’inférence distribuée et une capacité d’identification des applications multipliée par 5 pour les environnements de cloud privé et les applications Internet¹.
- Sécurité en self-service automatisée², reposant sur un système de tagging centralisé, des profils de sécurité prédéfinis, des configurations de pare-feu déléguées et des mécanismes de sécurisation des applications web en entrée (ingress), permettant aux entreprises et aux fournisseurs de services de sécuriser leurs déploiements d’IA sans complexité opérationnelle ni fragmentation des outils de sécurité.
Témoignages clients et partenaires
« Arista Networks et Broadcom partagent un engagement fondamental en faveur de réseaux ouverts, basés sur des standards, qui offrent aux entreprises une véritable liberté architecturale et de choix pour leurs infrastructures d’IA en production », déclare Jeff Raymond, Vice President and General Manager of EOS Software and Services. « L’interopérabilité EVPN et VXLAN entre Arista Universal Cloud Network et VMware Cloud Foundation 9.1 apporte le niveau d’ouverture et de performance requis pour l’IA en production. Grâce à une connectivité directe ESX-vers-fabric fondée sur des standards, les entreprises peuvent concevoir des architectures réseau évolutives pour leurs infrastructures IA tout en réduisant à la fois leurs dépenses d’investissement et leurs coûts opérationnels. »
« Les workloads d’IA sont désormais des cibles prioritaires, et une reprise sans validation représente un risque que les entreprises ne peuvent pas se permettre », déclare Chris Stewart, Vice President, Global Cloud and Technology Alliance Partners, CrowdStrike. « Grâce à l’intégration de CrowdStrike avec VMware Cloud Foundation, les organisations peuvent stopper les intrusions plus rapidement, vérifier que les environnements sont réellement sains avant restauration, et prévenir toute réinfection — un point critique pour protéger des modèles et des données à forte valeur tout en conservant un contrôle total sur la souveraineté et la conformité. »
« VMware Cloud Foundation 9.1 est davantage optimisé pour les processeurs Intel® Xeon® 6, permettant d’exploiter pleinement le potentiel d’une plateforme à haute densité, prête pour l’IA. L’intégration native de la technologie Intel® QuickAssist accélère Encrypted vMotion tout en libérant de précieuses ressources de calcul », déclare Caitlin Anderson, Corporate Vice President, Americas Sales chez Intel. « Ensemble, nous restons engagés à fournir une innovation continue avec un coût total de possession optimisé, afin d’aider nos clients à accélérer leurs trajectoires de modernisation autour de l’IA et des conteneurs. »
« L’analyse de plusieurs années d’archives d’actualité dans le cloud public est prohibitive en termes de coûts, avec une tarification imprévisible qui rend les projets d’IA difficiles à planifier », déclare V V Jacob, Senior General Manager, Systems for Malayala Manorama Co Ltd. « En déployant les services Private AI de VCF sur notre infrastructure VMware Cloud Foundation existante, nous exécuterons des cas d’usage d’IA tels que la synthèse de contenus, la génération de titres et l’assistance éditoriale directement sur notre cloud privé. Nous pensons que cela nous apportera le niveau de confidentialité et de sécurité nécessaire à la protection de nos sources éditoriales, tout en bénéficiant de la prévisibilité des coûts offerte par une infrastructure de cloud privé on-premises. »
Ressources complémentaires
- Consultez l’ensemble des articles de blog VMware Cloud Foundation 9.1 pour découvrir les dernières innovations
- En savoir plus sur VMware Cloud Foundation
- Suivez les comptes VMware Cloud Foundation sur LinkedIn, X (anciennement Twitter) et YouTube
¹ Basé sur des estimations internes de Broadcom Inc. ou sur des résultats de tests, susceptibles d’évoluer. Avril 2026
² Service avancé pour VCF vendu séparément
À propos de Broadcom
Broadcom Inc. (NASDAQ : AVGO) est un leader technologique qui conçoit, développe et fournit des semi-conducteurs et des logiciels d’infrastructure pour répondre aux besoins complexes et critiques des organisations à l’échelle mondiale. Broadcom associe des investissements de long terme en R&D à une excellence opérationnelle afin de proposer les meilleures technologies, à grande échelle. Broadcom est une société de droit du Delaware dont le siège est situé à Palo Alto, en Californie. Pour plus d’informations, rendez-vous sur www.broadcom.com.
Broadcom, le logo Pulse et Connecting everything font partie des marques déposées de Broadcom. Le terme « Broadcom » désigne Broadcom Inc. et/ou ses filiales. Les autres marques sont la propriété de leurs détenteurs respectifs.
