Oracle heeft zijn samenwerking met NVIDIA uitgebreid met het draaien van strategische NVIDIA AI-applicaties op de nieuwe Oracle Cloud Infrastructure (OCI) Supercluster. NVIDIA heeft OCI geselecteerd als de eerste hyperscale cloud provider om NVIDIA DGX Cloud, een AI-supercomputerservice, op grote schaal aan te bieden. Daarnaast draait NVIDIA NVIDIA AI Foundations, haar nieuwe generatieve AI-clouddiensten, die beschikbaar zijn via DGX Cloud, op OCI.

NVIDIA DGX Cloud en de NVIDIA AI Foundations-diensten die erop draaien, maken gebruik van OCI's unieke Supercluster, dat door NVIDIA is gecertificeerd om ervoor te zorgen dat het voldoet aan de hoge normen van DGX Cloud. OCI's Supercluster omvat OCI Compute Bare Metal, een RoCE-cluster met ultralage latentie op basis van NVIDIA-netwerken en een keuze uit HPC-opslag. Het is ingezet en gevalideerd door NVIDIA ter ondersteuning van duizenden OCI Compute Bare Metal instances die op efficiënte wijze massaal parallelle toepassingen kunnen verwerken.

OCI Supercluster networking kan nu worden geschaald tot 4.096 OCI Compute Bare Metal instances met 32.768 A100 GPU's. OCI Compute Bare Metal instances met NVIDIA H100 GPU's zijn nu beperkt beschikbaar. Daarnaast kondigde NVIDIA aan dat Oracle NVIDIA BlueField-3 DPU's toevoegt aan zijn netwerkstack.

NVIDIA AI Foundations-modelleerdiensten omvatten taal, afbeeldingen, video en 3D, evenals biologie. Ondernemingen kunnen de NVIDIA NeMoo taaldienst en de NVIDIA Picasso beeld-, video- en 3D-diensten gebruiken om eigen, domeinspecifieke, generatieve AI-toepassingen te bouwen voor intelligente chat en klantenondersteuning, professionele contentcreatie, digitale simulatie en meer. Voor de training en inferentie van biologie-AI-modellen biedt de NVIDIA BioNeMo cloudservice hulpmiddelen om generatieve AI-toepassingen snel aan te passen en te implementeren.

Op OCI profiteren aangepaste modellen die zijn gebouwd met NVIDIA AI Foundations en modelfamilies zoals GPT-3 van het OCI Supercluster, dat speciaal gebouwde RDMA-netwerken bevat die bijna lineaire prestaties leveren met een latentie van microseconden en blokkeerproblemen elimineren voor RDMA-afhankelijke werklasten.