NVIDIA heeft twee nieuwe cloud AI-diensten voor grote taalmodellen aangekondigd — de NVIDIA NeMo Large Language Model Service en de NVIDIA BioNeMo LLM Service — waarmee ontwikkelaars eenvoudig LLM's kunnen aanpassen en op maat gemaakte AI-toepassingen kunnen implementeren voor het genereren van content, het samenvatten van tekst, chatbots, het ontwikkelen van codes, evenals voorspellingen van eiwitstructuren en biomoleculaire eigenschappen, en meer. Met de NeMo LLM Service kunnen ontwikkelaars snel een aantal voorgetrainde basismodellen aanpassen met behulp van een trainingsmethode genaamd prompt learning op een door NVIDIA beheerde infrastructuur. De NVIDIA BioNeMo Service is een cloud application programming interface (API) die LLM-gebruiksgevallen uitbreidt van taal naar wetenschappelijke toepassingen om de ontdekking van geneesmiddelen voor farmaceutische en biotechnologische bedrijven te versnellen.

NeMo LLM Service verhoogt nauwkeurigheid met prompt leren, versnelt implementaties; Met de NeMo LLM Service kunnen ontwikkelaars hun eigen trainingsgegevens gebruiken om funderingsmodellen aan te passen, variërend van 3 miljard parameters tot Megatron 530B, een van de grootste LLM's ter wereld. Het proces neemt slechts enkele minuten tot uren in beslag in vergelijking met de weken of maanden die nodig zijn om een model vanaf nul te trainen. Modellen worden aangepast met prompt learning, een techniek die p-tuning wordt genoemd. Hierdoor kunnen ontwikkelaars slechts een paar honderd voorbeelden gebruiken om funderingsmodellen die oorspronkelijk zijn getraind met miljarden datapunten, snel aan te passen.

Het aanpassingsproces genereert taakspecifieke prompt tokens, die vervolgens worden gecombineerd met de basismodellen om een hogere nauwkeurigheid en relevantere antwoorden voor specifieke use cases te leveren. Ontwikkelaars kunnen zich aanpassen voor meerdere use cases met hetzelfde model en veel verschillende prompt tokens genereren. Een speeltuinfunctie biedt een optie zonder code om eenvoudig te experimenteren en te interageren met modellen, waardoor de effectiviteit en toegankelijkheid van LLM's voor branchespecifieke use cases nog verder worden verbeterd.

Zodra de afgestemde modellen klaar zijn om in te zetten, kunnen ze draaien op cloudinstanties, systemen op locatie of via een API. BioNeMo LLM Service stelt onderzoekers in staat de kracht van massamodellen te benutten; De BioNeMo LLM Service omvat twee nieuwe BioNeMo taalmodellen voor scheikundige en biologische toepassingen. Het biedt ondersteuning voor eiwit-, DNA- en biochemische gegevens om onderzoekers te helpen patronen en inzichten te ontdekken in biologische sequenties.

Met BioNeMo kunnen onderzoekers de reikwijdte van hun werk uitbreiden door gebruik te maken van modellen die miljarden parameters bevatten. Deze grotere modellen kunnen meer informatie opslaan over de structuur van eiwitten, evolutionaire relaties tussen genen en zelfs nieuwe biomoleculen genereren voor therapeutische toepassingen. Cloud API biedt toegang tot Megatron 530B en andere kant-en-klare modellen; naast het afstemmen van basismodellen omvatten de LLM-diensten de optie om kant-en-klare en aangepaste modellen te gebruiken via een cloud API.

Dit geeft ontwikkelaars toegang tot een breed scala aan voorgetrainde LLM's, waaronder Megatron 530B. Het biedt ook toegang tot T5- en GPT-3-modellen die zijn gemaakt met het NVIDIA NeMo Megatron framework — nu beschikbaar in open bèta — ter ondersteuning van een breed scala aan toepassingen en meertalige servicevereisten. Marktleiders in de auto-industrie, computerindustrie, onderwijs, gezondheidszorg, telecommunicatie en andere sectoren gebruiken NeMo Megatron om de weg te bereiden voor diensten voor klanten in het Chinees, Engels, Koreaans, Zweeds en andere talen.