IBM en NASA's Marshall Space Flight Center hebben een samenwerking aangekondigd om IBM's kunstmatige intelligentie (AI)-technologie te gebruiken om nieuwe inzichten te ontdekken in NASA's enorme hoeveelheid gegevens over de aarde en geospatiale wetenschappen. Het gezamenlijke werk zal voor het eerst AI foundation model-technologie toepassen op NASA's satellietgegevens over de aarde. Basismodellen zijn soorten AI-modellen die worden getraind op een brede set ongelabelde gegevens, voor verschillende taken kunnen worden gebruikt en informatie over de ene situatie kunnen toepassen op een andere.

Deze modellen hebben de afgelopen vijf jaar een snelle vooruitgang geboekt op het gebied van natuurlijke taalverwerkingstechnologie (NLP), en IBM pioniert met toepassingen van foundation-modellen die verder gaan dan taal. De aardobservaties waarmee wetenschappers onze planeet kunnen bestuderen en monitoren, worden in een ongekend tempo en volume verzameld. Er zijn nieuwe en innovatieve benaderingen nodig om kennis uit deze enorme gegevensbronnen te halen.

Het doel van dit werk is onderzoekers een eenvoudiger manier te bieden om deze grote datasets te analyseren en er inzichten uit te halen. IBM's foundation model technologie heeft het potentieel om de ontdekking en analyse van deze gegevens te versnellen om zo het wetenschappelijk begrip van de aarde en de reactie op klimaatgerelateerde problemen snel te bevorderen. IBM en NASA zijn van plan verschillende nieuwe technologieën te ontwikkelen om inzichten uit aardobservaties te halen.

Eén project zal een IBM geospatial intelligence foundation model trainen op NASA's geharmoniseerde Landsat Sentinel-2 (HLS) dataset, een registratie van veranderingen in landbedekking en landgebruik vastgelegd door satellieten in de lucht. Door petabytes aan satellietgegevens te analyseren om veranderingen te identificeren in de geografische voetafdruk van verschijnselen zoals natuurrampen, cyclische gewasopbrengsten en habitats van wilde dieren, zal deze technologie van het basismodel onderzoekers helpen bij het maken van kritische analyses van de milieusystemen van onze planeet. Een ander resultaat van deze samenwerking is naar verwachting een gemakkelijk doorzoekbaar corpus van aardwetenschappelijke literatuur. IBM heeft een NLP-model ontwikkeld dat is getraind op bijna 300.000 aardwetenschappelijke tijdschriftartikelen om de literatuur te ordenen en het gemakkelijker te maken om nieuwe kennis te ontdekken.

Het volledig getrainde model bevat een van de grootste AI-workloads die tot nu toe op Red Hat's OpenShift software zijn getraind en maakt gebruik van PrimeQA, IBM's open-source meertalig vraag-antwoordsysteem. Het nieuwe taalmodel voor aardwetenschappen is niet alleen een hulpmiddel voor onderzoekers, maar kan ook worden geïntegreerd in de wetenschappelijke gegevensbeheer- en stewardship-processen van NASA. Andere mogelijke gezamenlijke IBM-NASA-projecten in deze overeenkomst omvatten de bouw van een basismodel voor weers- en klimaatvoorspellingen met behulp van MERRA-2, een dataset van atmosferische waarnemingen.

Deze samenwerking maakt deel uit van NASA's Open-Source Science Initiative, een verbintenis om in het komende decennium een inclusieve, transparante en collaboratieve open wetenschapsgemeenschap op te bouwen.