Satellogic Inc. kondigde de vrijgave aan van een grote open dataset van hogeresolutiebeelden, samengesteld uit het archief van het bedrijf, ter ondersteuning van de training van foundationmodellen. De dataset bevat ongeveer 3 miljoen Satellogic-beelden van unieke locaties -- 6 miljoen beelden, inclusief locatieherhalingen -- van over de hele wereld. Elke afbeelding is 384 bij 384 pixels, in totaal 900 Gigapixels van verschillende soorten landgebruik, objecten, geografische gebieden en seizoenen.

De volledige dataset is toegankelijk op Hugging Face. Satellogic gegevens worden vrijgegeven onder een Creative Commons CC-BY 4.0 licentie, waardoor commercieel gebruik van de gegevens met naamsvermelding mogelijk is. Een paper over de dataset zal worden gepubliceerd samen met de uitgave van een basismodel, een gemaskeerde autoencoder (schaalbare zelfondersteunde leerlingen voor computervisie), die erop is gebouwd.

De paper beschrijft hoe de dataset is opgebouwd, de modelarchitectuur en de experimentele opzet. Dit werk is het resultaat van de samenwerking van Satellogic met een uitzonderlijk team van onderzoekers onder leiding van Alexandre Lacoste bij ServiceNow onder leiding van Yoshua Bengio.