Kuaishou Technology maakte zijn eerste collectieve debuut van AI-modellen tijdens een forum op 6 juli, getiteld "New AI New Applications New Ecosystem", als onderdeel van de 2024 World Artificial Intelligence Conference. Tijdens het forum toonde Kuaishou zijn uitgebreide AI-modellenmatrix, inclusief geavanceerde functionaliteiten voor onder andere zijn videogeneratiemodel "Kling" en beeldgeneratiemodel "Kolors". Op het Forum werd de derde upgrade van Kling uitgebracht, na de release van de beeld-naar-video en video-extensiefuncties in de afgelopen maand.

Kling is nu toegankelijk via een webportaal. Samen met de high-definition versie van Kling, omvatten de nieuwe functies die op WAIC onthuld werden onder andere controle over begin- en eindkaders en mogelijkheden voor shotcontrole. Daarnaast is de tijdsduur voor het genereren van een enkele tekst-naar-video voor makers verlengd tot 10 seconden.

Kolors is officieel open-sourced om de vitaliteit van de industrie te bevorderen en een welvarender ecosysteem voor tekst-naar-beeld modellen op te bouwen. De heer Gai schetst de AI-modellenmatrix van het bedrijf, die het KwaiYii (??) grote taalmodel, het grote aanbevelingsmodel en het visuele generatiemodel als belangrijkste componenten bevat. Deze modellen omvatten het creëren van inhoud, begrip, aanbevelingen en andere aspecten en spelen een cruciale rol in het verbeteren van het commerciële ecosysteem van Kuaishou.

Met name het aanbevelingsmodel SIM (Search-based Interest Model), met zijn schaal van 10 biljoen parameters, is een van 's werelds toonaangevende aanbevelingssystemen. De volgende-generatie architectuur, ACT (Action Transformer), zal naar verwachting honderden miljoenen minuten dagelijkse gebruikerstijd toevoegen aan de Kuaishou App, waardoor de betrokkenheid en activiteit van gebruikers aanzienlijk zal toenemen. Gebaseerd op het grote KwaiYii model, heeft Kuaishou videoscripts, real-time live streaming scripts en customer service voor advertentieleads ontwikkeld, allemaal geïntegreerd met digitale menselijke technologie. Deze ontwikkelingen helpen adverteerders om betaalbaar video- en livestreamingcontent van hoge kwaliteit te produceren, waardoor leadconversie efficiënter wordt.

In juni 2024 bedroegen de hoogste dagelijkse uitgaven van Kuaishou's klanten die AIGC-marketingmateriaal gebruikten meer dan RMB20 miljoen, wat het enorme commerciële potentieel van grote modellen aantoont. Na de introductie van beeld-naar-video en video-extensie functies, heeft Kling zijn derde grote upgrade binnen een maand omarmd. De webversie is nu officieel online.

Tijdens het Forum kondigde Kuaishou een significante upgrade aan van het basis AI-model van Kling, waarbij verbeterde high-definition kwaliteit werd geïntroduceerd, evenals nieuwe bewerkingsmogelijkheden zoals controle over begin- en eindframes en shotcontrole. Daarnaast is de maximale duur voor enkelvoudige tekst-naar-video creaties verlengd tot 10 seconden, waarmee dit de langste duur is die momenteel beschikbaar is voor gewone gebruikers in de industrie. Kling, 's werelds eerste grote model voor het genereren van video die echt beschikbaar is voor gewone gebruikers, lanceerde zijn tekst-naar-video functie op 6 juni.

Tijdens de conferentie over computer vision en patroonherkenning onthulde het extra nieuwe functies, waaronder de functie beeld-naar-video en video-extensie, waarmee video's tot ongeveer drie minuten lengte kunnen worden gemaakt. De door Kling geproduceerde video's, die gebaseerd zijn op natuurkundige wetten uit de echte wereld, vertonen filmische kwaliteit en dynamische effecten, simuleren levensechte fysieke bewegingen met grote bewegingen en overtreffen de beperkingen van traditionele technologieën voor het genereren van video's. Deze doorbraak heeft niet alleen lokaal lof geoogst, maar heeft ook aanzienlijke internationale aandacht gewekt, waardoor de wereldwijde interesse in de vooruitgang van China op het gebied van AI-technologie is toegenomen.

Tot nu toe hebben meer dan 500.000 gebruikers zich aangemeld voor de bètatest van Kling, waarbij het aantal gegenereerde video's is opgelopen tot 7 miljoen. Populaire creaties zoals "Old Photo Revival" zijn viraal gegaan vanwege hun emotionele impact. Kuaishou zal zich blijven richten op het verbeteren van de basiskwaliteit van het model, het verbeteren van de helderheid van video's en het introduceren van meer innovatieve functies om aan verschillende gebruikersbehoeften te voldoen.

Wan Pengfei, hoofd van Kuaishou's Visual Generation and Interaction Center, verklaarde dat de nieuwste versie van Kling significante verbeteringen biedt op zeven gebieden: het genereren van beweging, de duur van het genereren, het naleven van fysieke wetten, videokwaliteit, opdrachtreactie, beeld-naar-video conversie en videocontrole. Deze verbeteringen maken het mogelijk om duidelijkere en beter beheersbare video's van 10 seconden of langer te maken. Tijdens het Forum ging met name de trailer voor China's eerste originele AIGC fantasy korte toneelstuk, "Legendary Mirrors of Mountains and Seas: Splitting Waves," in première, waarbij Kling uitgebreide technische ondersteuning bood voor het korte toneelstuk.

De snelle vooruitgang van de AIGC-technologie heeft de industrie voor korte voorstellingen nieuw leven ingeblazen en de efficiëntie van de productie, creatie en werking van korte voorstellingen aanzienlijk verbeterd. Om AI-enthousiastelingen te inspireren, lanceerde Kuaishou tijdens het Forum de eerste Kling x KuaiYing videowedstrijd "A Surge of Inspiration". Deze wedstrijd, in samenwerking met zes topinstituten, heeft een prijzenpot van meer dan 300.000 RMB.

Daarnaast lanceerde de wedstrijd het "Kling x Astral Short Plays" incubatieprogramma voor makers, waarbij winnaars uit elke categorie worden uitgenodigd om deel te nemen aan een ondersteuningsprogramma voor makers. Dit programma biedt opmerkelijke zichtbaarheid, geldbeloningen en mogelijkheden voor direct contact met professionals uit de industrie. Op het gebied van beeldgeneratie van grote modellen is Kuaishou's Kolors toonaangevend in de industrie, met een aantal belangrijke voordelen, waaronder een geavanceerd semantisch begrip, hoogwaardige fotografische beelden en de mogelijkheid om gestileerde beelden te genereren op basis van meerdere condities.

In de evaluatie uitgevoerd door China's gezaghebbende organisatie, de Beijing Academy of Artificial Intelligence Institute, scoorde Kolors 75,23, waarmee het wereldwijd op de tweede plaats staat op het gebied van tekst-naar-beeld modellen. Kolors integreert Kuaishou's uitgebreide expertise in grote taalmodellen, getraind op miljarden Chinese datapunten, waardoor het het meest deskundige Chinese tekst-naar-beeld model is dat beschikbaar is. De algehele prestaties overtreffen zowel open-source modellen zoals SDXL/SD3 als closed-source modellen zoals Midjourney, en vormen een nieuwe benchmark voor het genereren van afbeeldingen in Chinese contexten.

Tijdens het Forum kondigde Kuaishou aan dat Kolors officieel open-source zou worden, met als doel de industrie een impuls te geven en een bloeiend gemeenschapsecosysteem voor tekst-naar-beeld modellen te bevorderen. Daarnaast kondigde de China Computer Federation (CCF) een samenwerking met Kuaishou aan om het "CCF-Kuaishou Large Model Explorer Fund" op te richten, waarbij tegelijkertijd het aanvraagkanaal voor het fonds werd geopend. Dit fonds is van plan om 12 onderzoeksprojecten te lanceren tegen het einde van 2024, met onderwerpen die in aanmerking komen voor maximaal RMB300.000 aan ondersteuning.

Het fonds richt zich op de snelle ontwikkeling van AI-technologie en de dringende vraag van de industrie naar geavanceerde technologie, en richt zich op het belangrijkste technische onderzoek en de ontwikkeling van de volgende generatie grote modellen.