Renesas Electronics Corporation heeft de ontwikkeling aangekondigd van ingebedde processortechnologie die hogere snelheden en een lager energieverbruik mogelijk maakt in microprocessoreenheden (MPU's) die geavanceerde vision AI realiseren. De nieuw ontwikkelde technologieën zijn (1) Een dynamisch herconfigureerbare processor (DRP)-gebaseerde AI-accelerator die lichtgewicht AI-modellen efficiënt verwerkt en (2) Heterogene architectuurtechnologie die real-time verwerking mogelijk maakt door samenwerkende processor-IP's, zoals de CPU. Renesas produceerde een prototype van een ingebedde AI-MPU met deze technologieën en bevestigde dat deze snel werkt en weinig stroom verbruikt.

De processor is tot 16 keer sneller (130 TOPS) dan voor de introductie van deze nieuwe technologieën en heeft een energie-efficiëntie van wereldklasse (tot 23,9 TOPS/W bij een voeding van 0,8 V). Door de recente verspreiding van robots in fabrieken, logistiek, medische diensten en winkels is er een groeiende behoefte aan systemen die autonoom in realtime kunnen werken door de omgeving te detecteren met behulp van geavanceerde vision AI. Aangezien er strenge beperkingen zijn op warmteontwikkeling, met name voor ingebedde apparaten, zijn er zowel hogere prestaties als een lager stroomverbruik nodig in AI-chips.

Renesas ontwikkelde nieuwe technologieën om aan deze eisen te voldoen en presenteerde deze prestaties op 21 februari op de International Solid-State Circuits Conference 2024 (ISSCC 2024), die tussen 18 en 22 februari 2024 in San Francisco werd gehouden. De door Renesas ontwikkelde technologieën zijn de volgende: (1) Een AI-accelerator die lichtgewicht AI-modellen efficiënt verwerkt- Als een typische technologie voor het verbeteren van de efficiëntie van AI-verwerking is snoeien beschikbaar om berekeningen weg te laten die de herkenningsnauwkeurigheid niet significant beïnvloeden. Het komt echter vaak voor dat berekeningen die geen invloed hebben op de herkenningsnauwkeurigheid willekeurig voorkomen in AI-modellen.

Dit veroorzaakt een verschil tussen het parallellisme van hardwareverwerking en de willekeurigheid van snoeien, waardoor de verwerking inefficiënt wordt. Om dit probleem op te lossen, optimaliseerde Renesas zijn unieke DRP-gebaseerde AI-accelerator (DRP-AI) voor snoeien. Door te analyseren hoe de kenmerken van snoeipatronen en een snoeimethode gerelateerd zijn aan de herkenningsnauwkeurigheid in typische AI-beeldherkenningsmodellen (CNN-modellen), werd de hardwarestructuur van een AI-accelerator geïdentificeerd die zowel een hoge herkenningsnauwkeurigheid als een efficiënte snoeisnelheid kan bereiken, en werd deze toegepast op het DRP-AI-ontwerp.

Daarnaast werd er software ontwikkeld om het gewicht van AI-modellen geoptimaliseerd voor deze DRP-AI te verminderen. Deze software zet de configuratie van het willekeurige snoeimodel om in zeer efficiënte parallelle berekeningen, wat resulteert in AI-verwerking met een hogere snelheid. Met name de zeer flexibele snoeiondersteuningstechnologie van Renesas (flexibele N:M-snoeitechnologie), die het aantal cycli dynamisch kan wijzigen als reactie op veranderingen in de lokale snoeisnelheid in AI-modellen, maakt een nauwkeurige regeling van de snoeisnelheid mogelijk op basis van het stroomverbruik, de werksnelheid en de herkenningsnauwkeurigheid die gebruikers vereisen.

Deze technologie reduceert het aantal verwerkingscycli van AI-modellen tot slechts een zestiende van het snoeien van incompatibele modellen en verbruikt minder dan een achtste van de stroom. (2) Heterogene architectuurtechnologie die real-time verwerking voor robotbesturing mogelijk maakt - Robotapplicaties vereisen geavanceerde vision AI-verwerking voor herkenning van de omgeving. Ondertussen vereisen de beoordeling en besturing van robotbewegingen gedetailleerde conditionele programmering als reactie op veranderingen in de omgeving, zodat CPU-gebaseerde softwareverwerking geschikter is dan AI-gebaseerde verwerking.

De uitdaging is dat CPU's met de huidige embedded processors niet volledig in staat zijn om robots in realtime te besturen. Daarom introduceerde Renesas naast de CPU en AI-accelerator (DRP-AI) een dynamisch herconfigureerbare processor (DRP), die complexe verwerking afhandelt. Dit leidde tot de ontwikkeling van heterogene architectuurtechnologie die hogere snelheden en een lager stroomverbruik in AI-MPU's mogelijk maakt door processen op de juiste manier te verdelen en te parallelliseren.

Een DRP voert een toepassing uit terwijl de circuitverbindingsconfiguratie tussen de rekeneenheden in de chip voor elke bewerkingsklok dynamisch wordt gewijzigd volgens de verwerkingsdetails. Aangezien alleen de noodzakelijke rekenkundige circuits werken, zelfs voor complexe verwerking, zijn een lager stroomverbruik en hogere snelheden mogelijk. SLAM (Simultaneously Localization and Mapping) bijvoorbeeld, een van de typische robottoepassingen, is een complexe configuratie die meerdere programmeerprocessen vereist voor robotpositieherkenning in parallel met omgevingsherkenning door vision AI-verwerking.

Renesas demonstreerde de werking van deze SLAM door middel van onmiddellijke programmaschakeling met de DRP en parallelle werking van de AI-accelerator en CPU, wat resulteert in ongeveer 17 keer hogere werksnelheden en ongeveer 12 keer hogere werkingsvermogensefficiëntie dan de ingebedde CPU alleen. Verificatie van de werking- Renesas maakte een prototype van een testchip met deze technologieën en bevestigde dat deze een energie-efficiëntie van 23,9 TOPS per watt van wereldklasse bereikt bij een normale voedingsspanning van 0,8 V voor de AI-versneller en een energie-efficiëntie van 10 TOPS per watt voor de belangrijkste AI-modellen. Het bewees ook dat AI-verwerking mogelijk is zonder ventilator of koellichaam.

Het gebruik van deze resultaten helpt bij het oplossen van de warmteontwikkeling als gevolg van het verhoogde stroomverbruik, wat een van de uitdagingen is bij de implementatie van AI-chips in diverse ingebedde apparaten zoals dienstrobots en automatisch geleide voertuigen. Het aanzienlijk verminderen van de warmteontwikkeling zal bijdragen aan de verspreiding van automatisering in verschillende industrieën, zoals de robotica- en slimme technologiemarkten. Deze technologieën zullen worden toegepast op Renesas?

RZ/V-serie MPU's voor vision AI-toepassingen.