Der beim CSEM entwickelte integrierte Schaltkreis kann komplexe Aufgaben der künstlichen Intelligenz wie das Erkennen von Gesichtern, Stimmen, Gebärden, Herzschlägen usw. übernehmen und lässt sich ganz einfach der gewünschten Anwendung entsprechend konfigurieren. Er läuft mit einer kleinen Batterie oder mit Solarstrom und verarbeitet die Daten lokal.
Die Lebensdauer einer Maschine anhand der Vibrationen voraussagen, denen sie ausgesetzt ist, den Krankheitsverlauf durch die Analyse der Herzschläge der Patientinnen und Patienten überwachen oder Überwachungsgeräte mit einer Gesichtserkennung ausstatten: All das ist dank künstlicher Intelligenz möglich. Bisher verbrauchen aber Systeme, die solch komplexe Aufgaben übernehmen können, viel Energie und müssen ununterbrochen mit der Cloud verbunden sein. Dies wirft Fragen zum Datenschutz, zur Sicherheit und zum Energieverbrauch auf.
Den CSEM-Forscherinnen und ¿Forschern ist es nun gelungen, ein Ein-Chip-System (auch «System-on-Chip» genannt) zu entwickeln, das mit einer kleinen Batterie oder einer Solarzelle betrieben wird und das all diese Aufgaben lokal auf dem Chip erledigen kann, ohne die meist sensiblen Daten übertragen zu müssen. Es handelt sich dabei um ein anpassungsfähiges System, das für alle Anwendungen geeignet ist, die eine Signal- oder Bildanalyse in Echtzeit erfordern. Die Ergebnisse der Forschenden werden im Juni auf dem renommierten VLSI-Symposium in Kyoto vorgestellt.
Die Wissenschaftlerinnen und Wissenschaftler haben eine neue Art der Signalanalyse entwickelt, um den Energieverbrauch so weit wie möglich zu reduzieren. Der Chip (ASIC) enthält einen beim CSEM entwickelten Prozessor (RISC-V), der zwei Beschleuniger steuert, die für die Erkennung und Klassifizierung zuständig sind. Der erste ist ein BDT-Beschleuniger (BDT: Binary Decision Tree), der sehr wenig Energie verbraucht und in der Lage ist, einfache Aufgaben, nicht aber die Erkennung selbst zu übernehmen.
» Im Kontext der Gesichtserkennung wird dieser erste Beschleuniger zum Beispiel einfache Fragen beantworten wie Gibt es hier tatsächlich Menschen? Falls ja, kann man Gesichter sehen? «
erklärt Stéphane Emery, Leiter des System-on-Chip-Teams beim CSEM.
» Wenn wir versuchen, Stimmen zu erkennen, ist er in der Lage festzustellen, ob Geräusche zu hören sind und ob diese Geräusche Stimmen entsprechen. Er kann jedoch keine Personen oder Wörter erkennen, das muss er dem zweiten Beschleuniger überlassen. «
Nur wenn die ersten Fragen mit Ja beantwortet werden, wird der zweite Beschleuniger vom Typ CNN (Convolutional Neural Network) aktiviert. Er verbraucht zwar etwas mehr Energie, bewältigt dafür aber komplexe Aufgaben und ist in der Lage, Gesichter zu erkennen oder Wörter zu unterscheiden. Dank dieser hierarchisch gestalteten Analyse ist der Energiebedarf des Systems sehr gering, da meistens nur der erste Beschleuniger eingeschaltet ist.
Die Forscherinnen und Forscher nutzten zudem ihre Erfahrung, um die Beschleuniger selbst zu optimieren und vor allem, um sie so zu konzipieren, dass sie an alle Arten von Applikationen, die auf der Analyse von Bildern oder zeitlich veränderlichen Signalen basieren, angepasst werden können.
«Die Funktionsweise bleibt stets die gleiche »
sagt Stéphane Emery.
«Wir können die verschiedenen Schichten des CNN-Beschleunigers einfach umkonfigurieren und für den gewünschten Zweck anpassen.»
Quelle:
CSEM, Centre Suisse d’ Electronique et de Microtechnique, June 11, 2021