Vogelbilder helfen Algorithmus beim Lernen
Physik-News vom 16.09.2019
Informatiker der Friedrich-Schiller-Universität Jena haben in den vergangenen vier Jahren einen Algorithmus zur sogenannten fein-granularen Objekterkennung entwickelt – ihr Ergebnis legten sie jetzt vor. Als Trainingsplattform wählten sie dafür ein Anwendungsgebiet aus der Natur, nämlich einen internationalen Datensatz mit 200 nordamerikanischen Vogelarten.
Objekte, die sich nur in wenigen Details unterscheiden, erkennen und bestimmen zu können – das ist eine große Herausforderung für die Künstliche Intelligenz (KI). Denn Computersysteme mit dieser Fähigkeit unterstützen den Menschen in vielen Bereichen erheblich. Beispielsweise können sie Biologen die Arbeit erleichtern, indem sie verschiedene Arten einer Klasse in der Tier- und Pflanzenwelt – etwa bei Insekten oder Blumen – automatisch identifizieren. Mit Unterstützung der Deutschen Forschungsgemeinschaft (DFG) haben Informatiker der Friedrich-Schiller-Universität Jena in den vergangenen vier Jahren zu diesem Zweck einen solchen Algorithmus zur sogenannten fein-granularen Objekterkennung entwickelt – ihr Ergebnis legten sie jetzt vor. Als Trainingsplattform wählten sie dafür ebenfalls ein Anwendungsgebiet aus der Natur, nämlich einen internationalen Datensatz mit 200 nordamerikanischen Vogelarten.
Publikation:
Sebastian Hollstein
Vogelbilder helfen Algorithmus beim Lernen
Friedrich-Schiller-Universität Jena
Maschine lernt selbst
„Grundsätzlich benötigen wir für diese Grundlagenforschung einfach eine hohe Anzahl an geeigneten Fotos, um den Algorithmus zu trainieren – denn er lernt selbst“, erklärt Prof. Dr. Joachim Denzler von der Universität Jena die Wahl der Vogeldatenbank. Der Professor für Digitale Bildverarbeitung hatte das Projekt gemeinsam mit seinen Kollegen Dr. Eric Rodner und Dr. Marcel Simon begonnen. „Deshalb sind wir auf solche Datensätze angewiesen. Unser Modell ist dann aber sehr flexibel einsetzbar – es kann zum Beispiel, wenn es entsprechend ausgerichtet wurde, auch verschiedene Automarken anhand des Designs erkennen.“
Das Modell der Jenaer Informatiker konzentriert sich bei der Identifikation auf einzelne Teile der Objekte. Das heißt, es versucht zunächst herauszufinden, wie sich ein Objekt beschreiben lässt. „Dazu teilt es beispielsweise einen Vogel in verschiedene Bereiche ein – also etwa Kopf, Flügel, Füße – und modelliert daraus dann ein Gesamtbild“, erklärt Dimitri Korsch von der Universität Jena, der aktuell gemeinsam mit seinem Kollegen Christoph Theiß an dem Projekt arbeitet. „Um das fehlerfrei zu lernen, muss es immer wieder mit neuen Bildern gefüttert werden, bei denen etwa Vögel unterschiedlicher Größe und in unterschiedlicher Position abgebildet sind. Hat das System verstanden, wie ein Vogel aussieht, dann geht es an die Feinabstimmung.“ Um die Art zweifelsfrei identifizieren zu können, müssen für die einzelnen Bereiche Zusatzinformationen extrahiert werden, wie etwa eine auffällige Musterung des Gefieders oder eine besondere Farbe am Schnabel. „Die Maschine versucht dann, die Teile des Vogels zu detektieren, die für seine Klassifizierung relevant sind“, ergänzt Denzler. „Auch hierfür benötigt sie ein langes Training durch viele verschiedene Abbildungen der entsprechenden Arten.“
Transparente KI
Mit ihrer Methode erreichen die Jenaer Experten eine Erkennungsrate von rund 90 Prozent – ein hervorragender Wert, der bereits Kollegen weltweit auf das Jenaer Modell aufmerksam gemacht hat. Zumal ihr Modell – im Gegensatz zu anderen Systemen dieser Art – nicht einfach nur auswendig lernt und das zu bestimmende Objekt dank riesiger Rechenleistung in kurzer Zeit mit anderen Bildern abgleicht, sondern durch das kontinuierliche Training und den damit verbundenen Lerneffekt tatsächlich verstanden hat, wie es die Vögel unterscheiden kann. Informatiker sprechen dabei vom sogenannten „deep learning“.
Außerdem weist der Algorithmus eine weitere Stärke auf: „Unsere Künstliche Intelligenz ist sehr transparent“, erklärt Denzler. „Wir können jederzeit beobachten, wie sie ihre Entscheidungen trifft und dabei nachvollziehen, wo Fehlerquellen sitzen.“ Bei Einsätzen in der Medizin, etwa bei der Tumorbestimmung, sei das sehr wichtig.
Diese Newsmeldung wurde via Informationsdienst Wissenschaft erstellt.