Ruferkennung - feste Schwelle oder "alles-was-geht"?
Die Erkennung von Rufen durch einen automatischen Detektor steuert die Auslösung von Aufnahmen. Dieser sogenannte Trigger ist somit eine sehr relevante Eigenschaft eines passiven Detektors. Jedes Geräte-Modell hat dabei eigene Verfahren, diese Aufnahmesteuerung durchzuführen. Einfache Lösungen nutzen einzig die Lautstärke eines Signals zur Steuerung, andere Systeme wählen zusätzlich noch Frequenzparameter oder Flanken im Signal. Mittlerweile wird auch mit KI-Erkennung von Rufen experimentiert. Der batcorder hat einen Algorithmus, ähnlich einer KI, der eine komplexe Signalanalyse durchführt und so solche Signale positiv erkennt, die Fledermauslauten ähnlich sind. Dabei wird zusätzlich eine Energie- oder Amplitudenschwelle verwendet (threshold).
Auswirkungen einer festen Schwelle
Wird im Rahmen der Aufnahmesteuerung eine feste Amplituden-Schwelle verwendet, dann begrenzt dies die Aufnahmereichweite. Je niedriger die Schwelle liegt, also je leiser ein Signal sein darf, desto größer ist die Reichweite. Signale, die unterhalb der Schwelle liegen, werden nicht aufgezeichnet. Kommt es durch Umweltgeräusche zu vielen überschwelligen Signalen, werden ohne weitere Ruferkennung große Datenmengen aufgezeichnet. Insbesondere bei einer wenig intelligenten Ruferkennung ist dies ein Problem. Durch manche Hersteller wird dies mittels einer dynamischen Schwelle kompensiert. Jedoch mit dem großen Nachteil einer deutlich verringerten Reichweite in einer lauteren Umgebung. Beim batcorder gibt es auch Situationen mit falsch-negativen Auslösungen, jedoch bedingt durch die relativ gute Ruferkennung hält sich dies in der Regel in Grenzen.
Durch eine feste Amplituden-Schwelle erlaubt ein Detektor die Angabe einer maximalen Detektionsreichweite - die in der Regel für einzelne Frequenzen getrennt betrachtet wird. Diese Reichweite ist nicht als fester Wert zu verstehen, sondern ist abhängig von der Schallausbreitung und der Ruflautstärke. Höhere Frequenzen werden dabei weniger gut weitergeleitet, da die Dämpfung mit zunehmender Frequenz ansteigt.
Alles aufnehmen, was geht
Ein anderer Ansatz ist es, so wenig restriktiv wie möglich, alles aufzunehmen. Also gänzlich ohne eine Aufnahmeschwelle zu arbeiten. Der Ansatz entstand zuerst mit der Auswertung von Detektoren ohne Trigger für citizen science Projekte (z.B. AudioMoth) - also solchen, die lange Zeit Nachts Ton aufnehmen ohne dass zwingend eine Fledermaus anwesend ist. Die Aufnahmen wurden dann nachträglich, also offline, zuerst mittels etablierter Verfahren und zunehmend mittels KI-basierter Signalerkennung nach positiven Ereignissen durchsucht. Mittlerweile lässt sich diese Technik auch für den Echtzeit-Einsatz realisieren. Durch den Einsatz von Mini-Computern kann dies bei der Erfassung genutzt werden.
Der Rechenaufwand und somit Stromverbrauch ist jedoch deutlich höher als bei anderen Systemen. Die Werte des batcorders mit unter 100mW Leistungsaufnahme bei gleichzeitig ausgeklügeltem Erkennungs-Algorithmus werden wohl auf absehbare Zeit nicht erreicht. Somit stellt die Stromversorgung eine große Herausforderung dar, vor allem dann, wenn dauerhaft erfasst werden soll. Der Anschluß ans Stromnetz ist dabei nur vordergründig eine Lösung, denn hierdurch kann es zu einigen signaltechnischen Nachteilen kommen (Störungen).
Auch wenn dieser Ansatz scheinbar keine Aufnahmeschwelle hat, stimmt dies jedoch nicht. Die bekannten KI-basierten Lösungen nutzen alle eine Bilderkennung, um Rufereignisse zu erkennen. Die Bilderkennung nutzt hierfür Sonagramme. Und bei der Erstellung der Sonagramme wird durch die gewählten Einstellungen automatsich eine Schwelle festgelegt, unterhalb derer Rufe nicht mehr angezeigt werden. Dies liegt daran, dass ein Umfang von 96 dB (die Amplitudenauflösung eines 16bit-Systems) nicht komplett in einem Bild abgebildet werden kann. Man muss Einstellungen für das Sonagramm festelgen, mit denen laute Rufe sinnvoll abgebildet werden und leise Rufe möglichst nicht ausgeblendet werden. Damit ist dann aber auch automatisch eine Schwelle festgelegt.
Mit welchem System zeichnet man mehr Daten auf?
An zahlreichen Standorten wird das System ohne Schwelle mehr Rufe erkennen und aufzeichnen. In wie weit damit aber dann auch eine höhere Aktivitätsmenge aufgezeichnet wird, ist vom Standort abhängig. Hier muss man beachten, dass manche Standorte durch zum Beispiel Vegetationsstrukturen natürliche Schallgrenzen schaffen.
Bei typischen Fragestellungen wie zum Beispiel der Überwachung von Flugstraßen wird durch die fehlende Schwelle eine Fledermaus bereits in größerer Entfernung detektiert. Wenn sich diese Fledermaus dann aber entlang der Flugstraße bewegt, wird sie früher oder später auch vom Detektor mit fester Schwelle erfasst. Damit wird die Aktivität mit beiden Systemen sicher aufgezeichnet. Natürlich muss das Gerät mit Schwelle dabei eine ausreichende Empfindlichkeit haben, so dass auch ein Großteil der Flugwege durch den überwachten Bereich führt.
Fazit
Ungeachtet dessen, dass eine feste und vor allem bekannte Aufnahmereichweite in manchen Situationen nötig ist (z.B. Gondelmonitoring), ergeben sich bei Systemen ohne feste Schwelle, die also auch leiseste Rufe zur Auslösung bringen, nicht zwingend Vorteile im Hinblick auf die Datenlage. An zahlreichen Standorten werden zwar längere Aufnahmen oder mehr Rufe aufgezeichnet, jedoch häufig eben von Individuen, die von einem anderen Detektorsystem mit weniger Rufen und kürzerer Aufnahmedauer ebenso registriert werden. Dies ist besonders an Randstrukturen und an Flugstraßen zu erwarten. Viele Rufe werden sehr leise sein, so dass in Abhängigkeit der Art eine auch nur annähernd sichere Bestimmung nicht mehr zuverlässig möglich ist (siehe hierzu den Beitrag Leise Rufe). Die Schallphysik und ihre Einfluß auf die Ausbreitung von Schallwellen ist nach wie vor entscheidend für eine gute Erfassung.
Für den sinnvollen Einsatz muss nach wie vor auch die Stromproblematik solcher KI-basierten und rechenintensiven Lösungen gelöst werden. Wir haben zum Beispiel basierend auf der iOS/macOS Plattform eine ähnliche Lösung entwickelt. Für diese haben wir eine ausführliche Evaluation der Verteilung der Energieverwendung auf die einzelnen Arbeitsschritte durchgeführt. Trotz hoch-optimierter Algorithmen und spezialisierter Chips, die Apple bereitstellt, ist die durchgehende Erstellung von Sonagrammen ebenso wie die Analyse mit der KI sehr stromintensiv. Insbesondere für die Sonagramm-Erstellung konnten wir den Energiebedarf immerhin um 60% senken durch geschickte Anpassungen. Die KI-Verfahren sind jedoch aufgrund der komplexen Vorgänge nur wenig im Stromhunger zu reduzieren. Hierfür werden beim sinnvollen Einsatz eigentlich hochintegrierte Lösungen benötigt, die einen Großteil der Logik bereits in der Hardware fest implementieren.
Normale Erfassung
Dauermonitoring
Gondelmonitoring
Normale Erfassung