Kapitel 9. Personendetektion: Aufbau einer Anwendung
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Wenn du Menschen fragst, welcher ihrer Sinne den größten Einfluss auf ihr tägliches Leben hat, würden viele antworten: das Sehen.1
Das Sehen ist ein äußerst nützlicher Sinn. Es ermöglicht unzähligen natürlichen Organismen, sich in ihrer Umgebung zurechtzufinden, Nahrungsquellen zu finden und Gefahren zu vermeiden. Uns Menschen hilft das Sehvermögen, unsere Freunde zu erkennen, symbolische Informationen zu interpretieren und die Welt um uns herum zu verstehen - ohne dass wir uns zu nahe kommen müssen.
Bis vor kurzem war die Fähigkeit des Sehens für Maschinen noch nicht verfügbar. Die meisten unserer Roboter stöberten lediglich mit Berührungs- und Näherungssensoren in der Welt herum und erfuhren ihre Struktur durch eine Reihe von Kollisionen. Ein Mensch kann dir mit einem Blick die Form, die Eigenschaften und den Zweck eines Objekts beschreiben, ohne dass du mit ihm interagieren musst. Ein Roboter hätte dieses Glück nicht. Visuelle Informationen waren einfach zu unübersichtlich, unstrukturiert und schwer zu interpretieren.
Mit der Entwicklung der Faltungsneuronalen Netze ist es einfach geworden, Programme zu entwickeln, die sehen können. Inspiriert von der Struktur des visuellen Kortex von Säugetieren lernen CNNs, unsere visuelle Welt zu verstehen, indem sie einen überwältigend komplexen Input in ...
Get TinyML now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.