Werbung
Neben dem Aufkommen von GPU Computing ab 2008 sieht NVIDIA auch das Jahr 2012 als eine Art Big Bang der Entwicklung. Erstmals wurden GPUs dazu verwendet, Handschriften zu erkennen und waren dabei besser als der Mensch. Die Fehlerquote fiel weiter unter fünf Prozent und stellte damit einen vorläufigen Höhepunkt dieser Entwicklung dar.
Im gleichen Jahr startet auch die Entwicklung großer Bilddatenbanken, die früher oder später alle Objekte mit denen ein Mensch in Verbindung kommen soll umfassen sollen. AlexNet wurde beispielsweise in Zusammenarbeit mit Amazon erstellt und umfasst 15 Millionen Bilder in einer hierarchischen Struktur. Diese wurden in 2.500 Kategorien zusammengefasst und markiert. Bilder von Lebensmitteln umfassen z.B. Früchte, diese wiederum lassen sich in dutzende Unterkategorien aufteilen und selbst wenn zu einer speziellen Frucht nur ein Foto vorhanden ist, sollen zukünftige Systeme diese auch erkennen, wenn das Foto aus einem anderen Blickwinkel oder zu einem anderen Reifegrad entstanden sind. Diese Systeme lernen also selbst und erweitern ihre Datenbank selbstständig. Sie lernen aus einem Bild auch mehr, als das zentrale Objekt. Sitzt der Vogel beispielsweise auf einem Ast, wird auch das erkennt. Liegt zusätzlich auch noch Schnee, wird auch das erkannt.
Die dazugehörige Visualisierung zeigt ein Netzwerk aus 19 Layern und in jedem Layer befindet sich zehntausende Objekte die untereinander verbunden sind. Hier kommt dann auch die GeForce GTX Titan X ins Spiel, die sowohl die dazu notwenige Rechenleistung als auch einen ausreichend großen Speicher bietet.
Diese Bilddatenbanken sind aber nur ein Beispiel. In der Medizin könnte Deep Learning eine wichtige Rolle spielen, da Sequenzen aus dem menschlichen Genom automatisch analysiert werden können. Autopsien von Gewebeproben auf Krebs könnten ebenfalls besser analysiert werden, wenn diese Analyse automatisch und nicht mehr durch den Menschen erfolgt.
Für Entwickler wurde die Digits Devbox vorgestellt, ein Komplettsystem in dem vier GeForce GTX Titan X arbeiten. Natürlich ebenfalls vorhanden sind alle Hardware-Komponenten für eine Workstation. Die Digits Devbox soll Deep Learning weiter nach vorne bringen und einen einfachen Einstieg ermöglichen. Verfügbar ist sie ab Mai für 15.000 US-Dollar.
Am heutigen Tagen wird auch Google auf der GTC noch zum Thema Deep Learning sprechen und dabei werden sicherlich noch weitere Anwendungsbeispiele und Entwicklungsprognosen eine Rolle Spielen.