Diese Dissertation behandelt die Konzeption, Implementierung und Analyse eines hierarchischen Verfahrens für die automatische Kameraposeschätzung für komplexe Bildmengen. Unter letzteren sind Mengen von Bildern zu verstehen, die komplizierte Aufnahmekonfigurationen, aber auch eine Kombination von Bildern unterschiedlicher Kameras enthalten können. Mit Ausnahme der Kamerakalibrierung wird keine Zusatzinformation in Form von Daten von Global Positioning System (GPS) oder Inertial Navigation System (INS) sowie über die Aufnahmekonfiguration benutzt. Näherungswerte für die Kamerakalibrierung können oft auch aus den Metadaten der Bilder automatisch abgeleitet und im Rahmen der Kameraposeschätzung weiter verfeinert werden. Neben einer hohen Genauigkeit für die geschätzten Kameraposen liegt der Fokus dieser Forschungsarbeit auf der effizienten Bestimmung einer möglichst vollständigen Bildverknüpfung selbst beim Vorliegen von instabilen Aufnahmekonfigurationen oder großen (geometrischen bzw. radiometrischen) Bildverzerrungen. Instabile Aufnahmekonfigurationen sind charakterisiert durch einen unzureichenden Abstand zwischen den Aufnahmen und werden über die Klassifikation mit einem Random Forest detektiert. Die Reduktion des Aufwandes zur Bestimmung der paarweisen Beziehungen erfolgt auf Grundlage der Bildähnlichkeiten. Letztere werden durch die Einbettung der Merkmalsdeskriptoren in den Hamming-Raum effizient ermittelt. Um eine höhere Genauigkeit und Robustheit zu erzielen, basiert die Kameraposeschätzung auf Scale-Invariant Feature Transform (SIFT) sowie dreifachen Bildverknüpfungen in Form von Triplets. Die Modellierung der Verknüpfungen zwischen den Bildern erfolgt hierzu über einen gewichteten ungerichteten Graphen. Ein iterativer Ansatz formuliert die Ermittlung von geeigneten Bildverknüpfungen als Suche nach einem terminalen minimalen Steinerbaum im Kantengraphen. Während minimale Spannbäume hierzu bereits häufiger eingesetzt wurden, stellt dies die erste praktische Anwendung von Steinerbäumen im Kontext der Kameraposeschätzung dar. Vorhandene Bildschleifen werden über Graphenanalyse detektiert und über zusätzliche Bildverknüpfungen geschlossen. Durch die Schleifenschlüsse erfolgt eine Erhöhung der Genauigkeit der geschätzten Kameraposen. Zuletzt wird die Laufzeit der hierarchischen Vereinigung zur Kameraposenschätzung über die Optimierung der Vereinigungsreihenfolge von Bildern verbessert. Die dazu eingesetzte Suche nach maximaler Paarung im Graphen führt zu Vereinigungen, die einen höheren Parallelisierungsgrad ermöglichen. Das Potential des entwickelten Ansatzes wird anhand von praktischen Experimenten dargestellt. Diese sind auch die Grundlage für eine Analyse der vorgestellten Konzepte. Die Einordnung in den Stand der Forschung erfolgt über den Vergleich mit einigen aktuellen Verfahren für die automatische Kameraposeschätzung.
«Diese Dissertation behandelt die Konzeption, Implementierung und Analyse eines hierarchischen Verfahrens für die automatische Kameraposeschätzung für komplexe Bildmengen. Unter letzteren sind Mengen von Bildern zu verstehen, die komplizierte Aufnahmekonfigurationen, aber auch eine Kombination von Bildern unterschiedlicher Kameras enthalten können. Mit Ausnahme der Kamerakalibrierung wird keine Zusatzinformation in Form von Daten von Global Positioning System (GPS) oder Inertial Navigation System...
»