Projekt
Hybride 3D Wiedergabeverfahren für die Akustische Virtuelle Realität
Steckbrief
Eckdaten
- Professur:
- TA
- Fördermittelgeber:
- Förderprogramm:
- Status:
- laufend
- Forschungsgebiet:
- Akustische Virtuelle Realität
Ansprechpartner
Um Beeinträchtigungen des Arbeiten und Lernens in akustischen Umgebungen (insbesondere durch Lärmeinflüsse) in Laborexperimenten erlebbar zu machen und bewerten zu können, müssen diese möglichst realitätsnah wiedergegeben werden können. Die jeweilige virtuelle Umgebung muss dann in Echtzeit auf die Änderung des Menschen (z.B. Position des Hörers, Peilbewegungen, erhöhte und verstärkte Stimmlagen (z.B. Lombard-Effekt)) reagieren können, um natürliche Reaktionen des Menschen innerhalb des akustischen Umfeldes evaluieren zu können. Hierbei spielen die Echtzeitverarbeitung der virtuellen Szene (Positionsanpassung z.B. durch Tracking) und die Anpassung der Wiedergabetechnik (Filteraustausch etc.) essentielle Rollen. Mit derartigen Laborexperimenten könnten dann beispielsweise Forscher aus den Disziplinen der Psychologie und der Arbeitsmedizin Untersuchungen durchführen. Dies ist heute noch nicht annähernd möglich. Stattdessen werden Stimuli offline erzeugt und „abgespielt“, aber nicht in Echtzeit und interaktiv zur Verfügung gestellt. Ein interaktiver Ansatz würde beispielsweise erlauben, Probanden bei ihren "normalen" Tätigkeiten (Lernen, Arbeiten, Lesen, Kommunizieren, Entspannen, etc.) zu untersuchen, wobei die akustischen Stimuli nur Moderatoren der Situation sind. Es darf erwartet werden, dass dadurch ganz andere Einblicke in die tatsächliche Lärmwirkung gewonnen werden als durch direktes Abfragen der Hörempfindung in klassischen Hörversuchen. Insofern besteht ein erheblicher Mangel an technischen Verfahren zur Erzeugung und Wiedergabe von realitätsnahen akustischen Szenen für die Lärmwirkungsforschung. Die Entwicklung moderner visueller Wiedergabeverfahren in Laborumgebungen setzt verstärkt auf dreidimensionale Technik, wie z.B. in Kinos, TV-Geräten oder Anwendungen der Virtuellen Realität (VR) (Brillen, CAVE-Systeme, etc.). Insbesondere in den VR-Systemen ist ein Gefühl des Eintauchens in die VR von essentieller Bedeutung. Neben den visuellen Reizen erfordert dies auch eine Stimulation der auditiven Sinne für ein räumliches Empfinden der akustischen Szene. Um eine virtuelle Umgebung möglichst real erscheinen zu lassen, ist von Vorteil, den Nutzer diese Umgebung ohne zusätzliche, an Ihm angebrachte Geräte betreten zu lassen, so dass diese das Gefühl des Eintauchens in die virtuelle Realität nicht mindern können. Dies legt eine lautsprecherbasierte Wiedergabe der akustischen Stimuli nahe – statt Kopfhörern. Bekannte Verfahren hierfür sind die Wiedergabe binauraler Signale mittels Übersprechkompensation und die Reproduktion des physikalischen Schallfeldes mittels Wellenfeldsynthese (WFS) sowie vektorbasiertes Amplitudenpanning, das die sychoakustischen Effekte der Phantomschallquellen nutzt. Ein weiteres Verfahren ist Ambisonics, das in seiner ursprünglichen Form das physikalische Schallfeld reproduziert, in der Anwendung jedoch abhängig von der gewählten Decodierungsstrategie ebenfalls psychoakustische Effekte nutzt. Die verschiedenen Wiedergabeverfahren bilden bestimmte Aspekte einer Wiedergabe unterschiedlich gut ab. Um nun Quellen in einer virtuellen Realität realistisch wiedergeben zu können, müssen die akustischen Eigenschaften des betreffenden virtuellen Arbeits-oder Lernraums in Form einer Impulsantwort berechnet werden. Hierzu wird in modernen raumakustischen Simulationsprogrammen eine Kombination aus piegelschallquellenberechnung und Ray Tracing benutzt, um ein realistisches Nachhallfeld zu synthetisieren. Die Präzision sowie die Wahrnehmung einer Raumimpulsantwort sind jedoch, je nach zeitlichem Abschnitt dieser, unterschiedlich. So tragen Direktschall und frühe Reflexionen stark zur Lokalisierbarkeit einer Quelle bei, vermitteln einen Eindruck der Quellengeometrie und der Lautheit einer Quelle. Später eintreffende Reflexionen können nicht mehr als einzelne wahrgenommen werden und vermitteln einen Eindruck von Räumlichkeit. Hierbei schätzt der Hörer auch Größe des Raumes und seine Beschaffenheit. All dies sind relevante Komponenten einer Raumsimulation, die hinsichtlich ihrer Wirkung spezifisch simuliert und reproduziert werden müssen, um die optimale CPU-Auslastung, Speicherzugriffe und Updates in interaktiven Systemen zu gewährleiten. Der innovative Ansatz besteht darin, dass die Unterschiede in der Simulationsgenauigkeit der frühen/späten Impulsantwort-Teile im "Rendering", in der Wiedergabegenauigkeit im "3D Audio" und in der Wahrnehmung so ausgenutzt werden sollen, dass für verschiedene zeitliche Abschnitte einer Impulsantwort verschiedene, adäquate Wiedergabeverfahren „hybrid“ genutzt werden. So bieten sich Wiedergabeverfahren wie z.B. dynamische Crosstalk-Cancellation (CTC), die eine gute Lokalisation gewährleisten eher für den früheren Anteil einer Impulsantwort an, während Verfahren mit „umgebenden“ oder „räumlichen“ Klang, wie z.B. Higher-Order Ambisonics (HOA), bevorzugt für den späten Teil einer Impulsantwort verwendet werden, dort aber nicht so fein richtungsaufgelöst arbeiten können. Bei einer Kombination mehrerer Wiedergabeverfahren ist zudem wichtig, einen unhörbaren Übergang zu gewährleisten. Dafür bedarf es mindestens einer Adaption verschiedener Laufzeiten und Lautheiten der Systeme. Neben der Erfassung von Mess- und Simulationsdaten ist auch die Berücksichtigung der Wahrnehmung des Hörers essentiell, um die Leistung der hybriden Systeme erfassen und bewerten zu können ist. Um Mehrdeutigkeiten zu vermeiden und den Hörer auf bestimmte Aspekte hin sensibilisieren zu können, sollen in den Hörversuchen die im „Spatial Audio Quality Inventory“ (SAQI) ermittelten Begrifflichkeiten verwendet werden. Ferner soll der Einfluss des Wiedergaberaumes ermittelt werden, um die Wiedergabe weiter zu optimieren und um die Wiedergabeverfahren in realistischen Umgebungen in nicht perfekt akustisch ausgebauten Labors anwenden zu können. In einem weiteren Schritt sollen frühe Reflexionen des Wiedergaberaumes kompensiert werden können sowie die Möglichkeit einer Nachhallunterdrückung erprobt werden. Abschließend wird das Gesamtsystem in einem umfangreichen Experiment zur Lärmwirkung auf die subjektive Leistungs- und Konzentrationsfähigkeit in einer Arbeits- oder Lernsituation validiert.