Kompression der Erregungsmuster von Cochlea-Implantaten

Typ: Fortschritt-Berichte VDI
Erscheinungsdatum: 28.02.2024
Reihe: 10
Band Nummer: 884
Autor: Reemt Hinrichs, M.Sc.
Ort: Hannover
ISBN: 978-3-18-388410-0
ISSN: 0178-9627
Erscheinungsjahr: 2024
Anzahl Seiten: 192
Anzahl Abbildungen: 69
Anzahl Tabellen: 23
Produktart: Buch (paperback, DINA5)

Produktbeschreibung

Cochlea-Implantate sind implantierte Reizprothesen, welche den Hörverlust infolge gewisser Schädigungen des Gehörs zum Teil beheben können. Moderne Signalprozessoren von Cochlea-Implantaten erlauben, unter anderem zur Verbesserung des Hörverstehens, die drahtlose Übertragung von Audiosignalen von externen Geräten (Smartphones, drahtlose Mikrophone, …). Diese Arbeit befasst sich mit spezialisierter Datenkompression für die Erregungsmuster von CochleaImplantaten. Diese hat das Ziel der reduzierten Latenz und Energieaufnahme im Kontext der drahtlosen Übertragung von
Hörinformation in Form von Audiosignalen an Signalprozessoren von Cochlea-Implantaten. Es werden insgesamt vier im Rahmen der Arbeit entwickelte Kompressionsverfahren vorgestellt und evaluiert. Mit Trägern von Cochlea-Implantaten durchgeführte Hörtests belegen die Überlegenheit des untersuchen Ansatzes im Vergleich zur Audiocodierung mittels des Audiocodecs Opus. Verfahren auf Basis rückgekoppelter Autoencoder erzielen latenzfrei bei sehr guter objektiver Sprachverständlichkeit der codierten Erregungsmuster eine sehr geringe Bitrate von 4,67 kbit/s. Hauptresultat ist ein generisches, automatisches Entwurfsverfahren latenzfreier Kompressionsalgorithmen für die Erregungsmuster von CochleaImplantaten.

I N H A LT S V E R Z E I C H N I S
1 Einleitung 1
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Problembeschreibung . . . . . . . . . . . . . . . . . . . . . 3
1.3 Idee und Zielsetzung . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . 6
2 Grundlagen …… 7
2.1 Das Gehör des Menschen . . . . . . . . . . . . . . . . . . . 7
2.1.1 Hörschädigungen . . . . . . . . . . . . . . . . . . . 9
2.2 Cochlea-Implantate . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 Aufbau und Signalverarbeitung . . . . . . . . . . . 10
2.2.2 Leistungsfähigkeit und Stand der Technik . . . . . 17
2.2.3 Objektive Maße des Hörverstehens . . . . . . . . . 20
2.3 Theoretische Grundlagen und Verfahren der Datenkompression . . . . 23
2.3.1 Grundlagen der Wahrscheinlichkeitstheorie . . . . 24
2.3.2 Dichten transformierter Zufallsvariablen . . . . . . 27
2.3.3 Korrelation . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.4 Stochastische Prozesse . . . . . . . . . . . . . . . . . 28
2.3.5 Quellencodierung . . . . . . . . . . . . . . . . . . . 30
2.3.6 Verbesserung der Arithmetischen Codierung . . . 34
2.3.7 Prädiktion . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.8 Quantisierung . . . . . . . . . . . . . . . . . . . . . 38
2.3.9 Differential Puls-Code Modulation . . . . . . . . . 39
2.3.10 Neuronale Netze und Autoencoder . . . . . . . . . 40
2.3.11 Audiocodierung: Stand der Technik . . . . . . . . . 44
2.3.12 Stochastic Perturbation Simultaneous Approximation 46
2.3.13 Sequential Model-Based Algorithm Configuration 47
2.4 Verfahren der Statistik . . . . . . . . . . . . . . . . . . . . . 47
2.4.1 Hypothesentests . . . . . . . . . . . . . . . . . . . . 47
2.4.2 Varianzanalyse . . . . . . . . . . . . . . . . . . . . . 49
2.4.3 Wilcoxon-Vorzeichen-Rangtest . . . . . . . . . . . . 50
3 Entwickelte codierungsstrategien, datensätze sowie beschreibung des hörtests ….. 52
3.1 Der Electrocodec . . . . . . . . . . . . . . . . . . . . . . . . 52
3.2 Verlustlose Kompression der Erregungsmuster mittels künstlicher neuronaler Netze . . . . 57
3.3 Autoencoder . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4 Rückkopplungsautoencoder . . . . . . . . . . . . . . . . . . 65
3.5 Datensätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5.1 Mischung mit Rauschen . . . . . . . . . . . . . . . . 69
3.6 Analyse der Erregungsmuster . . . . . . . . . . . . . . . . 71
3.7 Beschreibung der durchgeführten Hörtests . . . . . . . . . 75
3.7.1 Datengenerierung . . . . . . . . . . . . . . . . . . . 77
3.7.2 Probanden . . . . . . . . . . . . . . . . . . . . . . . 78
3.7.3 Testprozedur . . . . . . . . . . . . . . . . . . . . . . 78
3.7.4 Sprachverständlichkeitstest . . . . . . . . . . . . . . 79
3.7.5 Sprachqualitätstest . . . . . . . . . . . . . . . . . . . 80
4 Ergebnisse ….. 81
4.1 Objektiver Vergleich des Electrocodecs mit dem G.722 . . 81
4.2 Ergebnisse der Hörtests . . . . . . . . . . . . . . . . . . . . 84
4.3 Evaluierung der verlustlosen Kompression . . . . . . . . . 88
4.3.1 Vergleich mit alternativen Kompressionsverfahren 91
4.4 Evaluierung des Autoencoders ohne Rückkopplung . . . . 94
4.4.1 Evaluierung des Rückkopplungsautoencoders . . . 102
4.4.2 Regularisierung . . . . . . . . . . . . . . . . . . . . 111
5 Überlegungen zur optimalität ….. 114
5.1 Grundsätzliches Vorgehen . . . . . . . . . . . . . . . . . . . 116
5.2 Wahrscheinlichkeitsdichtefunktionen nach der DFT . . . . 116
5.3 Die Wahrscheinlichkeitsdichte der Einhüllenden . . . . . . 117
5.3.1 Wahrscheinlichkeitsdichte der Einhüllenden des 22. Bandes . . . . . 119
5.4 Wahrscheinlichkeitsdichte nach der Lautheitswachstumsfunktion . . . . 122
5.5 Wahrscheinlichkeitsverteilung der Bandselektion . . . . . 124
5.6 Weitere notwendige Schritte einer theoretischen Analyse . 126
5.7 Die empirische Bestimmung des Optimalprädiktors und der Entropie der Bandselektion . . . 127
5.8 Datengrundlage . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.8.1 Stationaritätsprüfung . . . . . . . . . . . . . . . . . 128
5.9 Generierung künstlicher Erregungsmuster . . . . . . . . . 129
5.10 Validierung der Schätzung des bedingten Erwartungswerts 130
5.10.1 Prozessmodelle . . . . . . . . . . . . . . . . . . . . . 130
5.10.2 Validierung . . . . . . . . . . . . . . . . . . . . . . . 131
5.10.3 Ergebnisse der Validierung . . . . . . . . . . . . . . 132
5.11 Der Optimalprädiktor der Erregungsmuster für stimmlose Sprache . . . 135
5.12 Die Entropie der Bandselektion . . . . . . . . . . . . . . . . 137
6 Diskussion …..144
6.1 Zukünftige Arbeiten . . . . . . . . . . . . . . . . . . . . . . 148
7 Zusammenfassung ….. 151
8 Anhang 153
8.1 Verteilung der DFT-Koeffizienten von Gaußschem Rauschen … 156
Literatur ….. 159
Veröffentlichungen ….. 173

Keywords: Cochlea-Implantat, Autoencoder, DPCM, Datenkompression, Quellencodierung, Erregungsmuster, Cochlear implant, autoencoder, DPCM, data compression, source coding, stimulation patterns

73,70 € inkl. MwSt.
VDI-Mitgliedspreis:*
66,33 € inkl. MwSt.

* Der VDI-Mitgliedsrabatt gilt nur für Privatpersonen