Breitbandige Beamforming-Algorithmen zur Erfassung von Audiosignalen mit kompakten Mikrofon-Arrays

Broadband Beamforming Algorithms For Audio Signal Acquisition Using Compact Microphone Arrays

  • Mikrofon-Arrays erlauben die selektive Erfassung und Trennung von Audiosignalen aus einer akustischen Umgebung. Typische Anwendungen sind z.B. die Ortung einzelner Schallquellen, die räumliche Kartierung eines Schallfeldes ("akustische Kamera") oder der gerichtete Empfang einer bestimmten Schallquelle bei gleichzeitiger Unterdrückung von Umgebungs- oder Störschallen. Vielkanalige Verfahren und Filter, die sich dieser Aufgabe widmen, werden als Beamforming bzw. Beamformer bezeichnet. In dieser Dissertation werden bekannte und eigene Beamforming-Ansätze im Hinblick auf ihre Eignung für die hochwertige Übertragung von Audiosignalen untersucht. Diese erfordert neben einer möglichst großen Abdeckung des relevanten Frequenzbereichs (Breitbandigkeit) auch die Frequenzunabhängigkeit der Richtcharakteristik, um spektrale Verzerrungen zu vermeiden. Es wird ein Algorithmus vorgestellt, der diese Anforderungen mit sehr kompakten Arrays erfüllt. Eine klassische Möglichkeit, eine frequenzinvariante Charakteristik (Beampattern) mithilfe eines Delay-and-Sum-Beamformers zu erhalten, ist eine frequenzabhängige Gewichtung der Mikrofone, welche die effektive Apertur des Arrays proportional zur Schallwellenlänge einstellt. Diese Methode funktioniert jedoch nur bei Wellenlängen, die kleiner sind als die Ausdehnung des Arrays, und erfordert bei Frequenzen unter 100Hz Arrays von mehreren Metern Größe. Ein gänzlich anderes Verhalten zeigen differentielle Mikrofonarrays, welche Differenzen aus Signalen benachbarter Mikrofone bilden: In Kombination mit Integratorfiltern erzeugen sie Beampattern, die auch bei sehr kleinen Frequenzen, d.h. bei Wellenlängen, die groß gegen das Array sind, unverändert bleiben (sog. Superdirektivität). Aus diesem Prinzip wurde in dieser Arbeit das Konzept des Multipol-Beamformers entwickelt, der ein gegebenes Soll-Beampattern durch eine Reihenentwicklung nach Sinus- und Kosinusfunktionen (zweidimensionaler Fall) oder Kugelflächenfunktionen (dreidimensionaler Fall) approximiert. Der Multipol-Beamformer erzielt eine hervorragende Richtwirkung bei kleinen Frequenzen, ist jedoch nur über einen sehr begrenzten Bereich frequenzinvariant und erweist sich insbesondere in drei Raumdimensionen als analytisch aufwändig. Flexibler und in zwei wie in drei Raumdimensionen gleichermaßen einfach in der Formulierung ist demgegenüber das in der Literatur zu findende Verfahren des modalen Subraum-Beamformings (Modal Subspace Decomposition, MSD). Dieser Ansatz bestimmt zu einer beliebigen Sensorgeometrie einen Satz orthogonaler Eigen-Beampattern, die dann zu einer Reihenentwicklung des Soll-Beampatterns herangezogen werden. Ähnlich dem erwähnten Delay-and-Sum-Beamformer jedoch erfordert auch dieser Ansatz bei großen Wellenlängen entsprechend groß dimensionierte Arrays und ist nicht superdirektiv. In dieser Arbeit wurde deshalb eine eigene, neue Ausprägung des MSD-Algorithmus formuliert, welche die Superdirektivität des Multipol-Beamformers mit der Flexibilität und Einfachheit des MSD-Verfahrens vereint. Diese als "superdirektives MSD-Beamforming" bezeichnete Methode besitzt - wie das bereits bekannte MSD-Verfahren auch - die interessante Eigenschaft, daß die Eigen-Beampattern für ein frei zu wählendes Entwurfs-Frequenzband berechnet werden, so daß das Verhalten des Beamformers über ein ganzes Frequenzintervall kontrolliert werden kann. Dies eröffnet auch die Möglichkeit eines sehr breitbandigen Beamformings durch Kombination mehrerer Beamformer, die individuell auf benachbarte Frequenzbänder abgestimmt werden. Mit beispielsweise einem hexagonalen Array von nur 6cm Durchmesser und sieben Mikrofonen erreicht der superdirektive Ansatz so ca. 20-30dB Störabstand über einen Frequenzbereich von 100Hz bis 6kHz, was für Sprache eine sehr hohe Übertragungsqualität darstellt. Zur experimentellen Verifikation der untersuchten Algorithmen wurde im Rahmen dieser Arbeit eine vielkanalige Echtzeit-Signalverarbeitungsumgebung unter Windows XP erstellt, welche die Erfassung, Verarbeitung, Analyse und Ausgabe vielkanaliger Audio-Daten erlaubt. Auch eine Simulation idealer Freifeldmessungen an Mikrofonarrays ist damit möglich, indem die Ausbreitung des Schalls von der Schallquelle zu den Mikrofonen durch zeitdiskrete Fractional-Delay-Filter simuliert wird. Dieser Filtertypus wurden im Rahmen dieser Arbeit ebenfalls eingehend untersucht: Für zwei aus der Literatur bekannte Entwurfsverfahren wurden Erweiterungen gefunden, die bei gleicher Filterordnung eine höhere nutzbare Bandbreite erzielen. Für Messungen an realen Arrays wurde die Akustik-Messkammer des Instituts durch zusätzliche Dämmauskleidung für Freifeld-Messungen nutzbar gemacht. Die Messergebnisse belegen, daß die untersuchten Algorithmen in der Praxis erwartungsgemäß funktionieren und daß der gefundene superdirektive MSD-Algorithmus mit sehr kompakten Arrays eine gute breitbandige Erfassung und Trennung von Audiosignalen ermöglicht.
  • Microphone arrays allow for the selective acquisition and separation of audio signals from an acoustic environment. Typical applications include e.g. locating single sound sources, spatial sound field mapping ("acoustic camera") or receiving sound from a desired sound source while suppressing environmental sounds and noises. Multichannel methods and filters performing these tasks are called beamforming and beamformer, respectively. In this work, known beamforming methods as well as approaches developed by the author are discussed with regard to their applicability for the transmission of high-quality audio signals. To achieve this, the algorithm should cover the relevant frequency range as completely as possible (broadband requirement), and should also have a frequency-independent directivity in order to avoid spectral distortions. An algorithm is presented which satisfies these requirements using very compact arrays. One classical approach to obtain a frequency-invariant directivity (beampattern) by means of a delay-and-sum beamformer uses a frequency-dependent weighting of the microphones, which adjusts the effective array aperture in proportion to the sound wavelength. However, this method only works for wavelengths smaller than the size of the array; for frequencies below 100Hz, arrays of several meters in size are necessary. Differential microphone arrays which use difference signals taken from neighbouring microphones show a completely different behaviour: When combined with integrator filters, these arrays produce beampatterns which remain unchanged even at very low frequencies, i.e. at wavelengths larger than the array itself (superdirectivity). From this principle, the concept of multipole beamforming was developed in this work, which approximates a given desired beampattern by an expansion into a series of sine-/cosine-shaped functions (two-dimensional case) or spherical harmonics (three-dimensional case). The multipole beamformer achieves excellent results at low frequencies; however, it is only frequency invariant over a very limited frequency range and is analytically complex especially in the case of three spatial dimensions. In contrast, the method of modal subspace decomposition (MSD) which can be found in the literature is more flexible and its analytical notation in two and three spatial dimensions is equally simple. With respect to an arbitrary sensor geometry given, this method computes a set of orthogonal eigen-beampatterns which then serve as a basis for a series expansion of the desired beampattern. However, like the delay-and-sum beamformer, this approach requires large arrays for large wavelengths and is not superdirective. Thus, in this work a new form of the MSD algorithm was developed by the author, which combines the superdirectivity of the multipole beamformer and the flexibility and notational simplicity of the MSD approach. This so-called "superdirective MSD beamforming" method shares an interesting property of the known MSD approach: The eigen-beampatterns are calculated with respect to a given design frequency band, such that the behaviour of the beamformer is controlled over an entire frequency range. Hence, it is possible to achieve very broadband beamforming by combining multiple beamformers which are individually designed for adjacent frequency bands. Thus, e.g. by using a hexagonal array only 6cm in diameter and comprising seven microphones, the superdirective approach achieves 20dB to 30dB SNR over a frequency range from 100Hz to 6kHz, which is a very high transmission quality for speech. For experimental verification of the discussed algorithms, a multi-channel, real-time signal processing environment based on Windows XP was developed which allows acquisition, processing, analyzing and replaying of multi-channel audio data. Also, ideal free-field measurements on an array can be simulated: For this, the propagation of sound from a sound source to each microphone is simulated by time-discrete fractional-delay filters, which realize arbitrary non-integer time delays. This type of filters was also investigated in this work: For two design methods known in the literature, extensions were found which achieve a higher usable bandwidth at a given filter order. For measurements on real arrays, the acoustical measurement chamber at the institute was prepared by additional sound-absorbing lining. The measurement results show that the discussed algorithms in practice do work as expected, and that the superdirective MSD algorithm presented allows for a good broadband acquisition and spatial separation of audio signals with very compact arrays.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Martin EichlerGND
URN:urn:nbn:de:hebis:30-75187
Referee:Arild Lacroix, Herbert Reininger, R. Hoffmann
Advisor:Arild Lacroix
Document Type:Doctoral Thesis
Language:German
Year of Completion:2009
Year of first Publication:2009
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:Johann Wolfgang Goethe-Universität
Date of final exam:2009/12/15
Release Date:2010/02/23
Tag:Beamforming; Breitbandigkeit; Fractional-Delay-Filter; Mikrofone; Modale Subraum-Zerlegung; Multipole; Superdirektivität; differentielle Arrays
Beamforming; Broadband; Differential Arrays; Fractional Delay Filters; Microphones; Modal Subspace Decomposition; Multipoles; Superdirectivity
GND Keyword:Angewandte Physik; Akustik; Sensor-Array
Page Number:293
HeBIS-PPN:220961301
Institutes:Physik / Physik
Dewey Decimal Classification:5 Naturwissenschaften und Mathematik / 53 Physik / 530 Physik
Licence (German):License LogoDeutsches Urheberrecht