Metall-Isolator-Metall (MIM) Kondensatoren gehören zu den wichtigsten passiven Komponenten in Hochfrequenzbauelementen und Schaltkreisen für Analog/Mischsignale. Unabhängig von der Anwendung beanspruchen MIM-Kondensatoren bis zu 50 % der Chipfläche. Dies unterstützt maßgeblich die Chipfläche zu reduzieren, die stark die Kosten aber auch die Funktionalität und Leistung des Chip bestimmt. Eine Steigerung der Kapazität pro Fläche (Kapazitätsdichte) ist aus diesem Grund der Schwerpunkt bei der weiteren analogen Skalierung von Bauelementen. Weil die Kapazität eine direkte Funktion der Dielektrizitätskonstante des Isolators ist, ist das Ersetzen des gegenwärtig genutzten Siliziumoxid oder Siliziumnitrid durch alternative Dielektrika mit höheren Dielektrizitätskonstanten ein vielversprechender Ansatz. Die vorliegende Arbeit ist hauptsächlich auf die Präparation und Charakterisierung solcher alternativer Dielektrika, wie HfO2, Sr-Ta-O und Ti-Ta-O sowie dazugehöriger TiN-Elektroden gerichtet. Die durchgeführten Untersuchungen zeigten, dass diese Dielektrika aussichtsreiche Materialien für zukünftige siliziumbasierte Technologien darstellen können. <dt.>
Metall-Isolator-Metall (MIM) Kondensatoren gehören zu den wichtigsten passiven Komponenten in Hochfrequenzbauelementen und Schaltkreisen für Analog/Mischsignale. Unabhängig von der Anwendung beanspruchen MIM-Kondensatoren bis zu 50 % der Chipfläche. Dies unterstützt maßgeblich die Chipfläche zu reduzieren, die stark die Kosten aber auch die Funktionalität und Leistung des Chip bestimmt. Eine Steigerung der Kapazität pro Fläche (Kapazitätsdichte) ist aus diesem Grund der Schwerpunkt bei der weiteren analogen Skalierung von Bauelementen. Weil die Kapazität eine direkte Funktion der Dielektrizitätskonstante des Isolators ist, ist das Ersetzen des gegenwärtig genutzten Siliziumoxid oder Siliziumnitrid durch alternative Dielektrika mit höheren Dielektrizitätskonstanten ein vielversprechender Ansatz. Die vorliegende Arbeit ist hauptsächlich auf die Präparation und Charakterisierung solcher alternativer Dielektrika, wie HfO2, Sr-Ta-O und Ti-Ta-O sowie dazugehöriger TiN-Elektroden gerichtet. Die durchgeführten Untersuchungen zeigten, dass diese Dielektrika aussichtsreiche Materialien für zukünftige siliziumbasierte Technologien darstellen können. <dt.>
Metal-Insulator-Metal (MIM) capacitors are one of the most essential passive components in radio frequency devices and analog/mixed-signal integrated circuits. However, depending on the applications, MIM capacitors can require up to 50 % of the chip area. This strongly affects the ability to reduce the size of the chips, but the reduction and downscaling of the chips are crucial in order to reduce the cost, and therefore increase the functionality and performance of the devices. To achieve a higher capacitance per unit area for providing the analog scaling is the main objective. Since capacitance is a direct function of the dielectric constant of the insulator, the replacement of currently used silicon oxide or silicon nitride films with the new alternative dielectrics which have higher permittivity values is a very promising approach. The work is focused on the preparation and characterization of alternative dielectrics, namely HfO2, SrTaO and TiTaO as well as of TiN electrode. The study showed that these dielectrics are very promising materials for future Si based technologies. <engl.>
Es werden Methoden für eine effiziente Kodierung natürlicher Töne vorgeschlagen, die auf dem Konzept der "spärlichen Kodierung" basieren, ein Hauptmechanismus in der neurosensorischen Informationsverarbeitung. Eine verbesserte Audioqualität, insbesondere bei niedrigen Bitraten, wurde in dem Audiokodierungsverfahren MPEG-2/4 AAC erreicht durch den Austausch der modifizierten diskrete Kosinustransformation (MDCT) durch ein verschiebungsinvariantes spärliches Signalmodel (Matching Pursuit). Es konnte gezeigt werden, dass die Anzahl M>100 Gammatonfiltern (2.4 Filter pro ERB) eine fast perfekte Rekonstruktion des Signalraumes der natürlichen Töne ermöglicht. Weiterhin wird gezeigt, wie mittels Signifikanzbäumen eine effektive Kodierung spärlicher Koeffizienten erreicht werden kann. Unter Verwendung einer datenabhängigen Menge von Signifikanzbäumen kann dieses Kodierungskonzept den hochmodernen Audiokodierer MPEG-2/4 für Bitraten unterhalb von 32 kbps übertreffen, während es zusätzlich eine feinabgestimmte Bitratenskalierbarkeit ermöglicht. <dt.>
In this dissertation, methods for an efficient coding of natural sounds are proposed that are based on the concept of "sparse coding" which has been identified as one major mechanism involved in the neurosensory information processing. An improved perceived audio quality, especially at low bitrates, was achieved by replacing in the MPEG-2/4 AAC audio coding scheme the modified discrete cosine transform (MDCT) with a shift-invariant sparse signal model (matching pursuit). It is further shown that the number M>100 of gammatone filters (2.4 filters per ERB) leads to a near-perfect reconstruction of the signal space of natural sounds. Finally it is demonstrated how a set of significance trees can be used to achieve an effective encoding of sparse coefficients. Using a data-dependent set of significance trees, the proposed coding scheme outperforms the state-of-the-art audio coding scheme MPEG-2/4 AAC for bitrates less than 32 kbps while additionally offering the property of fine-grain bitrate scalability. <engl.>
Menschen verfügen über die Fähigkeit, Schallquellen blind zu orten und sich in einem Stimmengewirr spezifisch auf einen Sprecher zu konzentrieren und dessen Sprache dadurch zu verstehen. Ein wichtiger Grund für dafür ist die Fähigkeit des Hörsystems, die Signale von linkem und rechtem Ohr zu vergleichen. Diese interauralen Unterschiede sind zum einen Zeit- bzw. Phasendifferenzen und zum anderen interaurale Pegeldifferenzen. Im Standardmodell von Jeffress (1948) wird von einem internen Kreuzkorrelator mit zwei gegenläufigen Ketten von Verzögerungselementen ausgegangen. Neue neurophysiologische aber auch psychoakustische Studien sprechen jedoch gegen die Existenz von Verzögerungsketten in Säugetieren. In dieser Arbeit wird ein effektives binaurales Modell auf Basis von instantanem Phasenvergleich an Stelle von Verzögerungsketten entwickelt. Unter einem effektiven Modell ist eine Abfolge aus elementaren Signalverarbeitungsschritten zu verstehen, wobei das Signal keine konkrete Realisierung beschreibt, sondern die übertragene Information quantifiziert. <dt.>
Humans have the ability to blindly localize sound sources. In a babble of concurrent talkers they can focus on one specific talker and understand his or her speech. One important reason for this is the ability of the human auditory system to estimate interaural differences by comparing signals from the left and the right ear. Differences between the ears exist in either timing or level. The standard model for time difference detection from Jeffress (1948) is based on an internal cross-correlator with two counterdirective chains of delay elements. In contrast recent neurophysiologic but also psychoacoustic studies indicate that chains of delay elements do not exist in mammals. In this thesis an effective binaural processing model is presented which is based on instantaneous phase comparison instead of delay compensation. An effective model is a chain of signal processing elements, with the philosophy not to model a specific neural realization but rather to quantify the transmitted information. <engl.>
Menschen verfügen über die Fähigkeit, Schallquellen blind zu orten und sich in einem Stimmengewirr spezifisch auf einen Sprecher zu konzentrieren und dessen Sprache dadurch zu verstehen. Ein wichtiger Grund für dafür ist die Fähigkeit des Hörsystems, die Signale von linkem und rechtem Ohr zu vergleichen. Diese interauralen Unterschiede sind zum einen Zeit- bzw. Phasendifferenzen und zum anderen interaurale Pegeldifferenzen. Im Standardmodell von Jeffress (1948) wird von einem internen Kreuzkorrelator mit zwei gegenläufigen Ketten von Verzögerungselementen ausgegangen. Neue neurophysiologische aber auch psychoakustische Studien sprechen jedoch gegen die Existenz von Verzögerungsketten in Säugetieren. In dieser Arbeit wird ein effektives binaurales Modell auf Basis von instantanem Phasenvergleich an Stelle von Verzögerungsketten entwickelt. Unter einem effektiven Modell ist eine Abfolge aus elementaren Signalverarbeitungsschritten zu verstehen, wobei das Signal keine konkrete Realisierung beschreibt, sondern die übertragene Information quantifiziert. <dt.>
HochschulschriftNichtgleichgewichtsthermodynamikHauptsatz der Thermodynamik 2QuantenmechanikQuantenphysikIrreversibler ProzessThermodynamik
Die Jarzynskigleichung gehört zu einer Reihe neuer Theoreme der Nichtgleichgewichtsthermodynamik. Es handelt sich um eine Gleichung, die den zweiten Hauptsatz der Thermodynamik enthält, jedoch darüber hinaus geht. Sie bringt auch Prozessgrößen von gleichgewichtsfernen Prozessen mit Gleichgewichtsgrößen in einen neuen Zusammenhang. Gerade bei kleinen Systemen bleibt jedoch Frage nach der Gültigkeit der Gleichung für den Quantenfall. Im Gegensatz zu klassischen Systemen herrscht gerade hier Unklarheit und es gibt sehr widersprüchliche Aussagen, die auf unterschiedlichen Definitionen und quantenmechanischen Interpretationen der Gleichung fußen. Einfache verständnisfördernde Beispielsysteme fehlten bisher. In dieser Arbeit werden nun zwei solcher Beispielsysteme betrachtet. und überprüft, wie sich die Ergebnisse von den klassischen Resultaten unterscheiden und welche der besonderen Eigenschaften von Quantensystemen einen Einfluss auf das Ergebnis haben. <dt.>
The Jarzynski equation is one of several new theorems of nonequilibrium thermodynamics. This equation makes a more severe statement than the second law of thermodynamics. It does also relate process quantities from processes far from equilibrium to equilibrium quantities. However, especially according to small systems the question of the validity of the equation in the quantum case emerges. Though meanwhile quite comprehensive proofs concerning classical systems have been found, for that case uncertainty and contradictory statements exist, founding on different definitions and interpretations of the quantum analogon of expressions of the equation. Simple examples on which the different approaches can be testet, are so far missing. In this work two such examples are investigated and it is examined, how the results differ from their classical counterparts and which properties of quantum systems influence the result. <engl.>
Ziel der vorliegenden Dissertation ist die Analyse und Verbesserung automatischer Spracherkennung (ASR). Da das menschliche auditorische System heutigen ASR-System weit überlegen ist, wurde zunächst die Erkennungsleistung von Mensch und Maschine verglichen. Aus den spezifischen Unterschieden wurden Rückschlüsse auf Signalverarbeitungsmechanismen gezogen, die zu einer Verbesserung von ASR führen. Beim Vergleich wurde insbesondere der Einfluss intrinsischer Variabilität (Änderungen der Sprachrate, des Sprachaufwands und -stils, sowie Dialekt und Akzent) evaluiert. Die Ergebnisse belegen, dass die Verarbeitung zeitlicher Merkmale in ASR Optimierungspotential birgt. Daher wurden spektro-temporale Merkmale für ASR eingesetzt, mit denen bei verändertem Sprachaufwand und variierender Sprechweise eine Verbesserung gegenüber Standardmerkmalen erzielt wurde; dies belegt die Nützlichkeit spektro-temporaler und temporaler Information für automatische Erkenner. <dt.>
The aim of this thesis is the analysis and improvement of automatic speech recognition (ASR). Since the human auditory system outperforms current ASR systems in almost all conditions, the recognition performance of man and machine was compared in a first step. Based on the differences, the signal processing mechanisms were identified that are suitable to increase the robustness of ASR. The comparison focused on the influence of intrinsic variations of speech, i.e., changes in speaking rate, effort and style, as well as dialect and accent. The results show that the processing of temporal cues in ASR bears room for improvement. Therefore, spectro-temporal features were employed for ASR, which resulted in an increase of recognition performance for varying speaking effort and speaking style compared to standard features. This documents the usefulness of spectro-temporal and temporal information for automatic recognizers. <engl.>