Loading...
Please wait, while we are loading the content...
Similar Documents
Development of an audio input toolkit for multiple sources
| Content Provider | Semantic Scholar |
|---|---|
| Author | Kosch, Thomas |
| Copyright Year | 2013 |
| Abstract | Audio services, like voice over IP or several voice recognition systems, are developing very fast and since they are easy to use nearly everybody is linked to such systems. In this thesis about the processing of multiple audio inputs, an audio toolkit for processing multiple audio inputs has to be developed. Used audio input devices are bluetooth headsets, which can send audio via UDP to the audio toolkit. This audio toolkit is able to process these multiple audio inputs and determines a dominant signal. The dominant signal is a signal from a specific client with an audio input device. The focus of the audio toolkit is to suppress every other signal than the dominant signal. The dominant signal can then be transferred to a voice over IP service, like Skype, or to a voice recognition system, like the Microsoft Speech API. This thesis gives a general overview how audio processing works, the development of algorithms which determine the dominant signal and the development process. Audio Dienste, wie voice over IP oder Spracherekennungsdienste, haben sich in den letzten Jahrzehnten stark weiterentwickelt. Diese rasante Weiterentwicklung ist einer immer einfacheren Benutzung dieser Dienste zuzuschreiben. In dieser Thesis uber das verarbeiten mehrerer eingehender Audiosignale, soll ein Audio Toolkit entwickelt werden, dass diese eingehenden Audiosignale verarbeitet. Als Eingabegerate werden Bluetooth Headsets verwendet, welche die Audiosignale uber das UDP Protokoll an ein Audio Toolkit ubertragen. Das Audio-Toolkit ermittelt aus allen eingehenden Signalen ein dominantes Signal, welches als einziges horbar sein soll. Ziel dieser Bachelorarbeit ist die Entwicklung des beschriebenen Audio Toolkits. Das dominante Signal kann an einen voice over IP Dienstleister wie beispielsweise Skype oder an eine Sprachererkennungssoftware, wie beispielsweise die Microsoft Speech API, ubertragen werden. Daruber hinaus gibt diese Thesis einen Uberblick uber die Funktionsweise der Soundverarbeitung, Entwicklung geeigneter Algorithmen und dem Entwicklungsprozess. |
| File Format | PDF HTM / HTML |
| DOI | 10.18419/opus-3284 |
| Alternate Webpage(s) | https://elib.uni-stuttgart.de/bitstream/11682/3301/1/BCLR_0051.pdf |
| Alternate Webpage(s) | https://doi.org/10.18419/opus-3284 |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |