Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     Siemens  n-tv 
Datenbankrecherche:

Fachgebiet (optional):

 

Research Aims to Improve Speech Recognition Software

13.08.2010
Anyone who has used an automated airline reservation system has experienced the promise – and the frustration – inherent in today’s automatic speech recognition technology. When it works, the computer “understands” that you want to book a flight to Austin rather than Boston, for example. Research conducted by Binghamton University’s Stephen Zahorian aims to improve the accuracy of such programs.

Anzeige

Zahorian, a professor of electrical and computer engineering, recently received a grant of nearly half a million dollars from the Air Force Office of Scientific Research. The funds will support the two-year development of a multi-language, multi-speaker audio database that will be available for spoken-language processing research. Zahorian and his team plan to gather and annotate recordings of several hundred speakers each in English, Spanish and Mandarin Chinese.


“The challenge,” he said, “is to get speech recognition working better in real-life situations.”

That’s why the samples in the new database will come from publicly available sources such as YouTube.

Zahorian’s team will annotate each sample, creating a more detailed version of closed captioning, including time stamps and descriptions of background sounds. Once the human listener has finished with the transcription, automatic speech recognition algorithms will be used to align the recording with the captions. Next, software will be developed to verify and correct errors in the time alignment.

“Speech-recognition algorithms begin by mimicking what your ear does,” Zahorian said. “But we want the algorithms to extract just the most useful characteristics of the speech, not all of the possible data. That’s because more detail can actually hurt performance, past a certain point.”

The field of automatic speech recognition has a long history, dating back to projects at Bell Labs before the computer age. These days, much of the technology relies on algorithms that convert sounds into numbers.

In Zahorian’s research, he represents speech as a picture in a time-frequency plane. He then uses image-processing techniques to extract features of the speech, which has led him to focus more on time than on frequency.

When researchers are ready to test an algorithm, they rely on a common set of databases held by the Linguistic Data Consortium. Zahorian’s unusual image-based approach has given his team some of the best results ever reported for automatic speech recognition experiments using two of the consortium’s best-known databases.

The database Zahorian develops with the new funding will join these others, offering researchers around the world a new way to test their theories with samples of real-life speech.

Some mistakes are inevitable, given the variations in pitch, tone and pronunciation from person to person. Still, the field does have a clear standard, Zahorian said: “In order to be useful, a system should have a word-error rate of no more than 10 percent.”

Zahorian is interested in language modeling – if someone has said these three words, what’s the fourth word likely to be? – as well as conversation modeling – that is, predicting when the speakers will switch. He’s also intrigued by the potential to make advances by using established methods from other fields, including the neural networks developed by researchers working in artificial intelligence.

He sees a future in which automatic speech recognition will enable technology to extract the meaning of speech as well as the words.

“The dream,” Zahorian said, “is that someday travelers will be able to speak into a little gadget that will translate what they’ve said into another language instantly and accurately.”

For more Binghamton University research news, visit http://discovere.binghamton.edu/

Gail Glover | Quelle: Newswise Science News
Weitere Informationen: www.binghamton.edu

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Robotics: Gesturing for control
24.05.2012 | The Agency for Science, Technology and Research (A*STAR)

nachricht Researchers take virus-tracking software worldwide
23.05.2012 | Ohio Supercomputer Center

Alle Nachrichten aus der Kategorie Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>


Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Im wahrsten Sinne „Spitzenforschung“: IPHT-Forscher untersuchen Eiweißfasern mit größter Genauigkeit


Krankheiten wie Parkinson, Alzheimer und bestimmte Krebsformen gehen auf eine fehlerhafte Faltung und Aggregation von Eiweißen im Körper zurück.

Wissenschaftlern des Instituts für Photonische Technologien (IPHT) in Jena ist es erstmals gelungen, Proteinstrukturen auf sub-molekularer Ebene nachzuweisen und spektroskopisch zu analysieren. Ein wichtiger Schritt zum Verständnis der Krankheitsursachen.

„Bis heute hat man nicht genau verstanden, was die fehlerhafte Faltung und Aggregation von Eiweißen, zum Beispiel im Zusammenhang mit Alzheimer, ...

Im Focus: Widerspenstiges Quasiteilchen erzeugt


Die Quantenphysik beschreibt physikalische Vorgänge in Festkörpern und anderen Vielteilchensystemen auch mit Hilfe von Quasiteilchen.

Innsbrucker Physikern um Rudolf Grimm ist es nun erstmals gelungen, ein neues Quasiteilchen - ein repulsives Polaron - in einem Quantengas experimentell zu erzeugen. Die Forscher berichten darüber in der Online-Ausgabe der Fachzeitschrift Nature.

Ultrakalte Quantengase sind ein ideales Experimentierfeld, um physikalische Phänomene in Festkörpern zu simulieren. Unter streng kontrollierten Bedingungen ...

Im Focus: Licht lässt Partikel wachsen - Forscher entdecken neuen Mechanismus in der Atmosphäre


Licht lässt die Partikel in der Atmosphäre wachsen. In einem Experiment hat ein internationales Forscherteam erstmals einen neuen Mechanismus nachweisen können, bei dem Partikel durch Licht größer werden und der damit Einfluss auf die Wolkenbildung und das Klima hat.

Photokatalytische Reaktionen können zu einer schnellen Bindung von nicht kondensierenden flüchtigen organischen Kohlenwasserstoffen (VOCs) auf der Oberfläche der Partikel führen. Unter solchen Bedingungen nehme die Größe und Masse der Partikel schnell zu, schreiben die Wissenschaftler im renommierten Fachblatt PNAS.

Die Ergebnisse des Laborexperimentes könnten Effekte erklären, die bisher schon bei Feldkampagnen ...

Im Focus: Abschreckung: Tabak signalisiert angreifenden Zikaden Verteidigungsbereitschaft


Ähnlich wie blutsaugende Insekten prüfen Pflanzenschädlinge ihren Wirt auf Abwehrsignale, bevor sie anfangen zu fressen

Pflanzen bilden wenige Minuten nach Angriff eines Fraßfeindes Jasmonsäure, ein Hormon, das die Verteidigung gegen Insekten in Gange setzt mit der Folge, dass giftige Stoffe wie Nikotin oder Verdauungshemmer in den Blättern akkumulieren.

Wissenschaftler des Max-Planck-Instituts für chemische Ökologie, Jena, haben jetzt herausgefunden, dass Zwergzikaden die Verteidigungsbereitschaft von Tabakpflanzen aufspüren können. ...

Im Focus: Erbgutkopie reist im Protein-Koffer


Wissenschaftlern vom Institut für Physikalische und Theoretische Chemie der Universität Bonn ist es erstmals gelungen, den Transport eines wichtigen Informationsträgers in biologischen Zellen praktisch unmodifiziert in Echtzeit zu filmen.

Die Studie zeigt, wie die so genannte Boten-RNA die Zellkernhülle überwindet und vom Zellkern in das Zytoplasma gelangt. Diese Arbeit ist nun in dem renommierten Journal „Proceedings of the National Academy of Sciences of the USA“ (PNAS) publiziert.

Der Bauplan aller Lebewesen ist in ihrem Erbgut gespeichert. Dieses lagert bei höheren ...

Alle Focus-News des innovations-reports >>>

Anzeige

B2B Suche
Produkt / Dienstleistung
Firma / Organisation

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Aktuell

Energieversorger vor dem Umbruch

24.05.2012 | Studien Analysen

Stem-cell-growing surface enables bone repair

24.05.2012 | Biowissenschaften Chemie

Im wahrsten Sinne „Spitzenforschung“: IPHT-Forscher untersuchen Eiweißfasern mit größter Genauigkeit

24.05.2012 | Biowissenschaften Chemie

VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Veranstaltungen

NieKE Themenforum: Ökonomie - Tierschutz - Lebensmittelsicherheit

24.05.2012 | Veranstaltungsnachrichten

Nachhaltigkeit in der Schifffahrt: Werte vs. Wertschöpfung

24.05.2012 | Veranstaltungsnachrichten

Wissenschaft und Öffentlichkeit

24.05.2012 | Veranstaltungsnachrichten

FindAndHelp