Nicht in der Übersetzung verloren: KI erhöht Genauigkeit der Gebärdenspracherkennung

Zusätzliche Daten können helfen, subtile Gesten, Handpositionen und Gesichtsausdrücke zu unterscheiden

Die Komplexität der Gebärdensprachen

Gebärdensprachen wurden von Nationen weltweit entwickelt, um dem lokalen Kommunikationsstil zu entsprechen, und jede Sprache besteht aus Tausenden von Zeichen. Dies hat es schwierig gemacht, Gebärdensprachen zu lernen und zu verstehen. Der Einsatz von künstlicher Intelligenz zur automatischen Übersetzung der Zeichen in Worte, bekannt als Gebärdenspracherkennung auf Wortebene, hat nun durch die Arbeit einer von der Osaka Metropolitan University geleiteten Forschungsgruppe eine Genauigkeitssteigerung erfahren.

Es geht um Genauigkeit

Frühere Forschungsmethoden konzentrierten sich darauf, Informationen über die allgemeinen Bewegungen des Zeichners zu erfassen. Die Genauigkeitsprobleme entstanden durch unterschiedliche Bedeutungen, die sich aus den feinen Unterschieden in der Handform und der Beziehung in der Position der Hände und des Körpers ergeben konnten.

Associate Professor Katsufumi Inoue und Associate Professor Masakazu Iwamura von der Graduate School of Informatics arbeiteten mit Kollegen, darunter am Indian Institute of Technology Roorkee, zusammen, um die Genauigkeit der KI-Erkennung zu verbessern. Sie fügten Daten wie Hand- und Gesichtsausdrücke sowie skelettale Informationen über die Position der Hände relativ zum Körper den Informationen über die allgemeinen Bewegungen des Oberkörpers des Zeichners hinzu.

„Wir konnten die Genauigkeit der Gebärdenspracherkennung auf Wortebene im Vergleich zu herkömmlichen Methoden um 10-15 % verbessern“, erklärte Professor Inoue. „Darüber hinaus erwarten wir, dass die von uns vorgeschlagene Methode auf jede Gebärdensprache anwendbar ist, was hoffentlich zu einer verbesserten Kommunikation mit sprech- und hörgeschädigten Menschen in verschiedenen Ländern führen wird.“

Über OMU
Die Osaka Metropolitan University, eine der größten öffentlichen Universitäten Japans, wurde in Osaka gegründet und setzt sich dafür ein, die Zukunft der Gesellschaft durch „Konvergenz des Wissens“ und die Förderung von Forschung auf Weltniveau zu gestalten. Für weitere Forschungsnachrichten besuchen Sie https://www.omu.ac.jp/en/

Originalveröffentlichung
Mizuki Maruyama; Shrey Singh; Katsufumi Inoue; Partha Pratim Roy; Masakazu Iwamura; Michifumi Yoshioka
Zeitschrift: IEEE Access
Artikel Titel: Word-Level Sign Language Recognition With Multi-Stream Neural Networks Focusing on Local Regions and Skeletal Information
Artikel Veröffentlichungsdatum: 11. November 2024
DOI: 10.1109/ACCESS.2024.3494878

Medienkontakt
Yung-Hsiang Kao
Osaka Metropolitan University
E-Mail: koho-ipro@ml.omu.ac.jp

Quelle: EurekAlert!

Gebärdenspracherkennung Gesichtsausdrücke Gestenunterscheidung Handpositionen KI-Genauigkeit Kommunikationszugänglichkeit Künstliche Intelligenz maschinelles Lernen Skelettinformationen Wortebene Übersetzung

Kommentare (0) Cancel reply

Informationstechnologie

Avatare Mit Gefühl: Millionenförderung Für KI-Innovation

Das Forschungsprojekt „Gen-AIvatar – Universelle Erstellung von emotionalen und diversen Avataren durch generative KI“ erhält eine NEXT.IN.NRW-Förderung in Höhe von rund 2 Millionen Euro. Dabei entwickeln Wissenschaftlerinnen und Wissenschaftler der Universität Bonn und der TH Köln gemeinsam mit der MindPort GmbH eine neuartige, KI-gestützte Lösung zur Erzeugung von Emotionen für realistische Avatare. Gen-AIvatar entwickelt innovative und kosteneffiziente Methoden, um lebensechte Avatare zu erstellen. „Besonders wichtig ist uns eine ganzheitliche Animation, bei der Stimme, Körperbewegung, Gestik und Mimik im Einklang sind…

24.09.2025

Informationstechnologie

Neuer Ansatz Für Energieeffizientes Gehirn-Inspiriertes Rechnen

Physiker*innen der Universität Greifswald entwickeln einen innovativen Ansatz für ein deutlich energieeffizienteres Arbeiten von Computern. Ihr Lösungsweg ist inspiriert vom menschlichen Gehirn. Die rasante Entwicklung der Künstlichen Intelligenz (KI) stellt die heutige Computertechnik vor Herausforderungen. Herkömmliche Silizium-Prozessoren stoßen an ihre Grenzen: Sie verbrauchen viel Energie, die Speicher- und Verarbeitungseinheiten sind voneinander getrennt und die Datenübertragung bremst komplexe Anwendungen aus. Da KI-Modelle immer größer werden und riesige Datenmengen verarbeiten müssen, steigt der Bedarf an neuen Rechenarchitekturen. Neben Quantencomputern rücken dabei insbesondere…

15.09.2025

Informationstechnologie

Neues Doktorandennetzwerk CAVECORE Für Roboter-Evaluierung

Wie können wir intelligente und lernfähige Roboter evaluieren? Woher wissen wir, ob solche Roboter gut sind in dem, was sie tun? Mit diesen Fragen beschäftigt sich CAVECORE – ein neues Marie Skłodowska-Curie Doctoral Network, das an der Universität Bremen koordiniert wird. Ab dem 1. September werden sich über einen Zeitraum von vier Jahren insgesamt 15 Promovierende im Rahmen von CAVECORE mit kognitiven Robotern beschäftigen – also mit Robotern, die mittels Sensoren ihre Umgebung erfassen, Informationen verarbeiten und häufig auch mit…

10.09.2025

Informationstechnologie

Fünf Jahre Innovation Für Die Digitale Sicherheit Deutschlands

Fünf Jahre Innovation für Deutschlands digitale SicherheitCyberagentur feiert 5. Geburtstag in Halle (Saale) – Politik, Wissenschaft und Wirtschaft würdigen ErfolgeDie Agentur für Innovation in der Cybersicherheit GmbH (Cyberagentur) hat am 28. August 2025 in Halle (Saale) ihr fünfjähriges Bestehen gefeiert. Mit einem Rückblick auf fünf Jahre Forschungsarbeit, politischen Grußworten und der feierlichen Preisverleihung des Ideenwettbewerbs HAL2025 wurde das Jubiläum zu einem Zeichen für Deutschlands digitale Souveränität von übermorgen. Mit einer festlichen Veranstaltung beging die Cyberagentur ihren 5. Geburtstag. Zahlreiche Gäste…

29.08.2025

Nicht in der Übersetzung verloren: KI erhöht Genauigkeit der Gebärdenspracherkennung

Die Komplexität der Gebärdensprachen

Es geht um Genauigkeit

Kommentare (0) Cancel reply

Meistgelesene Artikel

Verwandte Beiträge

Avatare Mit Gefühl: Millionenförderung Für KI-Innovation

Neuer Ansatz Für Energieeffizientes Gehirn-Inspiriertes Rechnen

Neues Doktorandennetzwerk CAVECORE Für Roboter-Evaluierung

Fünf Jahre Innovation Für Die Digitale Sicherheit Deutschlands

Gefällt Ihnen unser neues Design?