HyPlag: Wuppertaler Forscher arbeiten daran, Plagiate zuverlässiger zu erkennen

Das System „HyPlag“ geht über das reine Auffinden identischer Textstellen hinaus und identifiziert auch auffällige Ähnlichkeiten nicht-textueller Elemente.

Bela Gipp

Beim Einsatz von Softwaresystemen zur Plagiatserkennung müssen Nutzer*innen einiges bedenken. Effektivität und Bedienbarkeit weisen häufig Mängel auf.

Liegen die Datenbanken der genutzten Anwendungen zudem auf Servern im Ausland, ist der Einsatz hinsichtlich des Datenschutzes problematisch, denn nicht immer ist klar, was genau mit den Dokumenten passiert oder welche Urheberrechte dabei an die Anbieter abgetreten werden.

„Bei HyPlag geht es zunächst darum, ein System zu entwickeln, das mehr leistet als den reinen Textvergleich. Um Ideen- oder Übersetzungsplagiate in Forschungspublikationen – wie z.B. in Zeitschriftenartikeln, Doktorarbeiten aber auch Stipendien- und Drittmittelanträgen – aufzudecken, müssen auch Bilder, Grafiken, Formeln und Quellenverweise überprüfbar sein“, erklärt Norman Meuschke, Wissenschaftlicher Mitarbeiter am Lehrstuhl für Data & Knowledge Engineering von Prof. Dr. Bela Gipp. Meuschke arbeitet im Rahmen seiner Promotion an der Entwicklung von HyPlag.

Auf Basis bestätigter Plagiate hat das System bereits viel gelernt: „Die Erkennung läuft gut“, bewertet Meuschke. HyPlag geht über das reine Auffinden identischer Textstellen hinaus: So ist das System bereits in der Lage, Paraphrasierungen zu erkennen. Außerdem arbeiten die Wissenschaftler derzeit daran, Verfahren zu integrieren, die erkennen, wenn sich der Schreibstil innerhalb eines Dokumentes ändert. „Solche Schreibstiländerungen können ein Hinweis auf nicht deklarierte Textübernahmen sein“, so Meuschke.

Dahinter stecken von den Forschern vorprogrammierte Algorithmen, ebenso wie maschinelle Lernverfahren. Die Benutzer*innen erhalten nach erfolgter Analyse eine Ergebnisübersicht zur schnellen Überprüfung von identifizierten Ähnlichkeiten sowie eine detaillierte Vergleichsansicht, um betroffene Dokumentstellen näher zu betrachten – darin enthalten sind dann eben nicht nur identische Textstellen, auch auffällige Muster in den verwendeten Quellenverweisen oder ein potenziell vorliegender Ideenklau beim Anfertigen einer Grafik wird markiert.

„Die Analyse von nicht-textuellen Merkmalen, wie Quellenverweisen, Abbildungen und auch mathematischen Inhalten, hilft, ein großes Problem aktueller Systeme, die nur den Text analysieren, zu lösen: Übersetzungsplagiate“, erklärt Meuschke. Zu erkennen, dass Text aus einer anderen Sprache übernommen wurde, das war bisher kaum möglich. Auch Formeln würden aktuelle Systeme vollkommen ignorieren, was die Analyse mathematischer Publikationen enorm erschwert.

Mittelfristig soll HyPlag zu einer offenen Plattform entwickelt werden, die als Serviceleistung auch von anderen Universitäten genutzt werden kann. „Ziel ist es, einen unabhängigen Dienst aus öffentlicher Hand bereitzustellen. Damit ließen sich auch die Themen Datenschutz und Urheberrecht besser überblicken“, so Prof. Gipp.

Doch bis es so weit ist, sind noch einige Entwicklungsschritte notwendig, die auch finanziert werden wollen. Meuschke: „Um eine solche Plattform zur Verfügung zu stellen, muss natürlich auch die IT-Infrastruktur passen. Zum Beispiel muss die Sicherheit der Nutzer*innendaten garantiert sein und sehr große Dokumentbestände so verwaltet werden, dass das System zu überprüfende Dokumente schnell mit ihnen vergleichen kann. Außerdem sollte das System leistungsfähig genug sein, um auch zahlreiche gleichzeitige Nutzer*innenanfragen verarbeiten zu können.

Das bedeutet entsprechend viel Arbeit neben der reinen Entwicklung der Erkennungsalgorithmen.“ Um diese Pläne weiter verfolgen zu können, laufen bereits die Anträge für Fördergelder bei der Deutschen Forschungsgemeinschaft (DFG).

„Eine Software alleine kann nie in der Lage sein, über Plagiate zu entscheiden. Aber wir können damit das System anbieten, um eine Expert*innenkommission, die im Verdachtsfall weitere Entscheidungen treffen muss, zu unterstützen und ihre Arbeit um ein Vielfaches zu erleichtern“, betonen Gipp und Meuschke.

Norman Meuschke
Lehrstuhl für Data & Knowledge Engineering
E-Mail meuschke@uni-wuppertal.de
Telefon 0202/439-1618

https://purl.org/hyplag
http://www.dke.uni-wuppertal.de

Analyse HyPlag Plagiate

Kommentare (0) Cancel reply

Informationstechnologie

Avatare Mit Gefühl: Millionenförderung Für KI-Innovation

Das Forschungsprojekt „Gen-AIvatar – Universelle Erstellung von emotionalen und diversen Avataren durch generative KI“ erhält eine NEXT.IN.NRW-Förderung in Höhe von rund 2 Millionen Euro. Dabei entwickeln Wissenschaftlerinnen und Wissenschaftler der Universität Bonn und der TH Köln gemeinsam mit der MindPort GmbH eine neuartige, KI-gestützte Lösung zur Erzeugung von Emotionen für realistische Avatare. Gen-AIvatar entwickelt innovative und kosteneffiziente Methoden, um lebensechte Avatare zu erstellen. „Besonders wichtig ist uns eine ganzheitliche Animation, bei der Stimme, Körperbewegung, Gestik und Mimik im Einklang sind…

24.09.2025

Informationstechnologie

Neuer Ansatz Für Energieeffizientes Gehirn-Inspiriertes Rechnen

Physiker*innen der Universität Greifswald entwickeln einen innovativen Ansatz für ein deutlich energieeffizienteres Arbeiten von Computern. Ihr Lösungsweg ist inspiriert vom menschlichen Gehirn. Die rasante Entwicklung der Künstlichen Intelligenz (KI) stellt die heutige Computertechnik vor Herausforderungen. Herkömmliche Silizium-Prozessoren stoßen an ihre Grenzen: Sie verbrauchen viel Energie, die Speicher- und Verarbeitungseinheiten sind voneinander getrennt und die Datenübertragung bremst komplexe Anwendungen aus. Da KI-Modelle immer größer werden und riesige Datenmengen verarbeiten müssen, steigt der Bedarf an neuen Rechenarchitekturen. Neben Quantencomputern rücken dabei insbesondere…

15.09.2025

Informationstechnologie

Neues Doktorandennetzwerk CAVECORE Für Roboter-Evaluierung

Wie können wir intelligente und lernfähige Roboter evaluieren? Woher wissen wir, ob solche Roboter gut sind in dem, was sie tun? Mit diesen Fragen beschäftigt sich CAVECORE – ein neues Marie Skłodowska-Curie Doctoral Network, das an der Universität Bremen koordiniert wird. Ab dem 1. September werden sich über einen Zeitraum von vier Jahren insgesamt 15 Promovierende im Rahmen von CAVECORE mit kognitiven Robotern beschäftigen – also mit Robotern, die mittels Sensoren ihre Umgebung erfassen, Informationen verarbeiten und häufig auch mit…

10.09.2025

Informationstechnologie

Fünf Jahre Innovation Für Die Digitale Sicherheit Deutschlands

Fünf Jahre Innovation für Deutschlands digitale SicherheitCyberagentur feiert 5. Geburtstag in Halle (Saale) – Politik, Wissenschaft und Wirtschaft würdigen ErfolgeDie Agentur für Innovation in der Cybersicherheit GmbH (Cyberagentur) hat am 28. August 2025 in Halle (Saale) ihr fünfjähriges Bestehen gefeiert. Mit einem Rückblick auf fünf Jahre Forschungsarbeit, politischen Grußworten und der feierlichen Preisverleihung des Ideenwettbewerbs HAL2025 wurde das Jubiläum zu einem Zeichen für Deutschlands digitale Souveränität von übermorgen. Mit einer festlichen Veranstaltung beging die Cyberagentur ihren 5. Geburtstag. Zahlreiche Gäste…

29.08.2025

HyPlag: Wuppertaler Forscher arbeiten daran, Plagiate zuverlässiger zu erkennen

Kommentare (0) Cancel reply

Meistgelesene Artikel

Verwandte Beiträge

Avatare Mit Gefühl: Millionenförderung Für KI-Innovation

Neuer Ansatz Für Energieeffizientes Gehirn-Inspiriertes Rechnen

Neues Doktorandennetzwerk CAVECORE Für Roboter-Evaluierung

Fünf Jahre Innovation Für Die Digitale Sicherheit Deutschlands

Gefällt Ihnen unser neues Design?