Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

HyPlag: Wuppertaler Forscher arbeiten daran, Plagiate zuverlässiger zu erkennen

20.01.2020

Software zur Plagiatserkennung soll dabei unterstützen, wissenschaftliche Arbeiten auf kritische Textstellen wie z.B. nicht markierte Zitate oder fehlende Quellenangaben zu untersuchen. Vereinfacht ausgedrückt geht das so: Das zu überprüfende Dokument wird digitalisiert in das System geladen und automatisch mit vorhandenen Quellen einer oder mehrerer Datenbanken verglichen. In der Praxis stellt sich die Überprüfung als gar nicht so leicht heraus. Wissenschaftler*innen der Universität Wuppertal arbeiten daher an der Entwicklung von „HyPlag“ (Hybrid Plagiarism Detection) – einem System, das leistungsfähiger und zuverlässiger in der Identifikation auffälliger, inhaltlicher Ähnlichkeiten ist.

Beim Einsatz von Softwaresystemen zur Plagiatserkennung müssen Nutzer*innen einiges bedenken. Effektivität und Bedienbarkeit weisen häufig Mängel auf.


Das System „HyPlag“ geht über das reine Auffinden identischer Textstellen hinaus und identifiziert auch auffällige Ähnlichkeiten nicht-textueller Elemente.

Bela Gipp

Liegen die Datenbanken der genutzten Anwendungen zudem auf Servern im Ausland, ist der Einsatz hinsichtlich des Datenschutzes problematisch, denn nicht immer ist klar, was genau mit den Dokumenten passiert oder welche Urheberrechte dabei an die Anbieter abgetreten werden.

„Bei HyPlag geht es zunächst darum, ein System zu entwickeln, das mehr leistet als den reinen Textvergleich. Um Ideen- oder Übersetzungsplagiate in Forschungspublikationen – wie z.B. in Zeitschriftenartikeln, Doktorarbeiten aber auch Stipendien- und Drittmittelanträgen – aufzudecken, müssen auch Bilder, Grafiken, Formeln und Quellenverweise überprüfbar sein“, erklärt Norman Meuschke, Wissenschaftlicher Mitarbeiter am Lehrstuhl für Data & Knowledge Engineering von Prof. Dr. Bela Gipp. Meuschke arbeitet im Rahmen seiner Promotion an der Entwicklung von HyPlag.

... mehr zu:
»Analyse »HyPlag »Plagiate

Auf Basis bestätigter Plagiate hat das System bereits viel gelernt: „Die Erkennung läuft gut“, bewertet Meuschke. HyPlag geht über das reine Auffinden identischer Textstellen hinaus: So ist das System bereits in der Lage, Paraphrasierungen zu erkennen. Außerdem arbeiten die Wissenschaftler derzeit daran, Verfahren zu integrieren, die erkennen, wenn sich der Schreibstil innerhalb eines Dokumentes ändert. „Solche Schreibstiländerungen können ein Hinweis auf nicht deklarierte Textübernahmen sein“, so Meuschke.

Dahinter stecken von den Forschern vorprogrammierte Algorithmen, ebenso wie maschinelle Lernverfahren. Die Benutzer*innen erhalten nach erfolgter Analyse eine Ergebnisübersicht zur schnellen Überprüfung von identifizierten Ähnlichkeiten sowie eine detaillierte Vergleichsansicht, um betroffene Dokumentstellen näher zu betrachten – darin enthalten sind dann eben nicht nur identische Textstellen, auch auffällige Muster in den verwendeten Quellenverweisen oder ein potenziell vorliegender Ideenklau beim Anfertigen einer Grafik wird markiert.

„Die Analyse von nicht-textuellen Merkmalen, wie Quellenverweisen, Abbildungen und auch mathematischen Inhalten, hilft, ein großes Problem aktueller Systeme, die nur den Text analysieren, zu lösen: Übersetzungsplagiate“, erklärt Meuschke. Zu erkennen, dass Text aus einer anderen Sprache übernommen wurde, das war bisher kaum möglich. Auch Formeln würden aktuelle Systeme vollkommen ignorieren, was die Analyse mathematischer Publikationen enorm erschwert.

Mittelfristig soll HyPlag zu einer offenen Plattform entwickelt werden, die als Serviceleistung auch von anderen Universitäten genutzt werden kann. „Ziel ist es, einen unabhängigen Dienst aus öffentlicher Hand bereitzustellen. Damit ließen sich auch die Themen Datenschutz und Urheberrecht besser überblicken“, so Prof. Gipp.

Doch bis es so weit ist, sind noch einige Entwicklungsschritte notwendig, die auch finanziert werden wollen. Meuschke: „Um eine solche Plattform zur Verfügung zu stellen, muss natürlich auch die IT-Infrastruktur passen. Zum Beispiel muss die Sicherheit der Nutzer*innendaten garantiert sein und sehr große Dokumentbestände so verwaltet werden, dass das System zu überprüfende Dokumente schnell mit ihnen vergleichen kann. Außerdem sollte das System leistungsfähig genug sein, um auch zahlreiche gleichzeitige Nutzer*innenanfragen verarbeiten zu können.

Das bedeutet entsprechend viel Arbeit neben der reinen Entwicklung der Erkennungsalgorithmen.“ Um diese Pläne weiter verfolgen zu können, laufen bereits die Anträge für Fördergelder bei der Deutschen Forschungsgemeinschaft (DFG).

„Eine Software alleine kann nie in der Lage sein, über Plagiate zu entscheiden. Aber wir können damit das System anbieten, um eine Expert*innenkommission, die im Verdachtsfall weitere Entscheidungen treffen muss, zu unterstützen und ihre Arbeit um ein Vielfaches zu erleichtern“, betonen Gipp und Meuschke.

Wissenschaftliche Ansprechpartner:

Norman Meuschke
Lehrstuhl für Data & Knowledge Engineering
E-Mail meuschke@uni-wuppertal.de
Telefon 0202/439-1618

Weitere Informationen:

https://purl.org/hyplag
http://www.dke.uni-wuppertal.de

Marylen Reschop | idw - Informationsdienst Wissenschaft
Weitere Informationen:
http://www.uni-wuppertal.de

Weitere Berichte zu: Analyse HyPlag Plagiate

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Textilherstellung für Weltraumantennen startet in die Industrialisierungsphase
28.05.2020 | Fraunhofer-Institut für Silicatforschung ISC

nachricht 3D-Gebärdensprach-Avatar als Sprachassistent zur automatisierten Gebärdenübersetzung
28.05.2020 | Universität Augsburg

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Neuartiges Covid-19-Schnelltestverfahren auf Basis innovativer DNA-Polymerasen entwickelt

Eine Forschungskooperation der Universität Konstanz unter Federführung von Professor Dr. Christof Hauck (Fachbereich Biologie) mit Beteiligung des Klinikum Konstanz, eines Konstanzer Diagnostiklabors und des Konstanzer Unternehmens myPOLS Biotec, einer Ausgründung aus der Arbeitsgruppe für Organische Chemie / Zelluläre Chemie der Universität Konstanz, hat ein neuartiges Covid-19-Schnelltestverfahren entwickelt. Dieser Test ermöglicht es, Ergebnisse in der Hälfte der Zeit zu ermitteln – im Vergleich zur klassischen Polymerase-Ketten-Reaktion (PCR).

Die frühe Identifikation von Patienten, die mit dem neuartigen Coronavirus (SARS-CoV-2) infiziert sind, ist zentrale Voraussetzung bei der globalen Bewältigung...

Im Focus: Textilherstellung für Weltraumantennen startet in die Industrialisierungsphase

Im Rahmen des EU-Projekts LEA (Large European Antenna) hat das Fraunhofer-Anwendungszentrum für Textile Faserkeramiken TFK in Münchberg gemeinsam mit den Unternehmen HPS GmbH und Iprotex GmbH & Co. KG ein reflektierendes Metallnetz für Weltraumantennen entwickelt, das ab August 2020 in die Produktion gehen wird.

Beim Stichwort Raumfahrt werden zunächst Assoziationen zu Forschungen auf Mond und Mars sowie zur Beobachtung ferner Galaxien geweckt. Für unseren Alltag sind...

Im Focus: Biotechnologie: Enzym setzt durch Licht neuartige Reaktion in Gang

In lebenden Zellen treiben Enzyme biochemische Stoffwechselprozesse an. Auch in der Biotechnologie sind sie als Katalysatoren gefragt, um zum Beispiel chemische Produkte wie Arzneimittel herzustellen. Forscher haben nun ein Enzym identifiziert, das durch die Beleuchtung mit blauem Licht katalytisch aktiv wird und eine Reaktion in Gang setzt, die in der Enzymatik bisher unbekannt war. Die Studie ist in „Nature Communications“ erschienen.

Enzyme – in jeder lebenden Zelle sind sie die zentralen Antreiber für biochemische Stoffwechselprozesse und machen dort Reaktionen möglich. Genau diese...

Im Focus: Biotechnology: Triggered by light, a novel way to switch on an enzyme

In living cells, enzymes drive biochemical metabolic processes enabling reactions to take place efficiently. It is this very ability which allows them to be used as catalysts in biotechnology, for example to create chemical products such as pharmaceutics. Researchers now identified an enzyme that, when illuminated with blue light, becomes catalytically active and initiates a reaction that was previously unknown in enzymatics. The study was published in "Nature Communications".

Enzymes: they are the central drivers for biochemical metabolic processes in every living cell, enabling reactions to take place efficiently. It is this very...

Im Focus: Innovative Sensornetze aus Satelliten

In Würzburg werden vier Kleinst-Satelliten auf ihren Start vorbereitet. Sie sollen sich in einer Formation bewegen und weltweit erstmals ihre dreidimensionale Anordnung im Orbit selbstständig kontrollieren.

Wenn ein Gegenstand wie der Planet Erde komplett ohne tote Winkel erfasst werden soll, muss man ihn aus verschiedenen Richtungen ansehen und die...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Gebäudewärme mit "grünem" Wasserstoff oder "grünem" Strom?

26.05.2020 | Veranstaltungen

Dresden Nexus Conference 2020 - Gleicher Termin, virtuelles Format, Anmeldung geöffnet

19.05.2020 | Veranstaltungen

Urban Transport Conference 2020 in digitaler Form

18.05.2020 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Ein wichtiger Schritt zum Neuromorphen Rechnen: richtungsweisende Arbeit aus Dresden

28.05.2020 | Materialwissenschaften

Wieso Radium-Monofluorid den Blick ins Universum fundamental verändern kann

28.05.2020 | Physik Astronomie

Neuartiges Covid-19-Schnelltestverfahren auf Basis innovativer DNA-Polymerasen entwickelt

28.05.2020 | Biowissenschaften Chemie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics