Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Digitale Plagiate besser aufspüren

19.06.2009
Erster Internationaler Wettbewerb zur Erkennung von Plagiaten in digitalen Dokumenten entschieden: Sieger kommen aus Deutschland und Griechenland

Der im März vom Lehrstuhl "Content Management und Web Technologien" der Fakultät Medien der Bauhaus-Universität Weimar und dem spanischen Natural Language Engineering Lab der Universidad Politécnica de Valencia gemeinsam ausgeschriebene Wettbewerb "1st International Competition on Plagiarism Detection" ist in dieser Woche erfolgreich zu Ende gegangen.

Seit Bestehen des Internets tritt Plagiarismus sehr häufig auf. Plagiate sind zwar vom Menschen sehr gut zu erkennen, die Masse der digitalen Dokumente, die es zu überprüfen gilt, etwa in Schulen, Universitäten und Verlagen, ist jedoch nur auf automatischem Wege zu bewältigen.

Ziel des Wettbewerbs war es, herauszufinden, wie gut aktuelle automatische Plagiat-Erkennungsalgorithmen sind. Hierüber ist bislang sehr wenig bekannt, da es noch keine standardisierten Testumgebungen und keine einheitlichen Qualitätsmaßstäbe für diese Verfahren gibt. Diese notwendigen Rahmenbedingungen werden seit längerem im Bereich Medieninformatik der Bauhaus-Universität Weimar erforscht und wurden von der Arbeitsgruppe um Professor Benno Stein auch für den aktuellen Wettbewerb aufgestellt. Für den in dieser Größe und Form bisher einmaligen Wettbewerb hatten sich insgesamt 21 Teams registriert, 13 von ihnen reichten ihre Ergebnisse ein. Die Plagiats-Experten kamen aus Deutschland, Österreich, Spanien, Italien, Tschechien, den USA, Großbritannien, Nigeria, Südkorea, Israel, Griechenland, Brasilien, Kanada und der Ukraine.

Der Wettbewerb, dem sie sich stellten, unterteilte sich in zwei Aufgaben:

1.
Externe Plagiat-Analyse - Der Vergleich eines verdächtigen Dokumentes mit einer Menge von potentiellen Quelldokumenten, sowie das Auffinden von Stellen in beiden Dokumenten, die plagiiert sind.
2.
Intrinsische Plagiat-Analyse - Vorgegeben wird ein verdächtiges Dokument, in dem potentiell plagiierte Stellen anhand von Auffälligkeiten im Text, wie z.B. Brüchen im Schreibstil, identifiziert werden sollen.

Die zur Verfügung gestellte Textkollektion, der so genannte Korpus, bestand aus mehr als 20.000 verdächtigen Dokumenten und weiteren 20.000 Quelldokumenten. Im Korpus wurden auf der Basis von echtem Text durch einen Zufallsplagiator künstlich Plagiate erzeugt, die dann mit Hilfe der Erkennungsalgorithmen aufgespürt werden mussten. Dabei erzielten die Teilnehmer zum Teil sehr gute Ergebnisse: Der beste Algorithmus in der externen Analyse findet 66 Prozent aller Plagiate, 74 Prozent der gefundenen Plagiate sind richtig. Und selbst bei der sehr viel schwierigeren intrinsischen Analyse fand der Sieger-Algorithmus fast die Hälfte (46 Prozent) aller Plagiate.

Der von Yahoo! Research gesponsorte 1. Preis über 500 Euro für den Gesamtsieger ging an Cristian Grozea (Fraunhofer FIRST - Fraunhofer Institut für Rechnerarchitektur und Softwaretechnik, Berlin), der auch den ersten Platz in der Externen Plagiat-Analyse belegte. Den Sieg in der Kategorie Intrinsische Plagiat-Analyse sicherte sich Efstathios Stamatatos (University of the Aegan, Griechenland).

Mit der Ausrichtung dieses Wettbewerbs stellt die Medieninformatik der Bauhaus-Universität Weimar einmal mehr ihre exzellenten Forschungsleistungen und ihre Vorreiterrolle auf dem Gebiet der digitalen Medien unter Beweis. Dies wurde in der vergangenen Woche mit der Förderungszusage über 7,5 Millionen Euro für den interdisziplinären Forschungsneubau "Digital Bauhaus Lab" durch Bund und Land gewürdigt.

Korpus und Ergebnisse des Wettbewerbs stehen der Öffentlichkeit über den unten genannten Link zur Verfügung. So können sich etwa Käufer von Plagiat-Erkennungs-Software gezielt darüber informieren, was im Allgemeinen von einer solchen Anwendung zu erwarten ist. Wissenschaftler haben nun erstmals einen Vergleichsmaßstab, anhand dessen sie eigene Entwicklungen bewerten können.

Kontakt:
Bauhaus-Universität Weimar
Fakultät Medien
Professur Content Management und Web Technologien
Martin Potthast (Wissenschaftlicher Mitarbeiter)
martin.potthast@uni-weimar.de
Tel.: +49 36 43/58 3720
Für Rückfragen steht Ihnen auch Antje Klahn, Presse- und Öffentlichkeitsarbeit der Fakultät Medien, unter +49 36 43/58 37 06 oder per E-Mail unter antje.klahn@uni-weimar.de jederzeit gern zur Verfügung.
Weitere Informationen:
http://Weitere Informationen unter:
http://www.webis.de/pan-09/competition.php - Informationen zum Wettbewerb
http://www.uni-weimar.de/medieninformatik - Medieninformatik an der Bauhaus-Universität Weimar
http://www.webis.de - Professur content Management und Webtechnologien
http://www.digital-bauhaus-lab.de/ - Informationen zum Digital Bauhaus Lab

Claudia Weinreich | idw
Weitere Informationen:
http://ewww.uni-weimar.de

Weitere Nachrichten aus der Kategorie Förderungen Preise:

nachricht Periimplantitis: BMBF fördert zahnärztliches Verbund-Projekt mit 1,1 Millionen Euro
21.02.2018 | Ernst-Moritz-Arndt-Universität Greifswald

nachricht Eva Luise Köhler Forschungspreis für Seltene Erkrankungen 2018 für Tübinger Neurowissenschaftler
21.02.2018 | Universitätsklinikum Heidelberg

Alle Nachrichten aus der Kategorie: Förderungen Preise >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Verlässliche Quantencomputer entwickeln

Internationalem Forschungsteam gelingt wichtiger Schritt auf dem Weg zur Lösung von Zertifizierungsproblemen

Quantencomputer sollen künftig algorithmische Probleme lösen, die selbst die größten klassischen Superrechner überfordern. Doch wie lässt sich prüfen, dass der...

Im Focus: Developing reliable quantum computers

International research team makes important step on the path to solving certification problems

Quantum computers may one day solve algorithmic problems which even the biggest supercomputers today can’t manage. But how do you test a quantum computer to...

Im Focus: Innovation im Leichtbaubereich: Belastbares Sandwich aus Aramid und Carbon

Die Entwicklung von Leichtbaustrukturen ist eines der zentralen Zukunftsthemen unserer Gesellschaft. Besonders in der Luftfahrtindustrie und in anderen Transportbereichen sind Leichtbaustrukturen gefragt. Sie ermöglichen Energieeinsparungen und reduzieren den Ressourcenverbrauch bei Treibstoffen und Material. Zum Einsatz kommen dabei Verbundmaterialien in der so genannten Sandwich-Bauweise. Diese bestehen aus zwei dünnen, steifen und hochfesten Deckschichten mit einer dazwischen liegenden dicken, vergleichsweise leichten und weichen Mittelschicht, dem Sandwich-Kern.

Aramidpapier ist ein etabliertes Material für solche Sandwichkerne. Sein mechanisches Strukturversagen ist jedoch noch unzureichend erforscht: Bislang fehlten...

Im Focus: Die Brücke, die sich dehnen kann

Brücken verformen sich, daher baut man normalerweise Dehnfugen ein. An der TU Wien wurde eine Technik entwickelt, die ohne Fugen auskommt und dadurch viel Geld und Aufwand spart.

Wer im Auto mit flottem Tempo über eine Brücke fährt, spürt es sofort: Meist rumpelt man am Anfang und am Ende der Brücke über eine Dehnfuge, die dort...

Im Focus: Eine Frage der Dynamik

Die meisten Ionenkanäle lassen nur eine ganz bestimmte Sorte von Ionen passieren, zum Beispiel Natrium- oder Kaliumionen. Daneben gibt es jedoch eine Reihe von Kanälen, die für beide Ionensorten durchlässig sind. Wie den Eiweißmolekülen das gelingt, hat jetzt ein Team um die Wissenschaftlerin Han Sun (FMP) und die Arbeitsgruppe von Adam Lange (FMP) herausgefunden. Solche nicht-selektiven Kanäle besäßen anders als die selektiven eine dynamische Struktur ihres Selektivitätsfilters, berichten die FMP-Forscher im Fachblatt Nature Communications. Dieser Filter könne zwei unterschiedliche Formen ausbilden, die jeweils nur eine der beiden Ionensorten passieren lassen.

Ionenkanäle sind für den Organismus von herausragender Bedeutung. Wenn zum Beispiel Sinnesreize wahrgenommen, ans Gehirn weitergeleitet und dort verarbeitet...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

DFG unterstützt Kongresse und Tagungen - April 2018

21.02.2018 | Veranstaltungen

Tag der Seltenen Erkrankungen – Deutsche Leberstiftung informiert über seltene Lebererkrankungen

21.02.2018 | Veranstaltungen

Digitalisierung auf dem Prüfstand: Hochkarätige Konferenz zu Empowerment in der agilen Arbeitswelt

20.02.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Von Hefe für Demenzerkrankungen lernen

22.02.2018 | Biowissenschaften Chemie

Sektorenkopplung: Die Energiesysteme wachsen zusammen

22.02.2018 | Seminare Workshops

Die Entschlüsselung der Struktur des Huntingtin Proteins

22.02.2018 | Biowissenschaften Chemie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics