Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Digitale Plagiate besser aufspüren

19.06.2009
Erster Internationaler Wettbewerb zur Erkennung von Plagiaten in digitalen Dokumenten entschieden: Sieger kommen aus Deutschland und Griechenland

Der im März vom Lehrstuhl "Content Management und Web Technologien" der Fakultät Medien der Bauhaus-Universität Weimar und dem spanischen Natural Language Engineering Lab der Universidad Politécnica de Valencia gemeinsam ausgeschriebene Wettbewerb "1st International Competition on Plagiarism Detection" ist in dieser Woche erfolgreich zu Ende gegangen.

Seit Bestehen des Internets tritt Plagiarismus sehr häufig auf. Plagiate sind zwar vom Menschen sehr gut zu erkennen, die Masse der digitalen Dokumente, die es zu überprüfen gilt, etwa in Schulen, Universitäten und Verlagen, ist jedoch nur auf automatischem Wege zu bewältigen.

Ziel des Wettbewerbs war es, herauszufinden, wie gut aktuelle automatische Plagiat-Erkennungsalgorithmen sind. Hierüber ist bislang sehr wenig bekannt, da es noch keine standardisierten Testumgebungen und keine einheitlichen Qualitätsmaßstäbe für diese Verfahren gibt. Diese notwendigen Rahmenbedingungen werden seit längerem im Bereich Medieninformatik der Bauhaus-Universität Weimar erforscht und wurden von der Arbeitsgruppe um Professor Benno Stein auch für den aktuellen Wettbewerb aufgestellt. Für den in dieser Größe und Form bisher einmaligen Wettbewerb hatten sich insgesamt 21 Teams registriert, 13 von ihnen reichten ihre Ergebnisse ein. Die Plagiats-Experten kamen aus Deutschland, Österreich, Spanien, Italien, Tschechien, den USA, Großbritannien, Nigeria, Südkorea, Israel, Griechenland, Brasilien, Kanada und der Ukraine.

Der Wettbewerb, dem sie sich stellten, unterteilte sich in zwei Aufgaben:

1.
Externe Plagiat-Analyse - Der Vergleich eines verdächtigen Dokumentes mit einer Menge von potentiellen Quelldokumenten, sowie das Auffinden von Stellen in beiden Dokumenten, die plagiiert sind.
2.
Intrinsische Plagiat-Analyse - Vorgegeben wird ein verdächtiges Dokument, in dem potentiell plagiierte Stellen anhand von Auffälligkeiten im Text, wie z.B. Brüchen im Schreibstil, identifiziert werden sollen.

Die zur Verfügung gestellte Textkollektion, der so genannte Korpus, bestand aus mehr als 20.000 verdächtigen Dokumenten und weiteren 20.000 Quelldokumenten. Im Korpus wurden auf der Basis von echtem Text durch einen Zufallsplagiator künstlich Plagiate erzeugt, die dann mit Hilfe der Erkennungsalgorithmen aufgespürt werden mussten. Dabei erzielten die Teilnehmer zum Teil sehr gute Ergebnisse: Der beste Algorithmus in der externen Analyse findet 66 Prozent aller Plagiate, 74 Prozent der gefundenen Plagiate sind richtig. Und selbst bei der sehr viel schwierigeren intrinsischen Analyse fand der Sieger-Algorithmus fast die Hälfte (46 Prozent) aller Plagiate.

Der von Yahoo! Research gesponsorte 1. Preis über 500 Euro für den Gesamtsieger ging an Cristian Grozea (Fraunhofer FIRST - Fraunhofer Institut für Rechnerarchitektur und Softwaretechnik, Berlin), der auch den ersten Platz in der Externen Plagiat-Analyse belegte. Den Sieg in der Kategorie Intrinsische Plagiat-Analyse sicherte sich Efstathios Stamatatos (University of the Aegan, Griechenland).

Mit der Ausrichtung dieses Wettbewerbs stellt die Medieninformatik der Bauhaus-Universität Weimar einmal mehr ihre exzellenten Forschungsleistungen und ihre Vorreiterrolle auf dem Gebiet der digitalen Medien unter Beweis. Dies wurde in der vergangenen Woche mit der Förderungszusage über 7,5 Millionen Euro für den interdisziplinären Forschungsneubau "Digital Bauhaus Lab" durch Bund und Land gewürdigt.

Korpus und Ergebnisse des Wettbewerbs stehen der Öffentlichkeit über den unten genannten Link zur Verfügung. So können sich etwa Käufer von Plagiat-Erkennungs-Software gezielt darüber informieren, was im Allgemeinen von einer solchen Anwendung zu erwarten ist. Wissenschaftler haben nun erstmals einen Vergleichsmaßstab, anhand dessen sie eigene Entwicklungen bewerten können.

Kontakt:
Bauhaus-Universität Weimar
Fakultät Medien
Professur Content Management und Web Technologien
Martin Potthast (Wissenschaftlicher Mitarbeiter)
martin.potthast@uni-weimar.de
Tel.: +49 36 43/58 3720
Für Rückfragen steht Ihnen auch Antje Klahn, Presse- und Öffentlichkeitsarbeit der Fakultät Medien, unter +49 36 43/58 37 06 oder per E-Mail unter antje.klahn@uni-weimar.de jederzeit gern zur Verfügung.
Weitere Informationen:
http://Weitere Informationen unter:
http://www.webis.de/pan-09/competition.php - Informationen zum Wettbewerb
http://www.uni-weimar.de/medieninformatik - Medieninformatik an der Bauhaus-Universität Weimar
http://www.webis.de - Professur content Management und Webtechnologien
http://www.digital-bauhaus-lab.de/ - Informationen zum Digital Bauhaus Lab

Claudia Weinreich | idw
Weitere Informationen:
http://ewww.uni-weimar.de

Weitere Nachrichten aus der Kategorie Förderungen Preise:

nachricht Heinz Maier-Leibnitz-Preise 2017: DFG und BMBF zeichnen vier Forscherinnen und sechs Forscher aus
23.02.2017 | Deutsche Forschungsgemeinschaft (DFG)

nachricht Eine Milliarde Euro für die Hochschulmedizin
17.02.2017 | Deutsche Hochschulmedizin e.V.

Alle Nachrichten aus der Kategorie: Förderungen Preise >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: „Vernetzte Autonome Systeme“ von acatech und DFKI auf der CeBIT

Auf der IT-Messe CeBIT vom 20. bis 24. März präsentieren acatech – Deutsche Akademie der Technikwissenschaften und das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) in Kooperation mit der Deutschen Messe AG vernetzte Autonome Systeme. In Halle 12 am Stand B 63 erwarten die Besucherinnen und Besucher unter anderem Roboter, die Hand in Hand mit Menschen zusammenarbeiten oder die selbstständig gefährliche Umgebungen erkunden.

Auf der IT-Messe CeBIT vom 20. bis 24. März präsentieren acatech – Deutsche Akademie der Technikwissenschaften und das Deutsche Forschungszentrum für...

Im Focus: Kühler Zwerg und die sieben Planeten

Erdgroße Planeten mit gemäßigtem Klima in System mit ungewöhnlich vielen Planeten entdeckt

In einer Entfernung von nur 40 Lichtjahren haben Astronomen ein System aus sieben erdgroßen Planeten entdeckt. Alle Planeten wurden unter Verwendung von boden-...

Im Focus: Mehr Sicherheit für Flugzeuge

Zwei Entwicklungen am Lehrgebiet Rechnerarchitektur der FernUniversität in Hagen können das Fliegen sicherer machen: ein Flugassistenzsystem, das bei einem totalen Triebwerksausfall zum Einsatz kommt, um den Piloten ein sicheres Gleiten zu einem Notlandeplatz zu ermöglichen, und ein Assistenzsystem für Segelflieger, das ihnen das Erreichen größerer Höhen erleichtert. Präsentiert werden sie von Prof. Dr.-Ing. Wolfram Schiffmann auf der Internationalen Fachmesse für Allgemeine Luftfahrt AERO vom 5. bis 8. April in Friedrichshafen.

Zwei Entwicklungen am Lehrgebiet Rechnerarchitektur der FernUniversität in Hagen können das Fliegen sicherer machen: ein Flugassistenzsystem, das bei einem...

Im Focus: HIGH-TOOL unterstützt Verkehrsplanung in Europa

Forschung am Karlsruher Institut für Technologie (KIT) unterstützt die Europäische Kommission bei der Verkehrsplanung: Anhand des neuen Modells HIGH-TOOL lässt sich bewerten, wie verkehrspolitische Maßnahmen langfristig auf Wirtschaft, Gesellschaft und Umwelt wirken. HIGH-TOOL ist ein frei zugängliches Modell mit Modulen für Demografie, Wirtschaft und Ressourcen, Fahrzeugbestand, Nachfrage im Personen- und Güterverkehr sowie Umwelt und Sicherheit. An dem nun erfolgreich abgeschlossenen EU-Projekt unter der Koordination des KIT waren acht Partner aus fünf Ländern beteiligt.

Forschung am Karlsruher Institut für Technologie (KIT) unterstützt die Europäische Kommission bei der Verkehrsplanung: Anhand des neuen Modells HIGH-TOOL lässt...

Im Focus: Zinn in der Photodiode: nächster Schritt zur optischen On-Chip-Datenübertragung

Schon lange suchen Wissenschaftler nach einer geeigneten Lösung, um optische Komponenten auf einem Computerchip zu integrieren. Doch Silizium und Germanium allein – die stoffliche Basis der Chip-Produktion – sind als Lichtquelle kaum geeignet. Jülicher Physiker haben nun gemeinsam mit internationalen Partnern eine Diode vorgestellt, die neben Silizium und Germanium zusätzlich Zinn enthält, um die optischen Eigenschaften zu verbessern. Das Besondere daran: Da alle Elemente der vierten Hauptgruppe angehören, sind sie mit der bestehenden Silizium-Technologie voll kompatibel.

Schon lange suchen Wissenschaftler nach einer geeigneten Lösung, um optische Komponenten auf einem Computerchip zu integrieren. Doch Silizium und Germanium...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Aufbruch: Forschungsmethoden in einer personalisierten Medizin

24.02.2017 | Veranstaltungen

Österreich erzeugt erstmals Erdgas aus Sonnen- und Windenergie

24.02.2017 | Veranstaltungen

Big Data Centrum Ostbayern-Südböhmen startet Veranstaltungsreihe

23.02.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Fraunhofer HHI auf dem Mobile World Congress mit VR- und 5G-Technologien

24.02.2017 | Messenachrichten

MWC 2017: 5G-Hauptstadt Berlin

24.02.2017 | Messenachrichten

Auf der molekularen Streckbank

24.02.2017 | Biowissenschaften Chemie