Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Digitale Plagiate besser aufspüren

19.06.2009
Erster Internationaler Wettbewerb zur Erkennung von Plagiaten in digitalen Dokumenten entschieden: Sieger kommen aus Deutschland und Griechenland

Der im März vom Lehrstuhl "Content Management und Web Technologien" der Fakultät Medien der Bauhaus-Universität Weimar und dem spanischen Natural Language Engineering Lab der Universidad Politécnica de Valencia gemeinsam ausgeschriebene Wettbewerb "1st International Competition on Plagiarism Detection" ist in dieser Woche erfolgreich zu Ende gegangen.

Seit Bestehen des Internets tritt Plagiarismus sehr häufig auf. Plagiate sind zwar vom Menschen sehr gut zu erkennen, die Masse der digitalen Dokumente, die es zu überprüfen gilt, etwa in Schulen, Universitäten und Verlagen, ist jedoch nur auf automatischem Wege zu bewältigen.

Ziel des Wettbewerbs war es, herauszufinden, wie gut aktuelle automatische Plagiat-Erkennungsalgorithmen sind. Hierüber ist bislang sehr wenig bekannt, da es noch keine standardisierten Testumgebungen und keine einheitlichen Qualitätsmaßstäbe für diese Verfahren gibt. Diese notwendigen Rahmenbedingungen werden seit längerem im Bereich Medieninformatik der Bauhaus-Universität Weimar erforscht und wurden von der Arbeitsgruppe um Professor Benno Stein auch für den aktuellen Wettbewerb aufgestellt. Für den in dieser Größe und Form bisher einmaligen Wettbewerb hatten sich insgesamt 21 Teams registriert, 13 von ihnen reichten ihre Ergebnisse ein. Die Plagiats-Experten kamen aus Deutschland, Österreich, Spanien, Italien, Tschechien, den USA, Großbritannien, Nigeria, Südkorea, Israel, Griechenland, Brasilien, Kanada und der Ukraine.

Der Wettbewerb, dem sie sich stellten, unterteilte sich in zwei Aufgaben:

1.
Externe Plagiat-Analyse - Der Vergleich eines verdächtigen Dokumentes mit einer Menge von potentiellen Quelldokumenten, sowie das Auffinden von Stellen in beiden Dokumenten, die plagiiert sind.
2.
Intrinsische Plagiat-Analyse - Vorgegeben wird ein verdächtiges Dokument, in dem potentiell plagiierte Stellen anhand von Auffälligkeiten im Text, wie z.B. Brüchen im Schreibstil, identifiziert werden sollen.

Die zur Verfügung gestellte Textkollektion, der so genannte Korpus, bestand aus mehr als 20.000 verdächtigen Dokumenten und weiteren 20.000 Quelldokumenten. Im Korpus wurden auf der Basis von echtem Text durch einen Zufallsplagiator künstlich Plagiate erzeugt, die dann mit Hilfe der Erkennungsalgorithmen aufgespürt werden mussten. Dabei erzielten die Teilnehmer zum Teil sehr gute Ergebnisse: Der beste Algorithmus in der externen Analyse findet 66 Prozent aller Plagiate, 74 Prozent der gefundenen Plagiate sind richtig. Und selbst bei der sehr viel schwierigeren intrinsischen Analyse fand der Sieger-Algorithmus fast die Hälfte (46 Prozent) aller Plagiate.

Der von Yahoo! Research gesponsorte 1. Preis über 500 Euro für den Gesamtsieger ging an Cristian Grozea (Fraunhofer FIRST - Fraunhofer Institut für Rechnerarchitektur und Softwaretechnik, Berlin), der auch den ersten Platz in der Externen Plagiat-Analyse belegte. Den Sieg in der Kategorie Intrinsische Plagiat-Analyse sicherte sich Efstathios Stamatatos (University of the Aegan, Griechenland).

Mit der Ausrichtung dieses Wettbewerbs stellt die Medieninformatik der Bauhaus-Universität Weimar einmal mehr ihre exzellenten Forschungsleistungen und ihre Vorreiterrolle auf dem Gebiet der digitalen Medien unter Beweis. Dies wurde in der vergangenen Woche mit der Förderungszusage über 7,5 Millionen Euro für den interdisziplinären Forschungsneubau "Digital Bauhaus Lab" durch Bund und Land gewürdigt.

Korpus und Ergebnisse des Wettbewerbs stehen der Öffentlichkeit über den unten genannten Link zur Verfügung. So können sich etwa Käufer von Plagiat-Erkennungs-Software gezielt darüber informieren, was im Allgemeinen von einer solchen Anwendung zu erwarten ist. Wissenschaftler haben nun erstmals einen Vergleichsmaßstab, anhand dessen sie eigene Entwicklungen bewerten können.

Kontakt:
Bauhaus-Universität Weimar
Fakultät Medien
Professur Content Management und Web Technologien
Martin Potthast (Wissenschaftlicher Mitarbeiter)
martin.potthast@uni-weimar.de
Tel.: +49 36 43/58 3720
Für Rückfragen steht Ihnen auch Antje Klahn, Presse- und Öffentlichkeitsarbeit der Fakultät Medien, unter +49 36 43/58 37 06 oder per E-Mail unter antje.klahn@uni-weimar.de jederzeit gern zur Verfügung.
Weitere Informationen:
http://Weitere Informationen unter:
http://www.webis.de/pan-09/competition.php - Informationen zum Wettbewerb
http://www.uni-weimar.de/medieninformatik - Medieninformatik an der Bauhaus-Universität Weimar
http://www.webis.de - Professur content Management und Webtechnologien
http://www.digital-bauhaus-lab.de/ - Informationen zum Digital Bauhaus Lab

Claudia Weinreich | idw
Weitere Informationen:
http://ewww.uni-weimar.de

Weitere Nachrichten aus der Kategorie Förderungen Preise:

nachricht Wirtschaftsmagazin Capital: Platz 1 für wohngesundes Bauen geht an das Ökohaus-Unternehmen Baufritz
18.06.2018 | Bau-Fritz GmbH & Co. KG, seit 1896

nachricht Muskelaufbau im Computer: Internationales Team will Entstehung von Myofibrillen enträtseln
13.06.2018 | Technische Universität Dresden

Alle Nachrichten aus der Kategorie: Förderungen Preise >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: AchemAsia 2019 in Shanghai

Die AchemAsia geht in ihr viertes Jahrzehnt und bricht auf zu neuen Ufern: Das International Expo and Innovation Forum for Sustainable Chemical Production findet vom 21. bis 23. Mai 2019 in Shanghai, China statt. Gleichzeitig erhält die Veranstaltung ein aktuelles Profil: Die elfte Ausgabe fokussiert auf Themen, die für Chinas Prozessindustrie besonders relevant sind, und legt den Schwerpunkt auf Nachhaltigkeit und Innovation.

1989 wurde die AchemAsia als Spin-Off der ACHEMA ins Leben gerufen, um die Bedürfnisse der sich damals noch entwickelnden Iindustrie in China zu erfüllen. Seit...

Im Focus: AchemAsia 2019 will take place in Shanghai

Moving into its fourth decade, AchemAsia is setting out for new horizons: The International Expo and Innovation Forum for Sustainable Chemical Production will take place from 21-23 May 2019 in Shanghai, China. With an updated event profile, the eleventh edition focusses on topics that are especially relevant for the Chinese process industry, putting a strong emphasis on sustainability and innovation.

Founded in 1989 as a spin-off of ACHEMA to cater to the needs of China’s then developing industry, AchemAsia has since grown into a platform where the latest...

Im Focus: Li-Fi erstmals für das industrielle Internet der Dinge getestet

Mit einer Abschlusspräsentation im BMW Werk München wurde das BMBF-geförderte Projekt OWICELLS erfolgreich abgeschlossen. Dabei wurde eine Li-Fi Kommunikation zu einem mobilen Roboter in einer 5x5m² Fertigungszelle demonstriert, der produktionsübliche Vorgänge durchführt (Teile schweißen, umlegen und prüfen). Die robuste, optische Drahtlosübertragung beruht auf räumlicher Diversität, d.h. Daten werden von mehreren LEDs und mehreren Photodioden gleichzeitig gesendet und empfangen. Das System kann Daten mit mehr als 100 Mbit/s und fünf Millisekunden Latenz übertragen.

Moderne Produktionstechniken in der Automobilindustrie müssen flexibler werden, um sich an individuelle Kundenwünsche anpassen zu können. Forscher untersuchen...

Im Focus: First real-time test of Li-Fi utilization for the industrial Internet of Things

The BMBF-funded OWICELLS project was successfully completed with a final presentation at the BMW plant in Munich. The presentation demonstrated a Li-Fi communication with a mobile robot, while the robot carried out usual production processes (welding, moving and testing parts) in a 5x5m² production cell. The robust, optical wireless transmission is based on spatial diversity; in other words, data is sent and received simultaneously by several LEDs and several photodiodes. The system can transmit data at more than 100 Mbit/s and five milliseconds latency.

Modern production technologies in the automobile industry must become more flexible in order to fulfil individual customer requirements.

Im Focus: ALMA entdeckt Trio von Baby-Planeten rund um neugeborenen Stern

Neuartige Technik, um die jüngsten Planeten in unserer Galaxis zu finden

Zwei unabhängige Astronomenteams haben mit ALMA überzeugende Belege dafür gefunden, dass sich drei junge Planeten im Orbit um den Säuglingsstern HD 163296...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Simulierter Eingriff am virtuellen Herzen

18.06.2018 | Veranstaltungen

Künstliche Intelligenz – Schafft der Mensch seine Arbeit ab?

15.06.2018 | Veranstaltungen

Internationale Konferenz zur Asteroidenforschung in Garching

13.06.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Im Fußballfieber: Rittal Cup verspricht Spannung und Spaß

18.06.2018 | Unternehmensmeldung

CD83-Protein ist essentiell für die Kontrolle von Autoimmunreaktionen

18.06.2018 | Biowissenschaften Chemie

Dispensdruckkopf, Netzmodul und neuartiger Batteriespeicher

18.06.2018 | Messenachrichten

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics