Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Digitale Plagiate besser aufspüren

19.06.2009
Erster Internationaler Wettbewerb zur Erkennung von Plagiaten in digitalen Dokumenten entschieden: Sieger kommen aus Deutschland und Griechenland

Der im März vom Lehrstuhl "Content Management und Web Technologien" der Fakultät Medien der Bauhaus-Universität Weimar und dem spanischen Natural Language Engineering Lab der Universidad Politécnica de Valencia gemeinsam ausgeschriebene Wettbewerb "1st International Competition on Plagiarism Detection" ist in dieser Woche erfolgreich zu Ende gegangen.

Seit Bestehen des Internets tritt Plagiarismus sehr häufig auf. Plagiate sind zwar vom Menschen sehr gut zu erkennen, die Masse der digitalen Dokumente, die es zu überprüfen gilt, etwa in Schulen, Universitäten und Verlagen, ist jedoch nur auf automatischem Wege zu bewältigen.

Ziel des Wettbewerbs war es, herauszufinden, wie gut aktuelle automatische Plagiat-Erkennungsalgorithmen sind. Hierüber ist bislang sehr wenig bekannt, da es noch keine standardisierten Testumgebungen und keine einheitlichen Qualitätsmaßstäbe für diese Verfahren gibt. Diese notwendigen Rahmenbedingungen werden seit längerem im Bereich Medieninformatik der Bauhaus-Universität Weimar erforscht und wurden von der Arbeitsgruppe um Professor Benno Stein auch für den aktuellen Wettbewerb aufgestellt. Für den in dieser Größe und Form bisher einmaligen Wettbewerb hatten sich insgesamt 21 Teams registriert, 13 von ihnen reichten ihre Ergebnisse ein. Die Plagiats-Experten kamen aus Deutschland, Österreich, Spanien, Italien, Tschechien, den USA, Großbritannien, Nigeria, Südkorea, Israel, Griechenland, Brasilien, Kanada und der Ukraine.

Der Wettbewerb, dem sie sich stellten, unterteilte sich in zwei Aufgaben:

1.
Externe Plagiat-Analyse - Der Vergleich eines verdächtigen Dokumentes mit einer Menge von potentiellen Quelldokumenten, sowie das Auffinden von Stellen in beiden Dokumenten, die plagiiert sind.
2.
Intrinsische Plagiat-Analyse - Vorgegeben wird ein verdächtiges Dokument, in dem potentiell plagiierte Stellen anhand von Auffälligkeiten im Text, wie z.B. Brüchen im Schreibstil, identifiziert werden sollen.

Die zur Verfügung gestellte Textkollektion, der so genannte Korpus, bestand aus mehr als 20.000 verdächtigen Dokumenten und weiteren 20.000 Quelldokumenten. Im Korpus wurden auf der Basis von echtem Text durch einen Zufallsplagiator künstlich Plagiate erzeugt, die dann mit Hilfe der Erkennungsalgorithmen aufgespürt werden mussten. Dabei erzielten die Teilnehmer zum Teil sehr gute Ergebnisse: Der beste Algorithmus in der externen Analyse findet 66 Prozent aller Plagiate, 74 Prozent der gefundenen Plagiate sind richtig. Und selbst bei der sehr viel schwierigeren intrinsischen Analyse fand der Sieger-Algorithmus fast die Hälfte (46 Prozent) aller Plagiate.

Der von Yahoo! Research gesponsorte 1. Preis über 500 Euro für den Gesamtsieger ging an Cristian Grozea (Fraunhofer FIRST - Fraunhofer Institut für Rechnerarchitektur und Softwaretechnik, Berlin), der auch den ersten Platz in der Externen Plagiat-Analyse belegte. Den Sieg in der Kategorie Intrinsische Plagiat-Analyse sicherte sich Efstathios Stamatatos (University of the Aegan, Griechenland).

Mit der Ausrichtung dieses Wettbewerbs stellt die Medieninformatik der Bauhaus-Universität Weimar einmal mehr ihre exzellenten Forschungsleistungen und ihre Vorreiterrolle auf dem Gebiet der digitalen Medien unter Beweis. Dies wurde in der vergangenen Woche mit der Förderungszusage über 7,5 Millionen Euro für den interdisziplinären Forschungsneubau "Digital Bauhaus Lab" durch Bund und Land gewürdigt.

Korpus und Ergebnisse des Wettbewerbs stehen der Öffentlichkeit über den unten genannten Link zur Verfügung. So können sich etwa Käufer von Plagiat-Erkennungs-Software gezielt darüber informieren, was im Allgemeinen von einer solchen Anwendung zu erwarten ist. Wissenschaftler haben nun erstmals einen Vergleichsmaßstab, anhand dessen sie eigene Entwicklungen bewerten können.

Kontakt:
Bauhaus-Universität Weimar
Fakultät Medien
Professur Content Management und Web Technologien
Martin Potthast (Wissenschaftlicher Mitarbeiter)
martin.potthast@uni-weimar.de
Tel.: +49 36 43/58 3720
Für Rückfragen steht Ihnen auch Antje Klahn, Presse- und Öffentlichkeitsarbeit der Fakultät Medien, unter +49 36 43/58 37 06 oder per E-Mail unter antje.klahn@uni-weimar.de jederzeit gern zur Verfügung.
Weitere Informationen:
http://Weitere Informationen unter:
http://www.webis.de/pan-09/competition.php - Informationen zum Wettbewerb
http://www.uni-weimar.de/medieninformatik - Medieninformatik an der Bauhaus-Universität Weimar
http://www.webis.de - Professur content Management und Webtechnologien
http://www.digital-bauhaus-lab.de/ - Informationen zum Digital Bauhaus Lab

Claudia Weinreich | idw
Weitere Informationen:
http://ewww.uni-weimar.de

Weitere Nachrichten aus der Kategorie Förderungen Preise:

nachricht Millionen für die Krebsforschung
20.09.2017 | Julius-Maximilians-Universität Würzburg

nachricht Ausschreibung des Paul-Martini-Preises 2018 für klinische Pharmakologie
19.09.2017 | Paul-Martini-Stiftung (PMS)

Alle Nachrichten aus der Kategorie: Förderungen Preise >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Hochpräzise Verschaltung in der Hirnrinde

Es ist noch immer weitgehend unbekannt, wie die komplexen neuronalen Netzwerke im Gehirn aufgebaut sind. Insbesondere in der Hirnrinde der Säugetiere, wo Sehen, Denken und Orientierung berechnet werden, sind die Regeln, nach denen die Nervenzellen miteinander verschaltet sind, nur unzureichend erforscht. Wissenschaftler um Moritz Helmstaedter vom Max-Planck-Institut für Hirnforschung in Frankfurt am Main und Helene Schmidt vom Bernstein-Zentrum der Humboldt-Universität in Berlin haben nun in dem Teil der Großhirnrinde, der für die räumliche Orientierung zuständig ist, ein überraschend präzises Verschaltungsmuster der Nervenzellen entdeckt.

Wie die Forscher in Nature berichten (Schmidt et al., 2017. Axonal synapse sorting in medial entorhinal cortex, DOI: 10.1038/nature24005), haben die...

Im Focus: Highly precise wiring in the Cerebral Cortex

Our brains house extremely complex neuronal circuits, whose detailed structures are still largely unknown. This is especially true for the so-called cerebral cortex of mammals, where among other things vision, thoughts or spatial orientation are being computed. Here the rules by which nerve cells are connected to each other are only partly understood. A team of scientists around Moritz Helmstaedter at the Frankfiurt Max Planck Institute for Brain Research and Helene Schmidt (Humboldt University in Berlin) have now discovered a surprisingly precise nerve cell connectivity pattern in the part of the cerebral cortex that is responsible for orienting the individual animal or human in space.

The researchers report online in Nature (Schmidt et al., 2017. Axonal synapse sorting in medial entorhinal cortex, DOI: 10.1038/nature24005) that synapses in...

Im Focus: Tiny lasers from a gallery of whispers

New technique promises tunable laser devices

Whispering gallery mode (WGM) resonators are used to make tiny micro-lasers, sensors, switches, routers and other devices. These tiny structures rely on a...

Im Focus: Wundermaterial Graphen: Gewölbt wie das Polster eines Chesterfield-Sofas

Graphen besitzt extreme Eigenschaften und ist vielseitig verwendbar. Mit einem Trick lassen sich sogar die Spins im Graphen kontrollieren. Dies gelang einem HZB-Team schon vor einiger Zeit: Die Physiker haben dafür eine Lage Graphen auf einem Nickelsubstrat aufgebracht und Goldatome dazwischen eingeschleust. Im Fachblatt 2D Materials zeigen sie nun, warum dies sich derartig stark auf die Spins auswirkt. Graphen kommt so auch als Material für künftige Informationstechnologien infrage, die auf der Verarbeitung von Spins als Informationseinheiten basieren.

Graphen ist wohl die exotischste Form von Kohlenstoff: Alle Atome sind untereinander nur in der Ebene verbunden und bilden ein Netz mit sechseckigen Maschen,...

Im Focus: Hochautomatisiertes Fahren bei Schnee und Regen: Robuste Warnehmung dank intelligentem Sensormix

Schlechte Sichtverhältnisse bei Regen oder Schnellfall sind für Menschen und hochautomatisierte Fahrzeuge eine große Herausforderung. Im europäischen Projekt RobustSENSE haben die Forscher von Fraunhofer FOKUS mit 14 Partnern, darunter die Daimler AG und die Robert Bosch GmbH, in den vergangenen zwei Jahren eine Softwareplattform entwickelt, auf der verschiedene Sensordaten von Kamera, Laser, Radar und weitere Informationen wie Wetterdaten kombiniert werden. Ziel ist, eine robuste und zuverlässige Wahrnehmung der Straßensituation unabhängig von der Komplexität und der Sichtverhältnisse zu gewährleisten. Nach der virtuellen Erprobung des Systems erfolgt nun der Praxistest, unter anderem auf dem Berliner Testfeld für hochautomatisiertes Fahren.

Starker Schneefall, ein Ball rollt auf die Fahrbahn: Selbst ein Mensch kann mitunter nicht schnell genug erkennen, ob dies ein gefährlicher Gegenstand oder...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Die Erde und ihre Bestandteile im Fokus

21.09.2017 | Veranstaltungen

23. Baltic Sea Forum am 11. und 12. Oktober nimmt Wirtschaftspartner Finnland in den Fokus

21.09.2017 | Veranstaltungen

6. Stralsunder IT-Sicherheitskonferenz im Zeichen von Smart Home

21.09.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

OLED auf hauchdünnem Edelstahl

21.09.2017 | Messenachrichten

Weniger (Flug-)Lärm dank Mathematik

21.09.2017 | Physik Astronomie

In Zeiten des Klimawandels: Was die Farbe eines Sees über seinen Zustand verrät

21.09.2017 | Geowissenschaften