Anzeige
The system is based on Princeton University’s WordNet database. WordNet is a lexical database developed by linguists at Princeton’s Cognitive Science Laboratory. The database was designed to inventory, classify and relate the semantic and lexical content of the English language.
WordNet is packaged as an electronic database that can be downloaded over the Internet. WordNet’s underlying foundation is synset (synonym set), a group of interchangeable words that denote a meaning or particular usage. Each synset is one possible meaning of a word, described briefly and concisely. WordNet has a lexicon of over 200,000 perfectly structured and defined English terms. This is one of the pillars of the system conceived by researchers at the UPM’s School of Computing.
The system’s other mainstay are universal words. The concept of universal word came out of the UNL (Universal Networking Language) Project. The aim of this project is to eliminate the barriers of linguistic diversity by creating a medium of information exchange through which users can communicate in their own language.
Universal words
As the UNL Project’s Spanish Language Centre explains, one of the key concepts of UNL is the universal word. A universal word is a word, taken from the English language, to which a number of attributes and constraints are added to disambiguate the term.
The English term plus the attributes and constraints is known as a universal word, because it has an equivalent term in any other language. On account of their accuracy, one of the uses of universal words is to systematically produce multilingual dictionaries.
Researchers at the UPM’s School of Computing have applied an algorithm based on computational models to the WordNet database and expanded the English language lexicons. The constructed universal words can then be used to compile multilingual dictionaries.
UPM engineers created a Universal Words Dictionary. This dictionary can associate the words of each language with the respective disambiguated universal word. These researchers have managed to develop a tool that people can use to enter a word in their original language and select the equivalent of a set of terms written in their own language in another language. This is a breakthrough for multilingualism.
How does it work?
The ultimate aim is to build extremely precise multilingual dictionaries. The system contains universal words in English taken from the WordNet database. The universal words are passed on to lexicographers from different countries. Each lexicographer reads the universal word in English and understands its given meaning. The lexicographers then add the translation of the term in their mother tongue. To do all this, they do not have to be acquainted with the target language.
Even though the universal words are in English, it is not the same as using English language words, as English is just another natural language liable to ambiguity. The addition of attributes and constraints removes all ambiguity, and the equivalence between languages is extremely good.
This is how this multilingual dictionary is being built. The method has already been tried and tested with striking results. The translations from the universal words created using WordNet are 88% accurate and reliable.
Original system
Compared to other lexicographical methods, this is an original system, as it can generate bilingual dictionaries without experts having to speak both languages. All they need, apart from their mother tongue, is a good enough level of English to enter the exact translation of the word they are looking for.
Whereas there are plenty of Spanish-English interpreters, for example, it is harder to find Portuguese-Bulgarian translators, a problem that this system developed by researchers at the UPM obviates.
These bilingual dictionaries based on multiple equivalences of terms are not only useful for building dictionaries but also for supporting search systems in different languages.
Spanish cultural heritage multilingual dictionary
The Validation and Business Applications Group, led by Jesús Cardeñosa, a professor at the School of Computing, is using this system to compile a dictionary of multilingual terms on Spain’s cultural heritage, commissioned by the Ministry of Culture under the Patrilex Project. The project is to be completed by the end of 2008.
The goal of this project is to define a methodology and develop tools that support cultural heritage document search based on multilingual lexical resources. To do this, researchers are developing tools to manage lexical resources about Spain’s cultural heritage. The key tool is a multilingual thesaurus (database).
A thesaurus is a list of terms, possibly composed of more than one word, related hierarchically to each other (general terms and subordinate terms) and used to index and retrieve documents. The thesaurus will be the core for defining semantic relations to establish the underlying context of a query.
The final result will be a search system based on user keyword entries, capable of putting the query into context and establishing a correspondence to equivalent words in other languages. The system will then be able to return documents in several languages that fit the search terms entered in Spanish with a precision unparalleled by current multilingual systems.
The languages used to build the multilingual thesaurus will be Spanish, English and Russian, and the system’s real test-bed will be the Under-Directorate General of Historical Heritage Conservation’s website, which is now exclusively in Spanish. According to the project brief, the methodology will put the accent on the method’s extensibility to other languages.
Eduardo Martínez | Quelle: alphagalileo
Weitere Informationen: www.fi.upm.es/?pagina=543
Acht weitere Satelliten für das europäische Navigationssystem bestellt
02.02.2012 | Bundesministerium für Verkehr, Bau und
Jointly utilizing LTE networks
02.02.2012 | Fraunhofer-Institut für Nachrichtentechnik, Heinrich-Hertz-Institut HHI
„großartig“ – dieses Kompliment war gestern öfter von Prominenten aus Sport, Wirtschaft, Politik und Entertainment, zum Thema Lichtkunstobjekte beim „Ball des Sports“ zu hören. Schon am roten Teppich wurde ihr Blick angezogen von zwei symbolträchtigen, magisch leuchtenden „sporttissimo“ - Lichtskulpturen mit dem Titel „EMOTION“. Ein Blickfang, dessen Wirkung sich niemand entziehen konnte.
Aber auch von weitem waren die in wechselnden Farben strahlenden Kunstobjekte, die eine stattliche Höhe von 4,5 m aufweisen, nicht zu übersehen. Dabei beeindrucken sie nicht nur durch Größe und Leuchtkraft, sondern auch durch die sympathische Symbolik. In abstrakter Form und dennoch deutlich erkennbar, setzen die Objekte den Moment der ...
Das 1KITE Projekt (1K Insect Transcriptome Evolution), in dem sich Forscher aus der ganzen Welt in noch nie dagewesener Weise zusammengetan haben, um das Geheimnis des evolutiven Erfolges der Insekten mittels Transkriptomen von 1.000 Insektenarten zu lüften, ist jetzt gestartet. Für die Dauer von drei Jahren werden fünf Millionen Euro vom Bejing Genomics Institute, dem größten nationalen Forschungsinstitut Chinas, zur Verfügung gestellt, um die Transkriptomdaten zu erheben.
1KITE umfasst ein internationales Team von renommierten Experten für molekulare Biologie, Morphologie, Paläontologie, Taxonomie, Embryologie und Bioinformatik. Rund 50 Wissenschaftler aus Australien, China, Deutschland, Japan, Mexiko, Österreich und den USA arbeiten im 1KITE-Projekt.
Aus Deutschland sind beteiligt: die Universität Bonn, das Zoologische Forschungsmuseum Alexander Koenig in Bonn, die Universität Jena ...
Pulsare können durch Materie, die von außen auf sie einströmt, nicht nur beschleunigt, sondern auch verlangsamt werden. Das erklärt einige Rätsel.
Pulsare gehören zu den exotischsten, bekannten Himmelskörpern. Sie besitzen Durchmesser von etwa 20 Kilometern, beinhalten aber in etwa die Masse unserer Sonne. Ein würfelzuckergroßes Stück ihrer ultrakompakten Materie würde auf der Erde mehrere hundert Millionen Tonnen wiegen.
Eine Unterklasse von ihnen, die Millisekundenpulsare, wirbeln zudem bis zu einige hundert Mal ...
Feinste Strukturen des Gehirns aufzudecken, um seine Funktionsweise zu enträtseln – diesem Ziel sind Forscher um Stefan Hell vom Max-Planck-Institut für biophysikalische Chemie einen entscheidenden Schritt näher gekommen.
Mit der von Hell entwickelten STED-Mikroskopie ist es ihnen erstmals gelungen, scharfe Live-Bilder aus dem Gehirn einer lebenden Maus aufzunehmen. In einer bisher unerreichten Auflösung von unter 70 Nanometern haben sie die winzigen Strukturen sichtbar gemacht, über die Nervenzellen miteinander kommunizieren. Diese Anwendung der STED-Mikroskopie eröffnet Neurobiologen und Medizinern neue ...
Durch Verwendung viraler Vektoren können mittels RNAi Genfunktionen in Insekten innerhalb kurzer Zeit studiert werden
Gelbe Biotechnologie ist die Biotechnologie mit Insekten, analog zur grünen (Pflanze) und roten (Tiere) Biotechnologie. Wirkstoffe oder Gene aus Insekten werden charakterisiert und können für die Forschung oder die Anwendung in Landwirtschaft oder Medizin eingesetzt werden.
Wissenschaftler des Max-Planck-Instituts für chemische Ökologie, Jena, verwenden jetzt ein Verfahren, mit dem sie die ...
Anzeige
Anzeige

Startschuss für eine neue, internationale Forschungsinitiative zur Evolution der Insekten
03.02.2012 | Biowissenschaften Chemie
Microscopy Reveals ‘Atomic Antenna’ Behavior in Graphene
03.02.2012 | Materialwissenschaften
Kölner zeigen, dass es geht: Klimaschutz passt in den Alltag
03.02.2012 | Ökologie Umwelt- Naturschutz
Konferenz EBL 2012 zu elektronischen Baugruppen und Leiterplatten
03.02.2012 | Veranstaltungsnachrichten
Den Umstieg zur LED-Beleuchtung erfolgreich meistern
03.02.2012 | Veranstaltungsnachrichten
Chaos, Unsicherheit und Risiko
03.02.2012 | Veranstaltungsnachrichten