Contact
QR code for the current URL

Story Box-ID: 911258

Lingenio GmbH Karlsruher Str. 10 69126 Heidelberg, Germany https://lingenio.de/
Contact Mr Kurt Eberle +49 6221 6552706
Company logo of Lingenio GmbH
Lingenio GmbH

Lingenio mit neuen Algorithmen auf der EAMT

Prof. Babych von Lingenio und der Universität Leeds stellt neues Verfahren für die MÜ- Datengewinnung vor

(PresseBox) (Heidelberg, )
Bogdan Babych, neuer Technischer Leiter bei der Lingenio GmbH und Professor an der Universität Leeds, trägt bei der diesjährigen Konferenz der European Association for Machine Translation (EAMT) in Alicante über eine neues Verfahren zur Gewinnung von Übersetzungsdaten aus sog. vergleichbaren Corpora mit großem Potenzial für die mehrsprachige Termextraktion vor.

Die EAMT veranstaltet jährlich eine Konferenz zu neuesten Entwicklungen in der Maschinellen Übersetzung. Dieses Jahr fand die Veranstaltung in Alicante statt. (The 21st Annual Conference of the European Association for Machine Translation). Ein wichtiges aktuelles Thema ist die Gewinnung von Übersetzungsdaten aus sog. 'vergleichbaren Corpora' (Comparable Corpora), d.h. von Texten unterschiedlicher Sprache die nicht Übersetzungen voneinander sind, sondern nur in der Thematik ähnlich.

Das ist gerade für Übersetzungen von und in sog. 'kleinere Sprachen' wichtig. Das sind solche, für die es vergleichsweise wenig elektronisch verfügbare Texte gibt und – vor allem – wenig Übersetzungen in 'große Sprachen' wie Englisch oder Französisch. Um Übersetzungssysteme trainieren zu können, muss dann auf andere, nur vergleichbare, Korpora ausgewichen werden. Für diese ist es von großer Bedeutung, sog. Cognates zu finden, d.h. Wörter in den Texten die mit großer Sicherheit als Übersetzung voneinander erkannt werden können. Bei Vorliegen von nur bescheidenen Wörterbüchern, wie oft z.B. zwischen asiatischen und europäischen Sprachen der Fall, ist das ein großes Problem.

Prof. Babych hat nach detaillierten Studien zu diesem Thema nun eine vielversprechende Arbeit vorgelegt die zur Bestimmung von Cognates zusätzliche, standardisierte und automatisch abfragbare Kriterien aus der Phonologie mit einbezieht. Die Arbeit ist auf großes Interesse bei Kollegen gestoßen, u.a. von der School of Computing der University of Dublin und der Universitat d'Alicant, beides bekannte Zentren innovativer Forschung zur automatischen Übersetzung.

Lingenio wird das Verfahren in seine Term-Extraktions-Systeme zur Unterstützung von diversen Übersetzungsprozessen integrieren.

Mehr zu der Arbeit zu 'Development and evaluaton of phonological models for cognate identification' findet sich in den Proceedings der Konferenz.

 

Attachments

Website Promotion

Website Promotion
The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.
Important note:

Systematic data storage as well as the use of even parts of this database are only permitted with the written consent of unn | UNITED NEWS NETWORK GmbH.

unn | UNITED NEWS NETWORK GmbH 2002–2024, All rights reserved

The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.