Chat with us, powered by LiveChat

Entwicklungsprozess der benutzerdefinierten Maschinenübersetzung

Um ein neues benutzerdefiniertes Maschinenübersetzungssystem einzuführen benötigt Trusted Translations eine anfängliche Trainings- und Einrichtungsphase.

Der folgende ist ein typischer Umsetzungsprozess für den Aufbau eines neuen MT-Systems.

Neue MT-Systeme für jedes Sprachpaar anpassen

Die erforderlichen Trainingsdaten für den Aufbau eines Qualitätssystems hängen sehr von den Besonderheiten des Typs der Inhaltsdomäne ab. Proben von bestehendem Inhalt werden daher sehr wichtig sein, um relevante Trainingsdaten und folglich ein System von hoher Qualität für jedes Sprachpaar aufzubauen. Es gibt mehrere Optionen, um Trainingsdaten für den Aufbau eines kundenspezifischen Systems zu erfassen.

  • Bestehendes übersetztes Material:

    Der ideale Ausgangspunkt für ein kundenspezifisches Maschinenübersetzungssystem ist, zuvor übersetztes Material, das sich dem zu übersetzenden Inhalt sehr ähnelt, zu finden und zu verwenden. Je mehr zuvor übersetztes Material zur Verfügung steht, desto günstiger und schneller wird der Vorgang sein.

  • Bestehende einsprachige Daten:

    Sollten ausreichende Mengen an Ausgangsinhalt vorhanden sein, ist es möglich, saubere, einsprachige Sätze zu extrahieren, die dann von unseren Experten übersetzt werden können. Durch die Erstellung einer Reihe von Paralleldaten für jedes Sprachpaar können wir den geeigneten Inhalt erstellen, mit dem ein kundenspezifisches System eingerichtet und trainiert werden kann.

  • Einen spezialisierten Korpus aus anderen Quellen erstellen:

    Neben dem Gebrauch von einsprachigen Daten werden wir im Internet nach Materialien suchen, die genau mit dem Inhalt ausgerichtet sind, der durch das System laufen wird. Da unsere Systeme im Wesentlichen statistisch sind, werden wir nach parallelen und einsprachigen Daten suchen müssen. Zuerst werden wir Systeme mit den vom Kunden bereitgestellten Daten zusammen mit den zusätzlichen Daten aus dem Internet aufbauen, um die Wirksamkeit dieses Ansatzes nachzuweisen.

    Die im Internet gefundenen Paralleldaten müssen bereinigt werden (Rechtschreibprüfung, Ausrichtungen überprüft, doppelte Einträge löschen, usw.) bevor diese als Trainingsdaten für ein MT-System dienen. In diesem Szenarium sind viel größere Mengen an manueller Beteiligung erforderlich im Vergleich dazu, wenn der Kunde in der Lage ist, ausreichende Mengen an ausgerichteten Daten von Beginn an zu liefern. Es wird 4 bis 6 Wochen dauern, ein neues System aufzubauen.

Wenn mehr und mehr Arbeitsergebnisse post-editiert werden, können diese in Trainingsdaten von guter Qualität umgewandelt werden. Die Qualität des Systems wird sich daher mit der Zeit schnell verbessern.

Kundenspezifische neue MT-Systeme verbessern sich mit menschlichem Post-Editing

Es gibt verschiedene Workflows mit einem benutzerdefinierten Maschinenübersetzungssystem. Eine häufige Konfiguration ist die Integration eines menschlichen Post-Editing-Prozesses. In diesem Workflow wird das Ergebnis des kundenspezifischen Maschinenübersetzungssystems durch einen unserer Sprachexperten bearbeitet, um die Qualität des aktuellen Produktes zu verbessern und das System für zukünftige Übersetzungen umzutrainieren. Während der Editor das Arbeitsergebnis verändert, um die Qualität zu steigern, wird das System immer intelligenter. Je mehr Übersetzungen durch das System fließen desto intelligenter wird das System. Mit der Zeit wird sich der Qualitätsunterschied zwischen einer vollständig menschlichen Übersetzung und dieser Lösung erheblich verkleinern. Außerdem werden die Durchlaufzeit und die Kosten erheblich niedriger sein. Diese Systeme werden unserer Meinung nach ein wichtiges Werkzeug und ein Unterscheidungsmerkmal auf dem Markt werden.

© 2019 by Trusted Translations, Inc. Alle Rechte vorbehalten. | Sitemap