Terminologie für Redakteure und Übersetzer mit Definitionen
Glossar der technischen Kommunikation
Hier werden die wichtigsten Begriffe aus dem Bereich der technischen Kommunikation, Übersetzungen und Terminologie erklärt.
A
Kurzform für eine Wortgruppe, die aus den Anfangsbuchstaben der einzelnen Wörter gebildet wird.
Beispiel:
FAQ = Frequently asked questions (Häufig gestellte Fragen).
Ein Alignment dient dazu, Translation-Memorys mit früheren Übersetzungen zu befüllen, die nicht mit einem Translation-Memory-System erstellt wurden.
Die jeweiligen Ausgangs- und Zieltexte werden getrennt segmentiert und automatisch segmentweise einander zugewiesen. Ein Linguist muss die Richtigkeit der vorgeschlagenen Zuordnungen überprüfen.
In analytischen Sprachen werden Informationen über die grammatischen Beziehungen im Satz nicht durch Flexionen, sondern durch Partikeln und Einzelwörter geliefert. Chinesisch ist eine analytische Sprache.
Die Begriffe „analytische Sprache“ und „isolierende Sprache“ werden synonym verwendet.
Sprache aus der übersetzt wird.
Synonym:
Quellsprache
B
In der Terminologielehre ist der Begriff eine abstrakte Denkeinheit, für die je Sprache eine oder mehrere Benennungen stehen.
In der Norm DIN 2330 „Begriffe und Benennungen – Allgemeine Grundsätze“ werden Begriffe eingehend definiert.
Begriffsorientierte Terminologien verwalten Begriffe. Begriffe sind abstrakte Denkeinheiten, die Menschen mit Wörtern oder Wortgruppen benennen.
Begriffsorientierte Terminologien und benennungsorientierte Terminologien sind zwei unterschiedliche Ansätze in der Terminologielehre. Sie werden oft im Zusammenhang mit Onomasiologie und Semasiologie diskutiert.
Begriffsorientierte Terminologien (Onomasiologie): Dieser Ansatz geht von einem Begriff, einer Idee, einem Gegenstand aus und fragt nach Namen für diese Objekte. Er beschäftigt sich mit der Frage „Wie kann man X ausdrücken? „Wenn wir zum Beispiel von dem Begriff „ein langes, schmales Stück Kartoffel, das frittiert wird“ ausgehen, fragt die Onomasiologie nach den Namen, die in den USA „French fries„, in Großbritannien „chips“ usw. lauten können.
Benennungsorientierte Terminologien (Semasiologie): Dieser Ansatz nimmt ein Wort und fragt nach seiner Bedeutung. Die Frage lautet: „Was bedeutet das Wort X? „Wenn wir zum Beispiel das Wort „Chips“ als Ausgangspunkt nehmen, würde die Semasiologie nach der Bedeutung des Wortes fragen, die in Großbritannien „lange, schmale Kartoffelstücke, die frittiert wurden“ und in den USA „dünne Kartoffelscheiben, die frittiert oder knusprig gebacken wurden“ sein könnte.
Zusammenfassend lässt sich sagen, dass Onomasiologie und Semasiologie zwei unterschiedliche Richtungen der Lexikologie darstellen. Die Onomasiologie geht vom Begriff zum Begriff, die Semasiologie vom Begriff zum Begriff.
In der Terminologielehre ist die Benennung ein Wort oder eine Wortgruppe, die für einen Begriff steht. In der Norm DIN 2330 „Begriffe und Benennungen – Allgemeine Grundsätze“ werden Benennungen eingehend definiert.
Viele Sprachen wie Deutsch, Englisch laufen von links nach rechts. Einige Sprachen haben eine andere Richtung: von rechts nach links, wobei die Zahlen von links nach rechts gelesen werden. Deshalb heißen solche Sprachen bidirektionale Sprachen.
Synonym:
BiDi-Sprache
Terminologie, die nach Benennungen geordnet ist. Für jede Benennung sind alle Bedeutungen des Wortes aufgeführt. Ein gutes Beispiel hierfür ist das Duden-Wörterbuch, das viele Menschen in ihrer Hausbibliothek haben.
C
ChatGPT ist ein KI-basiertes Modell, das natürliche Sprache versteht und generiert, um Dialoge zu führen und auf Anfragen zu antworten.
ChatGPT wurde von von OpenAI entwickelt. Es basiert auf der GPT (Generative Pre-trained Transformer) Architektur von OpenAI basiert und wurde speziell trainiert, um menschenähnliche Dialoge zu führen und auf Anfragen in natürlicher Sprache zu antworten. Dieses Modell erhält seine beeindruckende Leistung durch ein umfassendes Training mit einer großen Anzahl von Textdaten aus dem Internet.
Die bemerkenswerteste Eigenschaft von ChatGPT ist seine Fähigkeit, den Kontext über lange Dialoge hinweg aufrechtzuerhalten. Dies ermöglicht es, kohärente und relevante Antworten zu generieren, die den Bedürfnissen der Nutzer entsprechen. Um dies zu erreichen, basiert die Funktionalität auf der Identifizierung und Anwendung von Mustern, Sprachgebrauch und Informationen, die während des Trainings gelernt wurden. Es ist jedoch wichtig zu betonen, dass ChatGPT nur auf den Informationen basiert, die ihm während des Kurses vermittelt wurden, und dass es in der Lage ist, zu halluzinieren, d.h. Antworten zu erfinden.
Die Anwendungsbereiche von ChatGPT sind sehr vielfältig: Kundenservice, Bildung, Unterhaltung und viele andere Bereiche, in denen es als effektives Kommunikationsmittel eingesetzt wird.
ChatGPT hat bereits begonnen, eine wachsende Rolle bei sprachbasierten Aufgaben zu spielen, einschließlich Terminologieextraktion, Anpassung von Übersetzungen an spezifische Stile und Kontexte und Qualitätskontrolle. Dies wird für Übersetzer und technische Redakteure immer wichtiger, da es ihnen hilft, Inhalte effizient zu erstellen, zu überarbeiten und zu optimieren. ChatGPT wird daher eine bedeutende Hilfe bei der Bewältigung der komplexen sprachlichen Herausforderungen im Bereich der technischen Kommunikation darstellen.
Computer-Aided Translation (CAT) bezeichnet Softwaretools, die Übersetzern helfen, effizienter und konsistenter zu arbeiten. Diese Tools speichern bereits übersetzte Phrasen in einer Datenbank, der sogenannten Translation-Memory (TM), und schlagen sie vor, wenn ähnliche oder identische Phrasen erneut übersetzt werden sollen. Das verbessert die Konsistenz über verschiedene Projekte hinweg und beschleunigt den Übersetzungsprozess, da Übersetzer nicht wiederholt dieselben Phrasen übersetzen müssen.
CAT-Tools bieten auch Glossare, die Fachbegriffe und deren Übersetzungen enthalten, um die Einheitlichkeit der Terminologie zu gewährleisten. Einige CAT-Tools integrieren auch maschinelle Übersetzungsfunktionen, die einen ersten Entwurf der Übersetzung liefern, den der Übersetzer dann überprüfen und anpassen kann.
Synonym:
CAT
CAT-Tool
Computergestützte Übersetzung
Computerunterstützte Übersetzung
Computer-Assisted-Translation
Wird meistens für eine Übersetzung verwendet, die ein Übersetzer mit Hilfe eines Translation-Memory-Systems erstellt.
Synonyme:
Computer-Aided-Translation
CAT
Im Kontext von Terminologiedatenbanken sind Concept Maps visuelle Darstellungen komplexer Vernetzungen von Begriffen und Benennungen. Sie helfen, die Beziehungen innerhalb eines bestimmten Wissensgebietes zu organisieren und darzustellen. Diese Concept Maps ermöglichen es den Benutzern, die Struktur und die Beziehungen der Fachtermini intuitiv zu verstehen, indem die Begriffe in Form von Knoten (oder Punkten) dargestellt werden, die durch Linien verbunden sind.
Die Verwendung von Concept Maps in Terminologiedatenbanken bietet mehrere Vorteile:
1. Visualisierung von Wissen: Sie machen komplexe Strukturen und Beziehungen zwischen Begriffen sichtbar und leicht verständlich. Dies ist besonders nützlich bei der Erstellung oder Übersetzung technischer Informationen, wo ein tiefes Verständnis der Materie erforderlich ist.
2. Verbesserung der Zugänglichkeit: Die graphische Darstellung von Informationen ermöglicht es den Nutzern, Verbindungen zwischen verschiedenen Konzepten schnell zu erkennen und zu navigieren, was die Informationssuche und das Lernen erleichtert.
3. Förderung des Lernens: Sie unterstützen den Lernprozess durch das Erkennen von Zusammenhängen zwischen Konzepten, was zu einem tieferen und nachhaltigeren Verständnis führt.
4. Unterstützung der Terminologiearbeit: Bei der Terminologiearbeit helfen Concept Maps, einheitliche Definitionen zu entwickeln, Synonyme zu identifizieren und die präzise Verwendung von Fachbegriffen im Kontext zu fördern. Sie tragen dazu bei, Inkonsistenzen zu vermeiden und die Klarheit in der Kommunikation zu verbessern.
Concept Maps in Terminologiedatenbanken sind besonders wertvoll für Übersetzer, Redakteure, Terminologen und Fachexperten, die mit der Erstellung, Pflege und Verwendung von Fachterminologie befasst sind. Sie ermöglichen die effiziente Organisation, Analyse und Weitergabe von Fachwissen.
Ein Content Delivery Portal (CDP) ist ein zentraler Hub für technische Informationen, der es ermöglicht, relevante Informationen mit nur wenigen Klicks zu finden, ohne dass Dokumente durchgeblättert werden müssen. Es ist meistens sowohl online als auch offline verfügbar und optimiert den Zugriff auf bestehendes Wissen. Durch ein CDP können technische Supportmitarbeiter, Servicetechniker, Kunden und Partner von Unternehmen effizient auf relevante Informationen zugreifen.
CDPs verbinden die Erstellung von Inhalten in Redaktionssystemen mit der einheitlichen Verpackung in standardisierte Formate. Ein Großteil der Texte verwendet XML oder XML-basierte Datenformate. CDPs verteilen Inhalte über Browser, mobile Geräte oder Apps und bieten leistungsfähige Suchfunktionen.
Typische grundlegende Funktionalität von CDPs
- Import beliebiger Datenformate
- Leistungsstarke Suchfunktion mit Filtern (Facettenfiltern)
- Plattform- und geräteübergreifende Nutzung (Responsive Design)
- Personalisierung der Inhalte für verschiedene Nutzergruppen
- Kontextsensitive Hilfe
Darüber hinaus gibt es je nach Anbieter eine Reihe von fortschrittlichen Funktionen und Integrationen wie Einbindung von externen Inhalten und Diensten.
Besonders wichtig für die Technische Dokumentation ist die Mehrsprachigkeit von CDPs. Sie ermöglichen die Verwaltung und Bereitstellung von Inhalten in mehreren Sprachen, sodass Nutzer Informationen in ihrer bevorzugten Sprache abrufen können.
In vielen Unternehmen wird das Content Delivery Portal als benutzerzentrierte, intelligente und aktuelle Suchdatenbank genutzt, die alle technischen Dokumentationen, von Bedienungsanleitungen bis hin zu Montageanweisungen, enthält und es den Benutzern ermöglicht, relevante Informationen schnell und präzise zu finden.
CDPs bieten Unternehmen zahlreiche Vorteile: optimierte Verwaltung digitaler Inhalte, verbesserte Nutzerfreundlichkeit, reduzierte Kosten und Zeitaufwand sowie Skalierbarkeit und Flexibilität.
Content-Typen
- Text: Artikel, Blog-Beiträge, Whitepapers, Handbücher
- Bilder: Fotos, Grafiken, Diagramme
- Videos: Produktdemos, Tutorials, Interviews
- Audio: Podcasts, Webinare, Vorträge
- Interaktive Inhalte: Umfragen, Quizze, Spiele
- Dokumente: PDFs, Word-Dokumente, Präsentationen
- Software: Downloads, Anwendungen
- Daten: Tabellen, Datenbanken
Auf die Lokalisierung dieser Inhalte haben sich Dienstleister wie die D.O.G. GmbH spezialisiert, die kostensparende Technologien wie TMS, MT-Systeme und KI-Anwendungen einsetzen und die meisten Dateiformate unterstützen.
Redaktionssysteme oder Content-Management-Systeme (CMS) sind Softwaresysteme zur Verwaltung von Inhalten wie Benutzerhandbücher, Reparaturanleitungen oder Webinhalten. CMS verwalten Informationseinheiten und können diese in mehreren Sprachen mit zusätzlichen Metainformationen speichern. Wenn neue Inhalte erstellt oder ein bestehendes Handbuch aktualisiert werden muss, können die bestehenden Inhalte wiederverwendet werden. Die meisten CMS trennen Inhalt und Layout-Informationen. So kann derselbe Inhalt für verschiedene Medien wie Webseiten, gedruckte Handbücher oder mobile Geräte veröffentlicht werden.
Synonyme:
Redaktionssystem
CMS
Corporate Wording, auch bekannt als „Corporate Language“, bezieht sich auf die Sprachwelt eines Unternehmens, die bewusst definiert und verwendet wird. Es umfasst den individuellen und charakteristischen Sprachstil und -gebrauch eines Unternehmens, einschließlich Stil, Wortwahl, Tonfall und Schreibkultur. Corporate Wording wird sowohl in der internen als auch in der externen Kommunikation verwendet und umfasst verschiedene Formen der Kommunikation wie offizielle Briefe, E-Mails, Website-Inhalte, Präsentationen und vieles mehr.
Das Corporate Wording ist ein wichtiger Bestandteil der Identität eines Unternehmens und dient dazu, das Wesen der Marke des Unternehmens zu vermitteln. Es hilft, ein kohärentes Bild des Unternehmens zu präsentieren und kann dazu beitragen, die Professionalität und Vertrauenswürdigkeit des Unternehmens zu zeigen. Darüber hinaus kann es dazu beitragen, ein bestimmtes Gefühl über das Unternehmen und seine Produkte oder Dienstleistungen zu vermitteln und sich von der Konkurrenz zu unterscheiden.
Corporate Wording kann Elemente enthalten wie einen Sprachstil, der der Unternehmensphilosophie entspricht, Anweisungen für die erfolgreiche Umsetzung des festgelegten Stils, die Definition von Schlüsselbegriffen und die Standardisierung von Kommunikationsmodellen. Es kann auch Anweisungen zur einheitlichen Ansprache von Personen enthalten, z.B. ob Kunden geduzt oder gesiezt werden sollten.
Im Bereich der technischen Kommunikation ist ein Schlüsselelement die Unternehmensterminologie, in der die wichtigsten Begriffe in Bezug auf die Aktivitäten und Produkte des Unternehmens definiert werden. Häufig ist diese Terminologie mehrsprachig.
Synonym:
Firmensprache
D
Allgemeine Anforderungen an Definitionen
Definitionen spielen in der Fachterminologie eine wichtige Rolle. Um eine Definition auf effiziente Weise zu erstellen, sind klare und verständliche Kriterien erforderlich. Die folgende Struktur und die folgenden Elemente sind in diesem Zusammenhang von entscheidender Bedeutung:
- Prägnanz: Eine gute Definition sollte in einem einzigen Satz formuliert sein und dabei klar und direkt auf das Wesentliche eingehen.
- Zielgruppengerecht: Die Definition muss für die angesprochene Zielgruppe verständlich sein, ohne unnötig kompliziert zu sein.
- Bestandteile einer Definition:
– Definiendum: das, was definiert wird.
– Definiens: das, was es definiert.
Eine Standardstruktur für eine Definition könnte wie folgt aussehen: [Definiendum: Domäne (optional, z.B. ‚Chemie‘) + Oberbegriff + Definiens]. - Integration in ein konzeptionelles System: Die Definition sollte mit einem Oberbegriff beginnen, der den definierten Begriff in ein bestehendes konzeptionelles System einordnet, gefolgt von den Hauptmerkmale wie Funktion, Material, Aussehen usw. , die den Begriff charakterisieren.
Zusätzliche Regeln und Empfehlungen
- Fachbegriffe: Die Definition sollte nur Fachtermini verwenden, die bereits bekannt oder anderweitig definiert sind.
- Vermeidung von Tautologien und zirkulären Definitionen
- Keine Interpunktion am Ende: Definitionen enden ohne abschließende Interpunktion.
- Quellenangabe: Falls vorhanden, sollte die Quelle der Definition immer angegeben werden.
kleine Zusatzzeichen wie Punkte, Striche, Häkchen, Bögen oder Kreise, die den Buchstaben hinzugefügt werden. Sie zeigen eine von der Standardaussprache abweichende Aussprache oder Betonung an. Diese Zeichen können über, unter, vor, hinter oder durch einen Buchstaben gesetzt werden. Durch diakritische Zeichen kann ein Alphabet erweitert werden, ohne dass neue Buchstaben entstehen.
Diakritische Zeichen sind besonders in lateinischen Alphabeten verbreitet, kommen aber auch in arabischen, hebräischen und indischen Schriften vor, wo sie meist zur Vokalisierung verwendet werden. Ihre Verwendung ist oft auf bestimmte oder verwandte Sprachen beschränkt, was sie für diese Sprachen charakteristisch macht. Sie werden auch in wissenschaftlichen Transliterationssystemen und im internationalen phonetischen Alphabet verwendet.
Die Funktion der diakritischen Zeichen kann von Sprache zu Sprache variieren, ebenso wie ihr Aussehen.
Synonyme: Diakritikum, Diakritikon
Im Gegensatz zum Übersetzer überträgt der Dolmetscher eine Aussage von einer Sprache in die andere mündlich. Dolmetscher werden bei Konferenzen aber auch bei Verhandlungen, Arbeitsgesprächen eingesetzt.
Es gibt unterschiedliche Formen des Dolmetschens: Simultandolmetschen, Konsekutivdolmetschen, Flüsterdolmetschen… „Der professionelle Berufsverband der Dolmetscher ist der AIIC.“
Datensatz in einer Datenbank, der doppelt erfasst wurde. In Terminologiedatenbanken können Doubletten vorkommen, wenn zwei getrennt erfasste Terminologieeinträge dieselbe Bedeutung haben. Doubletten sollen nicht mit Homonymen verwechselt werden (gleiche Benennung aber unterschiedliche Bedeutung).
Synonyme:
Doublette
E
Im Zusammenhang mit maschineller Übersetzung, maschinellem Lernen (ML) oder künstlicher Intelligenz (KI) bezieht sich der Begriff „Engine“ (Maschine) auf die Hauptkomponente oder das Herzstück eines Systems, das die spezifischen Aufgaben ausführt, für die es entwickelt wurde. Diese Engine ist typischerweise eine Kombination aus Software und Algorithmen, die zusammenarbeiten, um Daten zu analysieren, Muster zu erkennen, Entscheidungen zu treffen oder Texte von einer Sprache in eine andere zu übersetzen.
Maschinelle Übersetzung
In maschinellen Übersetzungssystemen besteht die Engine aus den gelernten Sprachmodellen der Ausgangs- und Zielsprache und den Algorithmen, die auf großen Datensätzen trainiert wurden, um Texte automatisch von einer Ausgangssprache in eine Zielsprache zu übersetzen. Moderne Übersetzungssysteme verwenden neuronale Netze und Deep-Learning-Techniken, um die Qualität der Übersetzungen zu verbessern und sie natürlicher zu gestalten.
Maschinelles Lernen und KI
In ML- und KI-Systemen bezieht sich die Engine auf das gelernte Modell und die Software, die Daten verarbeitet und Prognosen erstellt. Die ML-Engine verwendet das gelernte Modell, um unbekannte Daten zu verarbeiten (z. B. Texte zu übersetzen oder zu klassifizieren).
Die Effizienz einer Maschine hängt von mehreren Faktoren ab, z. B. der Qualität und Quantität der Trainingsdaten, der Architektur der neuronalen Netze, den Algorithmen und der Rechenleistung.
F
Die Qualitätssicherungsnorm ISO 17100 stellt verschiedene Anforderungen an den Übersetzungsprozess. Dazu gehört neben der sprachlichen Prüfung auch die technische Prüfung.
Die Norm definiert die fachliche Prüfung als eine „einsprachige Überprüfung eines zielsprachlichen Inhalts auf Eignung für den vereinbarten Zweck“. Sie verlangt, dass die Prüfer, Sachgebietsspezialisten sind und über eine an einer Hochschule erworbene einschlägige Qualifikation auf dem jeweiligen Sachgebiet und/oder Erfahrung auf diesem Sachgebiet verfügen.
Die Qualitätsprüfung durch D.O.G. entspricht dieser Norm und wurde mehrmals erfolgreich auditiert.
Beschreibt die Terminologie, den Stil und den Sprachgebrauch, die ein Unternehmen i.d.R. in einem Style Guide und in ihrer Firmenterminologie festgelegt hat.
Synonyme:
Corporate Wording
Änderung der grammatischen Form eines Wortes, z.B. eines Verbes oder eines Nomen. Das ist z.B. für die Worterkennung durch Übersetzungssysteme oder Terminologiesysteme wichtig.
Synonyme:
Beugung
Ableitung
Beim Full-Post-Editing ist das Ziel, eine Übersetzung von ähnlicher Qualität wie die eines menschlichen Übersetzers zu erreichen. Die Norm ISO 18587:2018 schreibt vor, dass Post-Editoren die gleiche Qualifikation haben sollen wie Fachübersetzer gemäß der Definition ISO 17100.
Kategorie für die Analyse von Dateien bei Translation-Memory-Systemen. Zu dieser Kategorie gehören Segmente aus dem zu übersetzenden Text, für die ein ähnliches Segment in der Übersetzungsdatenbank (Translation-Memory) vorhanden ist.
Der Grad der Ähnlichkeit wird in Prozent ausgedrückt. Der Übersetzer kann einen Teil der vorhandenen Übersetzung wiederverwenden.
G
Im Rahmen der Softwarelokalisierung bezieht sich dieser Begriff auf Unternehmen, die ihre Aktivitäten weltweit planen. Dies betrifft alle Aspekte der Aktivitäten eines Unternehmens: Produktion, Vertrieb, Marketing usw.. U.a. betrifft es auch die sprachlichen Aspekte.
Synonyme:
Globalization
G11N
Die GUI bezeichnet die Benutzeroberfläche eines Computers. Sie ermöglicht mit Symbolen wie Schaltflächen, mit Eingabefeldern eine Interaktion zwischen Benutzer und Programm.
Der Benutzer kann Elemente der Oberfläche mit einer Maus, mit der Tastatur oder in manchen Fällen mit dem Finger oder mit einem Stift steuern.
Synonyme:
Benutzeroberfläche
Graphical User Interface
GUI
UI
H
HMI steht für “Human-Machine Interface” (Mensch-Maschine-Schnittstelle). Es handelt sich um jede Art von Benutzeroberfläche, die es Menschen ermöglicht, mit Maschinen, Geräten oder Software zu interagieren. HMIs sind entscheidend für die Bedienbarkeit und Benutzerfreundlichkeit von technischen Systemen und finden sich in vielen Bereichen des täglichen Lebens sowie in der Industrie.
Typen von HMIs:
– Touchscreens: Zu finden in Smartphones, Tablets, Industriemaschinen, medizinischen Geräten und mehr. Sie ermöglichen eine direkte, intuitive Interaktion mit dem Gerät.
– Grafische Benutzeroberflächen (GUIs): Auf Computern und Laptops, die dem Nutzer visuelle Elemente wie Icons, Menüs und Fenster zur Steuerung bereitstellen.
– Bedienfelder: Traditionelle Schnittstellen mit physischen Knöpfen, Schaltern und Anzeigen, die vor allem in Maschinen und Geräten eingesetzt werden.
– Sprachgesteuerte Schnittstellen: Digitale Assistenten wie Siri, Alexa oder Google Assistant, die Benutzern die Steuerung durch Sprachbefehle ermöglichen.
Normen und Standards: Bei der Entwicklung und Implementierung von HMIs müssen oft verschiedene Normen und Standards beachtet werden, insbesondere in sicherheitskritischen Branchen wie der Automobilindustrie oder der Medizintechnik. Ein Beispiel ist die Norm IEC 62366, die sich mit der Gebrauchstauglichkeit von medizinischen Geräten befasst. Diese Norm stellt sicher, dass HMIs so gestaltet sind, dass sie eine sichere und effektive Nutzung ermöglichen.
Übersetzung und Lokalisierung von HMI-Texten: Die Übersetzung von HMI-Texten ist eine komplexe Aufgabe, die eine präzise Anpassung an die Zielkultur und Sprache erfordert. Hier sind einige wichtige Aspekte:
- Kulturelle Anpassung:
- Symbole und Farben: Diese können in verschiedenen Kulturen unterschiedliche Bedeutungen haben, was bei der Gestaltung des HMI berücksichtigt werden muss.
- Formatierung von Daten: Datums-, Zeit- und Zahlenformate variieren weltweit, daher muss die Lokalisierung diese Unterschiede widerspiegeln.
- Textlänge: Sprachen unterscheiden sich in der Länge der Texte, was das Layout und Design der Benutzeroberfläche beeinflussen kann.
- Technische Einschränkungen:
- Bildschirmplatz: Der verfügbare Platz auf der Benutzeroberfläche ist oft begrenzt, was die Gestaltung der Übersetzungen beeinflusst.
- Schriftarten: Die Lesbarkeit der Schrift muss in allen Zielsprachen gewährleistet sein, und die Schriftart sollte in allen Sprachen unterstützt werden.
- Technische Begriffe: Diese müssen konsistent und korrekt übersetzt werden, um Missverständnisse zu vermeiden.
- Benutzerfreundlichkeit:
- Klarheit und Verständlichkeit: Übersetzungen müssen leicht verständlich und einfach zu navigieren sein.
- Eindeutige Fehlermeldungen: Diese sollten klar und hilfreich formuliert sein, um die Benutzererfahrung zu verbessern.
- Konsistenz: Die Terminologie sollte durchgängig einheitlich verwendet werden, sowohl innerhalb des HMI als auch in zugehörigen Dokumentationen.
- Rechtliche Anforderungen:
- Kennzeichnung und Sicherheit: In bestimmten Branchen gibt es strenge Vorschriften für die Kennzeichnung und Sicherheitsinformationen, die bei der Übersetzung beachtet werden müssen.
- Warnhinweise: Diese müssen präzise und korrekt übersetzt werden, um rechtliche Haftungsrisiken zu minimieren.
Homonyme sind Wörter, deren Schreibweise und/oder Aussprache identisch sind, die aber unterschiedliche Bedeutungen oder grammatikalische Funktionen haben. Diese Wörter können in der Sprache zu Verwirrung führen, da man sich auf den Kontext beziehen muss, um zu wissen, welche Bedeutung gemeint ist. Homonyme können in zwei Hauptkategorien unterteilt werden:
1. Homographen
Dies sind Wörter, die auf die gleiche Weise geschrieben werden, aber nicht unbedingt auf die gleiche Weise ausgesprochen werden und unterschiedliche Bedeutungen haben. Ein Beispiel im Deutschen ist das Wort „Bank“, das einerseits einen Sitz und andererseits ein Finanzinstitut bezeichnen kann.
2. Homophone
Dies sind Wörter, die gleich ausgesprochen werden, aber unterschiedlich geschrieben werden und unterschiedliche Bedeutungen haben. Ein Beispiel im Deutschen wäre die Verben „sehen“ und „säen“ .
3. Homonymen in mehrsprachigem Umfeld
Die Existenz von Homonymen in einer Sprache zeigt die Komplexität und die Entwicklung der Sprache. Sie sind oft das Ergebnis der natürlichen Entwicklung der Sprache, z.B. durch Veränderung des Klangs, Veränderung der Bedeutung oder Entlehnung aus anderen Sprachen. Homonyme können für Wortspiele verwendet werden und tragen zur Vielfalt der Sprache bei. Ihre korrekte Interpretation hängt stark vom Kontext ab, in dem sie verwendet werden.
In der Terminologiearbeit ist die Identifizierung von Homonymen wichtig, um die Qualität der Übersetzungen zu sichern.
Der Begriff ‚Humanübersetzung‘ (abgekürzt: ‚HÜ‘) wird für Übersetzungen verwendet, die durch einen Menschen angefertigt werden. Dabei kann der Übersetzer durchaus Technologien wie Translation-Memory-Systeme einsetzen. Durch die Verbreitung von maschinellen Übersetzungssystemen (MÜ-Systemen) in Zusammenhang mit Post-Editing (PE) und die Integration von MÜ-Technologien in Translation-Memory-Systeme ist die Abgrenzung zwischen MÜ+PE und HÜ in manchen Situationen unscharf.
Synonyme:
Human Translation
HÜ
I
Bezeichnet Terminologiebestände, die Terminologieeinträge nach Begriffen organisieren und darüber hinaus Begriffe bzw. Benennungen über Relationen miteinander verbinden. Auf diese Weise kann Wissen auf der Grundlage traditioneller begriffsorientierter Terminologie modelliert werden. Beispiel: Die Verbindung der Begriffe Auto – Motor – Lenkrad – Windschutzscheibe – Benzin kann in einer solchen intelligenten Terminologie Definitionen erweitern und zusätzliches Wissen darstellen. Intelligente Terminologien sind in der Regel maschinenlesbar.
Synonyme:
Ontoterminologie
Wissenshaltige Terminologie
Bezieht sich auf die Anpassung eines Produkts (Dienstleistung, Hardware oder Software) an die Gegebenheiten des Zielmarktes. Insbesondere in Bezug auf Software betrifft es sprachlich relevante Aspekte wie die Zeichenkodierung, die Sortierung von Listen, die Arbeit mit Variablen und Platzhaltern oder die Unterstützung von Bidirektionalität und noch einiges mehr. Auch kulturelle Aspekte wie die Verwendung von Symbolen oder Farben sind davon betroffen.
Synonyme:
I18N
Geräte, Endgeräte und virtuelle Gegenstände sind im Internet der Dinge über eine eindeutige ID ansprechbar und können miteinander kommunizieren. Damit sollen über das Internet Prozesse automatisiert werden und weitgehend autonom ablaufen.
Isolierende Sprachen sind Sprachen, die hauptsächlich aus Einzelwörtern bestehen, die jeweils eine einzige grammatische Funktion haben, und die grammatische Beziehungen oft durch Wortreihenfolge und Hilfswörter ausdrücken.
Isolierende Sprachen, auch als analytische Sprachen bekannt, zeichnen sich durch ihre Tendenz aus, grammatische Beziehungen mehr durch die Syntax (Wortreihenfolge) und weniger durch morphologische Veränderungen an den Wörtern selbst (wie in synthetischen Sprachen) auszudrücken. In isolierenden Sprachen besteht ein Wort üblicherweise aus einem einzigen Morphem, das heißt, die meisten Wörter sind unveränderlich und nehmen keine Affixe (Präfixe, Suffixe, Infixe) auf, um Zeit, Fall, Modus oder Aspekt zu markieren.
Einige Hauptmerkmale isolierender Sprachen sind:
- Wortformen: Die Wörter ändern ihre Form nicht, um grammatische Funktionen wie Zeit, Fall oder Zahl zu zeigen. Stattdessen bleibt die Grundform der Wörter konstant.
- Grammatische Funktionen: Grammatische Beziehungen werden durch Hilfswörter (Partikel), die Reihenfolge der Wörter im Satz, oder durch den Kontext statt durch Flexion oder Agglutination angezeigt.
- Klarheit und Einfachheit: Die Struktur der Sprache neigt dazu, klar und direkt zu sein, da die Bedeutung durch einfache Wortzusammensetzungen und die syntaktische Anordnung vermittelt wird.
Ein klassisches Beispiel für eine isolierende Sprache ist Chinesisch. In Chinesisch werden Zeit, Modus und Aspekt oft durch separate Wörter angezeigt, die vor oder nach dem Hauptverb stehen, anstatt durch Veränderungen am Verb selbst. Die Wortreihenfolge spielt eine entscheidende Rolle bei der Bestimmung der syntaktischen Beziehungen innerhalb eines Satzes.
Isolierende Sprachen bieten einen interessanten Kontrast zu synthetischen Sprachen, indem sie zeigen, wie Sprachen unterschiedliche Mechanismen nutzen können, um Bedeutungen und grammatische Beziehungen auszudrücken, ohne dabei die innere Struktur der Wörter zu verändern.
Siehe auch synthetische Sprachen
J
steht für JavaScript Object Notation. Kompaktes Datenformat in einer einfach lesbaren Textform und dient dem Zweck des Datenaustausches zwischen Anwendungen. JSON ist von der Programmiersprache unabhängig. Parser und Generatoren existieren in allen verbreiteten Sprachen. Ein Filter in Trados-Studio 2019 und 2021 ist vorhanden.
K
Gruppen mehrerer Wörter, die regelmäßig gemeinsam verwendet werden. Beispiele dafür sind „fest überzeugt“, „unter Berücksichtigung von“ oder „scharf kritisiert“. Kollokationen sind keine festen Termini, die aus mehreren Wörtern bestehen („regulärer Ausdruck“).
Im Zusammenhang mit Terminologiearbeit oder Übersetzungen ist es die Liste gefundener Treffer (Sätze bzw. Segmente) für Wörter bzw. Wortgruppen, die in einem Korpus oder in einem Translation-Memory gesucht wurden. Die einzelnen Treffer liefern den Kontext für die Verwendung eines Wortes.
Eine der Kategorien, die Translation-Memory-Systeme für die Analyse von Texten verwenden. Ein Segment bzw. ein Satz des zu übersetzenden Texts ist ein Kontext-Match, wenn die Übersetzung aus dem Translation-Memory in einem gleichen Kontext vorkommt. CAT-Tools definierenden Kontext unterschiedlich. Beispielsweise, wenn das Segment vor und das Segment nach dem Kontext-Match ebenfalls im Translation-Memory gespeichert sind.
Synonym:
CM
Kontrollierte Sprache wird von Firmen oder Organisationen eingesetzt, die Informationen in großem Umfang erstellen. Die Autoren schreiben „kontrolliert“ und verwenden dabei Regeln sowie Terminologievorgaben. Ziel ist es, die Verständlichkeit von Texten zu verbessern und die Wiederverwendung von Inhalten durch Standardisierung zu erhöhen. Die Regeln betreffen die Maximallänge von Sätzen, die Formulierung von Anweisungen (z.B. in der Aktivform) oder die Verwendung bestimmter Wörter.
Vor- und Nachteile:
Vorteile:
- Verbesserte Verständlichkeit: Durch die Verwendung einer klar definierten und konsistenten Sprache werden Missverständnisse reduziert und die Inhalte leichter zugänglich für die Zielgruppe.
- Effizientere Erstellung und Übersetzung: Kontrollierte Sprachen ermöglichen die Verwendung von Übersetzungstools und -speichern, was den Prozess der Erstellung und Übersetzung technischer Dokumentationen deutlich beschleunigt und Kosten senkt.
- Höhere Qualität: Die Einhaltung von definierten Regeln und Vorgaben führt zu einer höheren Qualität der Technischen Dokumentation.
- Verbesserte Barrierefreiheit: Kontrollierte Sprachen können die Barrierefreiheit von Technischer Dokumentation verbessern, da sie einfacher zu lesen und zu verstehen sind.
Herausforderungen:
- Einschränkung der Ausdrucksmöglichkeiten: Die Verwendung einer kontrollierten Sprache kann die Ausdrucksmöglichkeiten der Technischen Redakteure einschränken.
- Erforderlicher Schulungsaufwand: Technische Redakteure müssen in den Regeln und Vorgaben der kontrollierten Sprache geschult werden.
- Erstellung und Pflege von Styleguides: Die Erstellung und Pflege von Styleguides und Terminologiedatenbanken ist aufwendig und zeitintensiv.
Beispiel aus der Praxis
Simplified Technical English (STE) ist ein anschauliches Beispiel für die praktische Anwendung der kontrollierten Sprache. Ursprünglich für die Luft- und Raumfahrtindustrie entwickelt, dient es heute als Modell für ähnliche Initiativen in anderen Sektoren. Das STE definiert genau, welche Wörter verwendet werden dürfen und wie Sätze aufgebaut sein müssen, um die Lesbarkeit der technischen Dokumentation zu maximieren.
Weiterführende Informationen
Künstliche Intelligenz (KI) im Kontext der technischen Kommunikation bezieht sich einerseits auf den Einsatz fortschrittlicher maschineller Übersetzungstechnologien wie der neuronalen maschinellen Übersetzung (NMT) und andererseits auf die generative KI, die durch große linguistische Modelle (LLM) wie ChatGPT repräsentiert wird, um sprachliche Aufgaben effizient und mit hoher Qualität zu bewältigen.
Bei der neuronalen maschinellen Übersetzung (NMT) verwenden die Algorithmen neuronale Netze, deren Struktur sich vom menschlichen Gehirn hat inspirieren lassen. Diese Technologie ermöglicht die automatische Übersetzung von Texten zwischen verschiedenen Sprachen, wobei eine Überprüfung durch qualifizierte Post-Editoren unerlässlich ist.
Generative KI bezieht sich auf die Fähigkeit von LLMs, menschenähnliche Texte zu erzeugen oder semantische Informationen aus Texten zu extrahieren. Diese Fähigkeiten werden genutzt, um linguistische Aufgaben wie die Erstellung von Inhalten, semantische Qualitätskontrolle, die Wissensextraktion, Terminologie- oder Keyword-Extraktion und einiges mehr zu unterstützen.
Daher ist es möglich, LLMs, die auf Milliarden von Wörtern in verschiedenen Sprachen trainiert wurden, zur Lösung semantischer Herausforderungen in den Bereichen Redaktion, Übersetzung, Terminologie und Qualitätskontrolle einzusetzen.
Durch den gezielten Einsatz sorgfältig entwickelter, maßgeschneiderter Funktionen und Eingabeaufforderungen (prompt engineering) können Nutzer mit LLMs interagieren und individuelle, sogar projektspezifische Aufgaben lösen. Dadurch wird nicht nur die Genauigkeit verbessert, sondern auch die Effizienz von Prozessen in der technischen Kommunikation optimiert.
L
LLMs (große Sprachmodelle) wie GPT-4 haben Wortkorrelationen und andere Sprachmerkmale aus einem umfangreichen Korpus von Millionen von Dokumenten extrahiert. Sie basieren auf neuronalen Netzwerken mit Transformer-Architektur und können natürliche Sprache auf hohem Niveau verstehen, verarbeiten und generieren. Diese Modelle werden mit riesigen Textmengen trainiert.
Seit den frühen 2020er Jahren hat die rasante Entwicklung und Implementierung solcher Modelle stattgefunden. In einem zweistufigen Prozess wird zuerst ein Grundmodell, auch „Foundation Model“ genannt, auf hohe Sprachkompetenz trainiert. Durch das Training mit diversen Texten können LLMs in nahezu jedem Kontext agieren und für spezifische Anwendungen, wie Fachgebiete oder ChatBots, weiter spezialisiert werden.
Bekannte Beispiele für LLMs sind:
– GPT (GPT-3, GPT-4 usw.) von OpenAI
– BERT von Google
– LaMDA von Google
– PaLM von Google
LaTeX ist ein Textsatzsystem, das besonders für die Erstellung wissenschaftlicher Publikationen und Dokumente mit komplexen mathematischen Formeln verwendet wird. Es zeichnet sich durch seine hohe typografische Qualität und die präzise Kontrolle über das Layout aus.
Aus Sicht des Übersetzungsmanagements stellt LaTeX jedoch eine besondere Herausforderung dar, da es keine Standardfilter für den Import in Translation Memory (TM)-Systeme gibt. Dies liegt daran, dass das Trennen von Text zum Übersetzen und LaTeX-Formatierungscode und -anweisungen nicht trivial ist.
Im Gegensatz zu XML, wo klare Begrenzer mit Anfangs- und Endtags existieren, verwendet LaTeX keine solchen Markierungen. Anweisungen und Steuerbefehle sind im Text selbst eingebettet und können verschiedene Formen haben, z. B.:
\section{Einleitung}
(Beginn eines Abschnitts)\begin{equation} E = mc^2 \end{equation}
(Mathematische Formel)\textbf{Wichtiger Text}
(Fettdruck)
Darüber hinaus müssen im Text einige Sonderzeichen, die in LaTeX Befehle interpretieren, durch sogenannte Escape-Zeichen geschützt werden. Das betrifft z. B. das Prozentzeichen, das als Befehl für Kommentare verwendet wird. Um einen Prozentzeichen als Zeichen auszugeben, muss er mit einem Backslash (‚\‘) maskiert werden: \%
.
Die folgenden Punkte fassen die Herausforderungen beim Übersetzen von LaTeX-Dokumenten zusammen:
- Fehlen von Standardfiltern für TM-Systeme: Das Trennen von Text und Code ist aufwendig und erfordert manuelle Anpassungen.
- Komplexe Syntax: Die Vielzahl von Befehlen und Steuersequenzen kann für Übersetzer ohne LaTeX-Kenntnisse verwirrend sein.
- Sonderzeichen und Escape-Zeichen: Es ist wichtig, die Bedeutung von Sonderzeichen zu kennen und diese korrekt zu maskieren.
D.O.G. GmbH übersetzt regelmäßig Dateien in LaTex-Format und hat dafür eigene Filter programmiert.
Ein Redakteur liest einen Text und verbessert den Stil und die Formulierung. Ein Editor wird häufig von Verlegern verwendet. Im Gegensatz dazu wird im Übersetzungsbereich ein Revisor eingesetzt, der die Übereinstimmung von Quelltext und Übersetzung überprüft.
In der Sprachwissenschaft ist ein Lemma die Grundform eines Wortes, wie sie üblicherweise in einem Wörterbuch steht. Der Prozess, ein Wort auf seine Grundform zu reduzieren (Bücher –> Buch) heißt Lemmatisierung.
Aus der Sicht des Übersetzungsprozesses, der Terminologieextraktion und der Prüfung von Übersetzungen spielt die Lemmatisierung eine zentrale Rolle, indem sie die Effizienz und Genauigkeit dieser Prozesse verbessert.
- Übersetzungsprozess: Die Lemmatisierung hilft bei der Identifizierung der Grundform von Wörtern, was für die Übersetzung von Texten in andere Sprachen von großer Bedeutung ist. Durch die Rückführung von Wörtern auf ihre Lemmata können Übersetzungssysteme besser verstehen, welche Bedeutung ein Wort im gegebenen Kontext hat, und somit die richtige Entsprechung in der Zielsprache finden. Dies ist besonders wichtig bei Sprachen, in denen viele Wörter je nach Kontext unterschiedliche Bedeutungen haben können.
- Terminologieextraktion: Bei der Extraktion von Terminologie aus Texten ist es wichtig, nicht nur die spezifischen Fachbegriffe zu identifizieren, sondern auch ihre verschiedenen morphologischen Formen zu erkennen. Die Lemmatisierung ermöglicht es, diese verschiedenen Formen einem einzigen Lemma zuzuordnen, was die Konsistenz und Vollständigkeit der extrahierten Terminologiedatenbanken verbessert. So können Fachbegriffe unabhängig von ihrer konkreten Form im Text erkannt und korrekt kategorisiert werden.
- Prüfung von Übersetzungen: Bei der Terminologieprüfung, einem essentiellen Schritt im Übersetzungsprozess, spielt die Lemmatisierung eine besonders wichtige Rolle, insbesondere in stark flektierenden Sprachen wie dem Deutschen, Russischen, Polnischen und den slawischen Sprachen allgemein. Diese Sprachen zeichnen sich durch eine reiche Flexion aus, d.h., Wörter ändern ihre Form abhängig von grammatischen Kategorien wie Fall, Geschlecht, Zahl und Zeit.
Die Lemmatisierung unterstützt die Terminologieprüfung, indem sie hilft zu gewährleisten, dass alle Varianten eines Wortes korrekt identifiziert und in Übereinstimmung mit der festgelegten Terminologie übersetzt werden. In stark flektierenden Sprachen kann ein einziger Begriff in vielen verschiedenen morphologischen Formen auftreten, was ohne Lemmatisierung die Konsistenzprüfung erheblich erschweren würde. Zum Beispiel könnte das deutsche Wort „Lauf“ in Kontexten wie „des Laufes“, „die Läufer“ und so weiter erscheinen. Die Lemmatisierung ermöglicht es, diese verschiedenen Formen auf das Lemma „Lauf“ zurückzuführen, sodass die Terminologie konsistent gehandhabt wird, unabhängig von der spezifischen Verwendung im Text.
Beim Light-Post-Editing muss der Post-Editor inhaltliche Fehler, wie z.B. Verständnisfehler, Zahlen oder falsche Angaben korrigieren. Er soll aber nicht alle Syntaxfehler beseitigen, solange sie den Sinn des Satzes nicht verfälschen. Das Ziel von Light-Post-Editing ist ein korrekter und verständlicher Text, der nicht unbedingt in jeder Hinsicht die Qualität einer menschlichen Übersetzung erreichen muss.
Lokalisierung bezieht sich auf den Prozess, ein Produkt oder eine Dienstleistung sprachlich und kulturell an einen bestimmten Markt anzupassen. In Bezug auf unsere Branche wird der Begriff meistens im Zusammenhang mit Software oder Websites verwendet. Lokalisierung geht weiter als die reine Übersetzung von Oberflächentexte, Meldungen und Online-Inhalten. Bei der Lokalisierung werden lokale Aspekte wie Adressenformate, Telefonnummern, Mehrwertsteuerangaben, Zahlen-, Datums- oder Währungsformate angepasst. Einheiten (Temperatur, Masse) werden u.U. umgerechnet.
Synonym:
L10N
Spezielle Kategorie von Translation-Memory-Systemen, die für die Lokalisierung von Softwaredateien eingesetzt werden. Sie enthalten Filter für die gängigen Typen von Softwaredateien wie *.exe, *.dll, *.po, *.resx, *.json und viele andere. Darüber hinaus verfügen diese Programme über technische Qualitätssicherungsfunktionen, mit denen technische Aspete der lokalisierten Dateien geprüft werden können. Für bestimmte Dateitypen bieten sie eine Visualisierungsfunktion, d.h. der Übersetzer kann während der Übersetzung die Dialoge, Oberflächenelemente usw. sehen und ggfs. seine Übersetzung dem Platzbedarf anpassen.
Synonym:
Lokalisierungswerkzeug
Lokalisierungsprogramm
Lokalisierungstool
M
Unmittelbar nach dem Zweiten Weltkrieg wurde an der Entwicklung von Computerprogrammen gearbeitet, die automatisch übersetzen konnten. Viele Jahre lang waren diese Programme nicht sehr erfolgreich, aber zuerst die statistischen maschinellen Übersetzungssysteme in den 1990er Jahren und zu Beginn des Jahrtausends und seit etwa dem Jahr 2012 brachten die neuronalen maschinellen Übersetzungssysteme (NMT) den Durchbruch. Diese Systeme machen immer noch Fehler, können aber in Verbindung mit Postediting bei manchen Textsorten gute Ergebnisse liefern.
Synonyme:
MÜ Automatische Übersetzung Maschinelles Übersetzen
URL:
Die EU-Maschinenrichtlinie 2006/42/EG schreibt vor, dass eine Betriebsanleitung in mindestens einer EU-Amtssprache verfasst sein muss.
Wenn es keine Betriebsanleitung in einer Landessprache gibt, muss der Hersteller einer Maschine oder seine Vertretung gegebenenfalls eine Übersetzung liefern.
Jede übersetzte Betriebsanleitung muss mit dem Hinweis „Übersetzung der Originalbetriebsanleitung“ versehen sein.
Ab dem 13. Juli 2023 gilt die neue EU-Verordnung, die Verordnung (EU) 2023/1230, die die Verordnung aus dem Jahr 2006 ersetzt.
Wörtlich steht in der Verordnung: „Die EU-Konformitätserklärung muss in ihrem Aufbau dem Muster in Anhang V Teil A entsprechen und die in den einschlägigen Modulen der Anhänge VI, VIII, IX und X aufgeführten Elemente enthalten. Sie ist stets auf dem neuesten Stand zu halten und in die Sprachen zu übersetzen, die von dem Mitgliedstaat vorgeschrieben werden, in dem die Maschine bzw. das dazugehörige Produkt in Verkehr gebracht, auf dem Markt bereitgestellt oder in Betrieb genommen wird.“
Eine wesentliche Funktion, die den Erfolg von künstlicher Intelligenz erklärt. Maschinen sind in der Lage, Lösungen für bestimmte Ausgaben selbst zu lernen. Sie können das nach einem überwachten (supervised) oder unüberwachten Verfahren tun. Beim überwachten Lernen (supervised learning) wie es bei maschinellen Übersetzungen der Fall ist, lernt das System anhand von Übersetzungsbeispielen, wie es eine neue möglichst korrekte Übersetzung produzieren kann. Die komplexen Rechenalgorithmen verarbeiten die Parameter des Modells solange, bis der Unterschied zwischen Vorgabeübersetzung und maschineller Übersetzung minimal ist.
Synonym:
Machine Learning
Ein Oberbegriff, der alle Treffer bezeichnet, die ein Translation-Memory-System findet, wenn es Segmente/Sätze aus dem zu übersetzenden Text mit dem Inhalt einer Übersetzungsdatenbank abgleicht. Es gibt unter anderem Exact Matches und Fuzzy Matches.
In der Sprachwissenschaft bezeichnet ein Morphem die kleinste bedeutungstragende Spracheinheit. Ein Morphem kann für sich allein stehen (“freies Morphem”) oder ist Teil eines Wortes (“gebundenes Morphem) wie „un“ in „unschön“. Ein Wort kann mehrere Morpheme enthalten. Morpheme stellen für Übersetzer eine besondere Herausforderung dar („systemseitig = system+seit+ig“). Gebundene Morpheme sind z.B. Präfixe, Suffixe, Infixe.
Für die praktische Arbeit von Übersetzern spielt das Verständnis von Morphemen eine wesentliche Rolle aus mehreren Gründen:
1. Wortbildung und -verständnis: Die Kenntnis darüber, wie Wörter durch verschiedene Morpheme gebildet werden, hilft Übersetzern, die Bedeutung komplexer Wörter zu entschlüsseln und adäquate Entsprechungen in der Zielsprache zu finden. Dies ist besonders wichtig bei der Übersetzung von Fachterminologie oder Neologismen, wo die Bedeutung oft aus den einzelnen Morphemen abgeleitet werden kann.
2. Sprachliche Feinheiten: Unterschiedliche Sprachen verwenden unterschiedliche Methoden der Wortbildung, was die Wahl der richtigen Übersetzung beeinflusst. Zum Beispiel kann eine Sprache ein Konzept durch Zusammensetzung ausdrücken (zusammengesetzte Nomen), während eine andere dafür Präfixe oder Suffixe verwendet. Ein tiefes Verständnis für Morpheme ermöglicht es Übersetzern, solche strukturellen Unterschiede zu erkennen und angemessen zu berücksichtigen.
3. Anpassung an den Kontext: Manchmal erfordert die Übersetzung eine Anpassung der Wortform an den grammatischen Kontext der Zielsprache, etwa hinsichtlich der Zeitform, des Geschlechts oder der Zahl. Das Verständnis der Morpheme, die solche grammatischen Funktionen tragen, ist entscheidend, um korrekte und natürliche Übersetzungen zu produzieren.
4. Konsistenz in der Terminologiearbeit: Bei der Arbeit mit Fachterminologie müssen Übersetzer oft entscheiden, wie neue Begriffe in der Zielsprache gebildet oder bestehende angepasst werden sollen. Ein fundiertes Wissen über Morpheme ermöglicht es, systematisch und konsistent bei der Wortbildung vorzugehen, was für die terminologische Konsistenz über ein Projekt hinweg entscheidend ist.
5. Kreativität und Problemlösung: In manchen Fällen gibt es keine direkten Entsprechungen zwischen den Sprachen. Übersetzer müssen dann kreativ werden und neue Wörter oder Ausdrücke bilden. Ein gutes Verständnis für Morpheme erlaubt es, solche neuen Begriffe sinnvoll und nachvollziehbar zu konstruieren, indem existierende Morpheme der Zielsprache kombiniert werden.
Das Verständnis von Morphemen und ihrer Funktion ist für Übersetzer wichtig, denn das hilft, die Nuancen der Ausgangssprache zu erfassen und präzise, kohärente und angemessene Übersetzungen in der Zielsprache zu erstellen.
N
Moderne Form von maschinellen Übersetzungssystemen, die durch neuronale Netze trainiert werden. NMT-Systeme werden seit dem Jahr 2016 eingesetzt und zeichnen sich durch einen besonders flüssigen Stil aus.
Synonyme:
NMT
O
Oberbegriffe kommen in hierarchischen Begriffsklassifikationen vor, etwa bei Taxonomien. Der Oberbegriff „Fahrzeug“ umfasst mehrere Unterbegriffe wie „Auto“, „Eisenbahn“ oder „Fahrrad“, die die wesentlichen Eigenschaften des Oberbegriffs teilen (hier: Fortbewegungsmittel). Bei Ontologien gibt es keine Oberbegriffe, sondern Klassen, die eine ähnliche Funktion haben.
In der IT-Wissenschaft sind Ontologien eine maschinenlesbare Darstellung von Wissen in Form von Klassen und Instanzen von Klassen, die durch Relationen (Eigenschaften/Properties) miteinander verbunden sind. Ontologien sind in einem speziellen XML-basierten Format (in der Regel RDF oder OWL) verfügbar und speichern Fachwissen zu einem breiten Themenspektrum. Intelligente Computersysteme können diese Ontologien abfragen und daraus neue Informationen extrahieren. Eine bekannte Ontologie ist DBPedia, die das Wissen hinter Wikipedia modelliert.
Bezeichnet Terminologiebestände, die Terminologieeinträge nach Begriffen organisieren und darüber hinaus Begriffe bzw. Benennungen über Relationen miteinander verbinden. Auf diese Weise kann Wissen auf der Grundlage traditioneller begriffsorientierter Terminologie modelliert werden. Beispiel: Die Verbindung der Begriffe Auto – Motor – Lenkrad – Windschutzscheibe – Benzin kann in einer solchen intelligenten Terminologie Definitionen erweitern und zusätzliches Wissen darstellen. Intelligente Terminologien sind in der Regel maschinenlesbar.
Synonym:
Intelligente Terminologie
Wissenshaltige Terminologie
P
Kategorie bei der Analyse von Dateien durch Translation-Memory-Systeme. Ein Perfectmatch funktioniert ähnlich wie ein Kontext-Match. Statt die Sätze(Segmente) eines Textes mit dem Inhalt einer Translation-Memory zu vergleichen, werden diese mit früheren Übersetzungen verglichen, die als vorsegmentierte zweisprachige Dokumente vorliegen. Oftmals handelt es sich bei diesen Dokumenten um frühere Versionen eines neu zu übersetzenden Dokuments.
Bezieht sich auf die Korrektur einer maschinellen Übersetzung durch einen ausgebildeten Post-Editor. Post-Editoren lernen, welche Fehler maschinelle Übersetzungssysteme machen und korrigieren sie entsprechend den Vorgaben des Auftraggebers. Eine Norm beschreibt die Anforderung an ihre Arbeit, die Norm ISO 18587:2018. Diese Norm unterscheidet zwischen zwei Stufen von Post-Editing: Light-Post-Editing und Full-Post-Editing.
Synonym:
Post Editieren
Das Projektmanagement in einem Übersetzungsbüro ist ein komplexer Prozess, der verschiedene Aspekte und Phasen umfasst, um die erfolgreiche Durchführung von Übersetzungsprojekten zu gewährleisten. Hier eine detaillierte Betrachtung der einzelnen Schritte:
1. Auftragsanalyse und Angebot: Der Prozess beginnt mit der detaillierten Analyse des Kundenantrags, um den Umfang, die spezifischen Anforderungen und die Komplexität des Projekts zu verstehen. Basierend darauf wird ein Angebot erstellt, das die Kosten, die Zeitrahmen und die spezifischen Bedingungen des Projekts umfasst.
2. Wahl der Produktionsweise: Abhängig vom Typ des Projekts (Softwarelokalisierung, maschinelle Übersetzung (MÜ) und Post-Editing, Website-Übersetzung, Video-Untertitelung etc.) wird die geeignete Produktionsmethode ausgewählt. Hierbei sind technologische Anforderungen, das Format und der Zweck des Endprodukts zu berücksichtigen. Wichtig sind dabei u.a. folgende Punkte:
– Technologie: Der Einsatz von Übersetzungstechnologien wie CAT-Tools (Computer-Aided Translation), TMS (Translation Management Systems), und maschinellen Übersetzungssystemen ist entscheidend für Effizienz und Konsistenz.
– Sprachen und Spracheigenschaften: Besondere Aufmerksamkeit erfordern Sprachen mit besonderen Eigenschaften wie Rechts-nach-Links-Schrift (Hebräisch, Arabisch), die spezielle Anpassungen in der Lokalisierung und im Layout erfordern.
– Beschaffenheit der Dateien: Die Analyse der Dateien hinsichtlich Links, eingebetteter Grafiken und Formatierung ist wesentlich, um eine vollständige und korrekte Übersetzung zu gewährleisten.
3. Auswahl der Übersetzer und Revisoren: Für jedes Projekt werden spezialisierte Übersetzer und Revisoren ausgewählt, die über die notwendigen sprachlichen und fachlichen Qualifikationen verfügen.
4. Formulierung der Arbeitsanweisungen: Die spezifischen Anforderungen und Wünsche des Kunden werden in detaillierten Arbeitsanweisungen festgehalten, um sicherzustellen, dass das Endprodukt den Erwartungen entspricht.
5. Terminologieextraktion und -pflege: Fachterminologie wird extrahiert und in Terminologiedatenbanken erfasst. Die Pflege dieser Datenbanken ist entscheidend für die Konsistenz und Qualität der Übersetzungen.
6. Qualitätskontrolle: Vor der Lieferung an den Kunden durchläuft das Projekt mehrere Qualitätskontrollen, einschließlich Lektorat, Korrekturlesen und technischer Überprüfungen.
7. Nachbearbeitung: Anpassungen im Layout oder der Formatierung werden vorgenommen, insbesondere bei Sprachen, die eine andere Textlänge oder -richtung aufweisen, um das Layout des Originaldokuments zu bewahren.
8. Kommunikation während des Projekts: Die kontinuierliche Kommunikation mit Kunden, Übersetzern, Terminologen und Revisoren ist entscheidend, um Unklarheiten zu beseitigen, Feedback zu integrieren und den Projektfortschritt zu überwachen.
9. Überwachung der Termine und Kosten: Ein effektives Projektmanagement umfasst die ständige Überwachung von Fristen und Budgets, um sicherzustellen, dass das Projekt innerhalb der vereinbarten Parameter abgeschlossen wird.
10. Abrechnung: Nach Abschluss des Projekts erfolgt die Abrechnung basierend auf den im Angebot festgelegten Konditionen.
11. Pflege der Datenbestände: Translation Memories (TMs) und Terminologie: Ein wesentlicher Bestandteil des Projektmanagements in einem Übersetzungsbüro ist die kontinuierliche Pflege und Aktualisierung von Translation Memories und Terminologiedatenbanken. Translation Memories speichern frühere Übersetzungen und ermöglichen es, konsistente Übersetzungen bei wiederkehrenden Textsegmenten oder ähnlichen Projekten effizient zu nutzen. Die sorgfältige Pflege dieser TMs trägt dazu bei, die Übersetzungsqualität zu verbessern und den Übersetzungsprozess zu beschleunigen, indem bereits übersetzte Inhalte wiederverwendet werden.
Diese verschiedenen Aspekte erfordern ein tiefes Verständnis für die Prozesse und Technologien im Bereich der Übersetzung sowie ausgeprägte Kommunikationsfähigkeiten, um die verschiedenen Phasen des Projekts effektiv zu managen und hochwertige Übersetzungen zu liefern.
Prompt Engineering ist eine Technik im Bereich des Machine Learning, insbesondere in Verbindung mit Large Language Models (LLMs). Dabei werden spezifische Anweisungen oder „Prompts“ erstellt, um die Modelle auf eine bestimmte Art und Weise zu steuern oder zu „finetunen“. Diese Methode wird eingesetzt, um LLMs wie ChatGPT dazu zu bringen, spezielle linguistische Aufgaben in Bereichen wie Übersetzung und technische Redaktion zu erfüllen. Prompt Engineering optimiert die Interaktion mit dem Modell, sodass es besser auf spezifische Anforderungen, beispielsweise das Erkennen von Fachjargon oder das Generieren von kohärenten und kontextrelevanten Texten, eingehen kann.
Q
Die Produktion von Übersetzungen ist zunehmend ein arbeitsteiliger Prozess geworden. Sowohl die zu übersetzenden Inhalte als auch die Übersetzungen stammen teilweise aus Datenbanken (Content-Management-Systeme bzw. Translation-Memorys) und sind über Jahre von unterschiedlichen Autoren/Übersetzern erstellt worden. Die verwendete Terminologie ist manchmal uneinheitlich. Die Datenformate können besondere Herausforderungen bereiten. Viele Faktoren beeinflussen die Qualität einer Übersetzung. Deswegen führen die meisten professionellen Anbieter von Übersetzungen eine Qualitätssicherung ihrer Arbeit durch. Die Norm ISO 17100 regelt den Qualitätssicherungsprozess und stellt Anforderungen an die Qualifikation der beteiligten Mitarbeiter (Übersetzer, Revisoren und Projektmanager).
R
Redaktionssysteme oder Content-Management-Systeme (CMS) sind Softwaresysteme zur Verwaltung von Inhalten wie Benutzerhandbücher, Reparaturanleitungen oder Webinhalten. CMS verwalten Informationseinheiten und können diese in mehreren Sprachen mit zusätzlichen Metainformationen speichern. Wenn neue Inhalte erstellt oder ein bestehendes Handbuch aktualisiert werden muss, können die bestehenden Inhalte wiederverwendet werden. Die meisten CMS trennen Inhalt und Layout-Informationen. So kann derselbe Inhalt für verschiedene Medien wie Webseiten, gedruckte Handbücher oder mobile Geräte veröffentlicht werden.
Synonyme:
Content-Management-System
CMS
Reguläre Ausdrücke werden in vielen Programmier- und Skriptsprachen implementiert und sind in abgeschwächter Form in mehreren Editoren wie MS-Word vorhanden. Mit regulären Ausdrücken kann man in Texten nach typischen Mustern suchen oder Zeichenketten (Strings) manipulieren.
Synonym:
Regulärer Ausdruck
In der Welt der technischen Dokumentation und Übersetzung ist es unerlässlich, eine Vielzahl von Tools und Methoden zu beherrschen, um effizient und präzise zu arbeiten. Unter diesen Werkzeugen ist ein Begriff besonders häufig anzutreffen: der reguläre Ausdruck.
Was sind Reguläre Ausdrücke?
Reguläre Ausdrücke, oft auch als „Regex“ abgekürzt, sind Sequenzen von Zeichen, die ein Suchmuster beschreiben. Sie werden verwendet, um Texte zu durchsuchen, zu bearbeiten und zu extrahieren, basierend auf bestimmten Kriterien oder Mustern. Diese Muster können sehr einfach oder äußerst komplex sein, abhängig von den Anforderungen der Aufgabe.
Beispiele für Anwendungen in der technischen Dokumentation
1. Entfernen von überflüssigen Leerzeichen und Normalisierung von Texten: Reguläre Ausdrücke können verwendet werden, um Leerzeichen zu identifizieren und zu entfernen, die nicht Teil des Textinhalts sind. Dies ist besonders nützlich, um Leerzeichen am Anfang oder Ende eines Absatzes oder Dokuments zu bereinigen. Technische Dokumentationen müssen oft in einem einheitlichen Stil geschrieben sein. Reguläre Ausdrücke können verwendet werden, um Texte zu normalisieren, z.B. durch das Umwandeln von Wörtern in Kleinbuchstaben, das Entfernen von Akzenten oder das Vereinheitlichen von Abkürzungen.
2. Suche nach wiederkehrenden Wörtern oder Wortgruppen: In großen Dokumentationen können sich bestimmte Phrasen oder Begriffe wiederholen, die konsistent sein müssen. Ein Redakteur kann reguläre Ausdrücke verwenden, um diese Phrasen zu identifizieren und sicherzustellen, dass sie einheitlich verwendet werden, um die Kohärenz und Verständlichkeit des Textes zu verbessern.
Ein Beispiel für einen Regex-Ausdruck zur Entfernung überflüssiger Leerzeichen am Anfang und Ende eines Textes wäre: „`^\s+|\s+$„`. Dieser Ausdruck sucht nach Leerzeichen am Anfang (`^\s+`) oder Ende (`\s+$`) eines Textes und entfernt sie.
Beispiel für Nutzung in der Übersetzung
1. Suche nach Oberflächentexten: Bei der Übersetzung technischer Dokumentation ist es entscheidend, dass Oberflächentexte konsistent übersetzt werden. Mit regulären Ausdrücken können Übersetzer nach solchen Texten suchen suchen (z.B. wenn sie zwischen Anführungszeichen stehen) und sicherstellen, dass sie einheitlich übersetzt werden, um Verwirrung beim Leser zu vermeiden.
2. Dateiformatierung für Übersetzungstools vorbereiten: Übersetzer arbeiten oft mit speziellen Übersetzungstools, die die Verwendung regulärer Ausdrücke unterstützen. Vor der Übersetzung müssen z. B. aus PDF konvertierte Dateien möglicherweise formatiert oder bereinigt werden, damit sie reibungslos in diese Tools importiert werden können. Reguläre Ausdrücke können verwendet werden, um diese Formatierungsaufgaben automatisch durchzuführen.
Tools wie Trados oder ErrorSpy unterstützen die Verwendung regulärer Ausdrücke, um bestimmte Aufgaben effizienter zu erledigen.
Eine Webseite, mit der man Reguläre Ausdrücke testen kann, ist www.regex101.com. Auf dieser Website können Benutzer Reguläre Ausdrücke eingeben und testen, wie sie auf verschiedenen Textmustern angewendet werden.
Fazit
Reguläre Ausdrücke sind ein leistungsstarkes Werkzeug für technische Autoren und Übersetzer, um Texte effizient zu bearbeiten, zu durchsuchen und zu strukturieren. Durch das Verständnis und die Beherrschung dieser Technik können Fachleute ihre Produktivität steigern und hochwertige Ergebnisse liefern.
Synonym:
Regex
Die DIN EN ISO 17100:2016-05 definiert Revision als: zweisprachige Überprüfung eines zielsprachlichen Inhalts im Vergleich mit dem ausgangssprachlichen Inhalt auf Eignung für den vereinbarten Zweck.
S
In der Übersetzungsbranche bezeichnet Segmentierung die Zerlegung von Texten in einzelne Segmente. Segmente sind meistens Sätze, können aber kürzer oder länger sein (z.B. ganze Sätze). Anbieter von Translation-Memory-Systemen tauschen ihre Segmentierungsregeln im SRX-Format aus.
Semantik ist die Lehre von der Bedeutung von Wörtern, Aussagen oder Zeichen. Die Klärung von Bedeutung steht im Mittelpunkt der Arbeit von technischen Redakteuren und Übersetzern. Semantik spielt ebenfalls im wachsenden Bereich von KI und der Verarbeitung natürlicher Sprache eine Rolle. Deswegen sind Bemühungen zum Aufbau von Terminologiedatenbanken oder Wissenssystemen wie Ontologien von großer Bedeutung für den Erfolg von Unternehmen.
Ein Modell, das zu den Grundprinzipien der Terminologielehre gehört und bereits im Jahr 1923 durch Odgen und Richards in ihrem Buch „The meaning of meaning“ eingeführt wurde. Im Grunde stellt das Dreieck die Beziehung zwischen (1) abstraktem Begriff, (2) Benennungen, die ihn bezeichnen und (3) der konkreten Repräsentation des Begriffs.
Suchmaschinenoptimierung wird durchgeführt, um die Chancen zu erhöhen, dass eine Webseite von den gängigen Suchmaschinen wie Google oder Bing gefunden wird. SEO steht für das Englische „Search Engine Optimization“.
Ein besonderer Aspekt von SEO ist die Lokalisierung von Keywords für andere Länder und Sprachen. Es gibt unterschiedliche Suchmaschinen (z.B. Yandex in Russland) und die Keywords können in anderen Ländern und Kulturen sehr unterschiedlich sein.
Synonym:
Suchmaschinenoptimierung
Search Engine Optimization
Bei der Softwareentwicklung bedeutet Lokalisierung die Anpassung von Programminhalten an die Anforderungen des Zielmarktes. Das betrifft sowohl sprachliche als auch inhaltliche (z.B. Adressenformate), technische (z.B. Codierung, Sortierung) oder kulturelle Aspekte (Symbole, Farben).
Manche Übersetzungsdienstleister haben sich auf die Lokalisierung von Software spezialisiert und setzen dafür geeignete Übersetzungsprogramme und Verfahren ein.
Statistische Maschinelle Übersetzungssysteme (SMT) wurden in den 1990er Jahren eingeführt, waren ursprünglich wortbasiert und sind danach auf Wortgruppen (Phrasen) und weitere Merkmale erweitert worden. Sie berechnen die Häufigkeit des gemeinsamen Vorkommens von Wortgruppen in Paralleltexten sowie einige weitere Merkmale und verwenden diese Statistiken, um neue Übersetzungen zu generieren. Viele Jahre lang war SMT die führende maschinelle Übersetzungstechnologie, die nun von neuronalen maschinellen Übersetzungssysteme abgelöst wurde.
Synonym:
SMT
Diese Listen von Stoppwörtern werden für verschiedene linguistische Aufgaben wie die Terminologieextraktion verwendet. Sie enthalten häufige Wörter einer Sprache wie Artikel, Konjunktionen usw., die für bestimmte Anwendungsfälle nicht relevant sind.
Synonym steht für eine Benennung, die die gleiche Bedeutung hat als eine andere Benennung. Beispiel: „Software“ und „Programm“ sind Synonyme. Bei begriffsorientierten Terminologien werden Synonyme unter einem Begriff zusammengefasst. Neben volle Synonymen gibt auch Quasi-Synonyme, d.h. Benennungen, die fast die gleiche Bedeutung haben oder die nicht ohne Weiteres austauschbar sind.
Regeln für die Bildung von Sätzen in einer Sprache. Viele Sprachen wie z.B. Englisch basieren auf dem SVO-Modell (Subjekt – Verb – Objekt). Es gibt aber andere Grundkonstruktionen: SOV (Japanisch, Koreanisch, Türkisch) oder VSO (Arabisch). In früheren Jahren waren maschinelle Übersetzungssysteme regelbasiert. Sie übertrugen unter anderem die syntaktischen Regeln einer Sprache in die andere.
Eine synthetische Sprache ist eine Sprache, die Wörter durch Flexion (Beugung) oder Agglutination (Anfügung) bildet, um grammatikalische Beziehungen auszudrücken. Deutsch ist eine synthetische Sprache.
Synthetische Sprachen nutzen morphologische Prozesse, um grammatische Funktionen innerhalb von Sätzen zu vermitteln. Im Gegensatz zu analytischen Sprachen, die hauptsächlich separate Wörter und feste Wortreihenfolgen verwenden, um grammatische Beziehungen zu signalisieren, verändern synthetische Sprachen die Form von Wörtern selbst durch Flexion oder Agglutination.
Flexion bezieht sich auf die Modifikation von Wörtern, um verschiedene grammatische Kategorien wie Zeit, Fall, Geschlecht, Zahl oder Modus auszudrücken. Ein einziges Wort kann durch Flexion mehrere grammatische Informationen tragen. Zum Beispiel kann in vielen indoeuropäischen Sprachen ein Verb durch seine Beugung Zeit, Aspekt, Modus, Person und Zahl signalisieren.
Agglutination ist eine weitere Form der Wortänderung, bei der Affixe (Präfixe, Suffixe, Infixe oder Zirkumfixe) an ein Stammwort angehängt werden, um verschiedene grammatische Bedeutungen auszudrücken. Agglutinierende Sprachen zeichnen sich dadurch aus, dass jedes angehängte Morphem in der Regel nur eine grammatische Bedeutung trägt, was zu langen Wortformen führen kann, die mehrere grammatische Eigenschaften gleichzeitig ausdrücken.
Synthetische Sprachen lassen sich weiter in agglutinierende und flektierende (oder fusionierende) Sprachen unterteilen, abhängig davon, wie stark die Morpheme in Bezug auf ihre Bedeutung verschmelzen. Agglutinierende Sprachen neigen dazu, klar voneinander getrennte Morpheme für verschiedene grammatische Funktionen zu verwenden, während in flektierenden Sprachen ein einzelnes Morphem mehrere grammatische Funktionen gleichzeitig tragen kann.
Diese morphologischen Eigenschaften ermöglichen es synthetischen Sprachen, eine hohe Informationsdichte auf Wortebene zu erreichen, wodurch die Struktur und der Ausdruck der Sprache komplex und nuanciert werden.
Einige Beispiele für synthetische Sprachen sind:
- Russisch: Eine flektierende Sprache mit einem komplexen System von Kasus, Aspekten und Verbkonjugationen.
- Finnisch: Bekannt für seine agglutinierende Struktur, wobei Affixe in klarer Abgrenzung zueinander verwendet werden, um zahlreiche grammatische Nuancen auszudrücken.
- Türkisch: Eine weitere agglutinierende Sprache, die für ihre Fähigkeit bekannt ist, durch Anhängen von Affixen an Stämme lange und komplexe Wörter zu bilden, die ganze Sätze äquivalent darstellen können.
- Deutsch: Hat sowohl flektierende als auch agglutinierende Eigenschaften, mit einem System von Kasus für Nomen und einem komplexen System von Verbkonjugationen.
Siehe auch isolierende Sprachen
T
Klassifikationsschema für Begriffe und Benennungen, i.d.R. hierarchisch: Fahrzeug > Auto > Ford Fiesta. Begriffe können mehrere Zuordnungen haben.
TBX ist ein Akronym für TermBase eXchange und ist ein Standard für den Austausch von Terminologiedaten. Obwohl TBX ein Standard ist, wird er von den Anbietern von Terminologiesystemen nicht immer einheitlich implementiert, so dass es einige Dialekte von TBX gibt. Die Version 3 von TBX ist eine internationale Norm: ISO 30042:2019
Eine Fachkraft, die sich auf die Vermittlung komplexer technischer Informationen spezialisiert hat. Technische Redakteure sind in erster Linie für die Erstellung von Dokumentationen wie Betriebsanleitungen, Montageanleitungen, Reparaturanleitungen usw. verantwortlich. Hierfür werden spezielle Programme wie Content-Management-Systeme und Grafikprogramme eingesetzt. Die Gesellschaft für Technische Kommunikation – tekom Deutschland e.V. vertritt die Redakteure und bietet viele Informationen rund um den Beruf.
Terminologieextraktion ist der Prozess, bei dem Fachwörter, die ein Text (ein Korpus) enthält, identifiziert und für die Aufnahme in eine Terminologiedatenbank ausgewählt werden. Die Definition dessen, was ein Terminus ist, kann variieren und hängt oft vom Zweck der Terminologiearbeit ab. In der Übersetzungsbranche wird die Terminologieextraktion regelmäßig durchgeführt, um sicherzustellen, dass Übersetzer die Begriffe verstehen und konsistent verwenden.
Es gibt verschiedene Ansätze zur Automatisierung oder Halbautomatisierung dieses Prozesses:
1. Statistische Terminologieextraktion: Dieser Ansatz basiert auf der Analyse der Häufigkeit, mit der Wörter oder Wortgruppen in einem Textkorpus vorkommen. Eine konkrete Umsetzung mit dem kostenlosen Programm AntConc haben wir in unserem Blog-Artikel statistische Terminologieextraktion mit AntConc beschrieben. Fortgeschrittenere Methoden wie die PMI (Pointwise Mutual Information) berechnen die Stärke der Beziehung zwischen Wörtern, um relevante Termini zu identifizieren.
2. Linguistische Terminologieextraktion: Hier werden grammatikalische Kategorien von Wörtern genutzt, um Fachtermini zu extrahieren. Ein Beispiel wäre die Suche nach Kombinationen aus Adjektiv und Nomen, die oft in Fachsprachen genutzt werden, um spezifische Konzepte oder Eigenschaften zu beschreiben. Auch hier gibt es einen zweiten Bog-Artikel linguistische Terminologieextraktion mit AntConc, der konkrete Umsetzungsbeispiele gibt. Seit Januar 2024 haben wir asserdem eine linguistische Terminologieextraktion in unser Terminologieverwaltungssystem LookUp integriert.
3. Regelbasierte Terminologieextraktion: Bei diesem Ansatz werden bestimmte Muster innerhalb von Textkorpora gesucht, beispielsweise in Produktlisten oder Bildlegenden. Diese Methode setzt voraus, dass man im Voraus weiß, in welcher Form relevante Terminologie typischerweise auftritt.
4. Terminologieextraktion mit Unterstützung von KI: Der Einsatz von Künstlicher Intelligenz, insbesondere von Large Language Models (LLMs) und maschinellem Lernen, ermöglicht es, Terminologie anhand von Beispielen zu lernen und zu identifizieren. Prompts können genutzt werden, um LLMs spezifische Aufgaben der Terminologieextraktion durchführen zu lassen.
Diese Methoden können sowohl isoliert als auch in Kombination angewendet werden, um die Effizienz und Genauigkeit der Terminologieextraktion zu maximieren. Die Wahl der Methode hängt von den spezifischen Anforderungen des Projekts, der Beschaffenheit des Textkorpus und den verfügbaren Ressourcen ab. Die extrahierte Terminologie wird dann in Datenbanken gespeichert, um als Referenz für zukünftige Übersetzungsprojekte zu dienen und eine konsistente Verwendung spezialisierter Begriffe zu gewährleisten.
Bezeichnet alle Aktivitäten, die zur Erstellung von Fachterminologie beitragen. Dies umfasst in der Regel die Extraktion, Organisation, Pflege, Verteilung und Bereitstellung von Terminologie. Meist wird die Terminologiearbeit in Unternehmen oder Organisationen oder von Fachleuten wie Übersetzern und Redakteuren im Rahmen ihrer beruflichen Tätigkeit durchgeführt.
Beschreibt die Situation, in der es für einen bestimmten Begriff in einer anderen Sprache oder in einem anderen Kulturkreis keine Entsprechung gibt. Dies ist häufig bei alltäglichen Dingen wie Gerichten der Fall, aber auch im technischen Bereich findet man oft eine Terminologielücke, insbesondere wenn es um Innovationen, um neue Produkte oder Begriffe geht. Die hohe Zahl englischer Termini in der deutschen Fachsprache ist ein Beleg für dieses Phänomen.
Ein Thesaurus ist eine organisierte Sammlung von Begriffen, die sich auf ein bestimmtes Thema oder Fachgebiet beziehen. Ein Thesaurus beschreibt die Relationen zwischen den Begriffen und erfasst Synonyme für die Benennungen, die einen Begriff bezeichnen. Die Norm DIN 1463-1 definiert ein Thesaurus als „eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient. (S. 22)“
Sowohl Terminologiedatenbanken, die in der technischen Kommunikation eingesetzt werden, als auch Thesauri sind begriffsorientiert, da sie beide auf der Organisation, Verwaltung und Bereitstellung von Begriffen und zugehörigen Informationen basieren. Daher ist es nicht immer einfach, zwischen beiden Terminologiesystemen zu unterscheiden. Der Hauptunterschied liegt in ihrem spezifischen Zweck und Anwendungsbereich:
Terminologiedatenbanken sind in der Regel auf die Bedürfnisse von Übersetzern und technischen Autoren ausgerichtet. Sie enthalten detaillierte Informationen zu Fachbegriffen, einschließlich fremdsprachlicher Entsprechungen, Definitionen, Kontextbeispielen und anderen Metadaten, um die Genauigkeit und Konsistenz der Terminologieanwendung über verschiedene Sprachen hinweg zu gewährleisten.
Thesauri dienen in erster Linie der Informationssuche und -organisation. Sie erfassen die Beziehungen zwischen Begriffen wie Synonyme, Antonyme und hierarchische Verknüpfungen, um das Auffinden und Indexieren von Informationen innerhalb eines bestimmten Wissens- oder Dokumentationsbereichs zu erleichtern.
TMX steht für Translation Memory eXchange und ist ein Standardformat für den Austausch von Translation-Memorys. Eine TMX-Datei ist XML-basiert und kann mit einem Texteditor geöffnet werden. Aktuell gilt die Version TMX 1.4b vom Jahr 2005.
Ist die grafische Darstellung einer Wissenseinheit.
Begriffe, die gemeinsam ein Wissen darstellen, werden mit hierarchischen und assoziative Relationen verknüpft. Ein Auto ist ein Fahrzeug (hierarchische Beziehung = Oberbegriff) und verbrauch Benzin (assoziative Beziehung).
Wie der Name schon sagt, ist die Transkreation eine Mischung aus Translation und Kreation. Der Übersetzer passt die Übersetzung an die Kultur der Zielgruppe an.
Dies gilt insbesondere für Slogans, für Anspielungen auf Ereignisse, auf öffentlich bekannte Personen, auf Redewendungen und Sprichwörter oder für Beispiele.
Der Slogan der Bundeskanzlerin „Wir schaffen das“ wird in anderen Ländern ohne Kenntnis des damaligen Kontextes schwer zu verstehen sein. Hierfür kann die Kultur des Ziellandes eine vergleichbare Formulierung liefern, die der Transkreator verwenden kann.
Die Buchstaben eines Wortes werden in ein anderes Schriftsystem übertragen. Das kann z.B. vorkommen, wenn in einem Dokument russische Namen in lateinischer Schrift geschrieben werden.
Es ist ein Übersetzungssystem, mit dem Übersetzer Texte übersetzen. Das Übersetzungssystem speichert jeden übersetzen Satz (Segment) zweisprachig in einer Datenbank (Translation-Memory).
Wenn ein Dokument einen Satz enthält, der bereits in einem früheren Projekt übersetzt wurde, schlägt es ihn dem Übersetzer vor. Wenn der im Translation-Memory gefundene Satz nicht ganz mit dem Satz im Text übereinstimmt, spricht man von einem Fuzzy-Match. Der Übersetzer kann die ähnliche Übersetzung aus dem Memory übernehmen und anpassen. Dadurch wird er oder sie produktiver. Inzwischen haben Translation-Memory-Systeme eine ganze Reihe von fortgeschrittenen Produktivitätsfunktionen und integrieren häufig maschinelle Übersetzungssysteme.
Synonyme:
TMS
TM-System
Translation-Memory-Anwendung
Translation-Memory-Programm
Translation-Memory-Software
Translation-Memory-Tool
Translation-Memory-Werkzeug
Unter einer Transkreation versteht man in der Werbung die Übersetzung eines Werbetextes in eine andere Sprache unter Berücksichtigung veränderter kultureller Bedingungen und Zusammenhänge.
U
Unternehmen oder Einzelperson, die Übersetzungen als Dienstleistung anbietet. Man unterscheidet zwischen SLV (Single Language Vendor) und MLV (Multi-Language Vendor).
Synonyme:
LSP
Language Service Provider
Sprachdienstleister
Übersetzungsagentur
Übersetzungsbüro
Übersetzungsunternehmen
Unternehmen, die ihre Texte regelmäßig übersetzen lassen, können ihre Texte für den Übersetzungsvorgang optimieren. Externe Übersetzer fehlen manche Kenntnisse über die Produkte eines Unternehmens.
Manche Ausdrucksweisen können mehrdeutig sein. Fachwörter, die zu allgemein sind (z.B. Behälter) müssen in einigen Sprachen präziser übersetzt werden. Übersetzungsgerechtes Schreiben bedeutet, dass bereits in der Redaktionsphase möglichst viele potentielle Fragen des Übersetzers durch eine andere oder genauere Schreibweise vermieden werden. Viele der Prinzipien, die für kontrollierte Sprache gelten (kurze Sätze, standardisierte Syntax, einheitliche Terminologie) gelten auch für übersetzungsgerechtes Schreiben. Beim übersetzungsgerechten Schreiben liegt der Schwerpunkt jedoch auf der Optimierung der Übersetzung.
Steht für Universal Coded Character Set (UCS) und ist ein Standard (ISO 10646) für die Codierung von Zeichen. In den 80er Jahren hatten die Computer nicht ausreichen Kapazität und Möglichkeiten, um Zeichen aller Sprachen darzustellen. Code-Tabellen waren auf einzelne Sprachgruppen beschränkt, was zu größeren Schwierigkeiten führte, wenn Zeichen oder Buchstaben aus verschiedenen Sprachfamilien auf demselben System angezeigt werden sollten. Erst Anfang der 1990er Jahre kam der Durchbruch mit einem 16-Bit-Zeichensatz und der ersten Version des Unicode-Standards. Inzwischen kann Unicode etwa 100.000 Schriftzeichen (darunter Emoticons) darstellen. Oft ist von UTF (Unicode Transformation Format) in drei Varianten (UTF-8, UTF-16 und UTF-32) die Rede. Am weitesten Verbreitet ist die UTF-8 Variante, die den Speicherplatz für Unicode-Zeichen optimiert.
V
Im Zusammenhang mit der Qualitätssicherung von Übersetzungen bedeutet dieses Prinzip, dass mindestens zwei Personen eine Übersetzung gesehen und überprüft haben. In der Regel ist dies der Übersetzer, der seine eigene Arbeit überprüft, und ein Revisor, der die Übersetzung im Vergleich zum Ausgangstext redigiert.
W
Wenn ein Segment oder ein Satz mehrmals in einem Text vorkommt, nennt man dies Wiederholung.
Der Übersetzer braucht nur das erste Vorkommen des Satzes zu übersetzen, und seine Übersetzung wird für die nachfolgenden Sätze wiederverwendet. Dies wird von Translation-Memory-Systemen automatisch durchgeführt. Dadurch werden Übersetzungen günstiger. Was das konkret bedeutet, erklären wir auf unserer Seite Preise. Daher möchte man bei der Analyse eines Textes wissen, wie viele Wiederholungen vorkommen.
Synonyme:
interne Wiederholung
X
Akronym für XML Localization Interchange File Format. Ist ein offenes Standardformat für die Übertragung von Übersetzungsdaten zwischen verschiedenen Tools und Systemen.
Y
Akronym für Yet Another Markup Language. Dateityp, der zum Speichern und Übertragen von Daten in einer für Menschen lesbaren und leicht zu verarbeitenden Form verwendet wird, z.B. für Konfigurationsdaten. Bei Software-Lokalisierungsprojekten muss darauf geachtet werden, dass die Dateiinhalte korrekt lokalisiert sind.
Z
Abrechnungsmodus für Übersetzungen. In der Regel handelt es sich um die übersetzte Zeile. Die Länge der Zeile ist auf 50 oder 55 Bruttozeichen (einschließlich Leerzeichen) festgelegt. Da vor der Übersetzung nicht bekannt ist, wie lang die Übersetzung sein wird, werden Expansionsfaktoren verwendet, um die Kosten für jede Sprache zu schätzen. Beispiel: Französisch oder Spanisch sind im Durchschnitt 20% länger als Deutsch. War in den 90er Jahren sehr verbreitet. Die Einführung von TMS hat dazu geführt, dass die zeilenbasierte Abrechnung zugunsten einer wortbasierten Abrechnung, die auf den Wörtern der Ausgangssprache basiert, verdrängt wurde.
Benötigen Sie eine Terminologie für Ihr Unternehmen?
Jedes Fachgebiet verwendet eine spezifische Terminologie. Systematische Terminologiearbeit unterstützt die interne und externe Kommunikation. Sprechen Sie uns an. Wir unterstützen Sie gerne.