Posteditace neboli následná úpravastrojového překladu „je procesem vylepšovánípřekladu vytvořenéhopočítačem při vynaložení minimálního manuálního úsilí“.[1] Člověku, který tuto činnost vykonává, se říkáposteditor.
Posteditace je úzce spjata s pojmempreeditace (úprava textu předcházející strojovému překladu). Právě úpravou zdrojového textu před jeho podrobením strojovému překladači (například aplikováním principůredukovaného jazyka) a následnou editací výstupu ze strojového překladače je možné ustrojového překladu dosáhnout nejlepších výsledků. Posteditace v tomto smyslu se od běžnéeditace textu vytvořeného člověkem liší. V oblastipřekladu se rozlišuje mezi korekturou, revizí a editací. Zatímco korekturou se rozumí oprava pravopisu a překlepů, editace zahrnuje úpravu celých vět i opravu terminologie. Revize je pak kontrolou překladu s přihlédnutím k výchozímu textu.[2] Text, který prošel posteditací, je možné následně ještě podrobit revizi, aby se dohlédlo na správný výběr slov, nebo kontrole a korekci menších chyb.
Při posteditaci jde o úpravu výstupustrojového překladu do takové míry, na jaké se předem domluví klient a posteditor. Výsledkemzákladní posteditaceje víceméně srozumitelný text, naopakúplná posteditacezaručí, žepřeklad je přiměřený také po stylistické stránce. Úplná posteditace se tak s pokrokem vstrojovém překladu stává alternativou propřeklad ruční. Existuje řada softwarových nástrojů, které umožňují následně editovat výstupstrojového překladu. Patří sem napříkladGoogle Translator Toolkit,Trados,Unbabel aSYSTRAN.[3][4]
Koncem sedmdesátých letstrojový překlad opustil laboratoř a začal se používat na účel, pro který byl vynalezen. Používaly ho některé velké instituce jakoEvropské komise a Panamerická zdravotnická organizace, později také společnosti jakoCaterpillar aGeneral Motors. První studie o posteditaci se objevily v osmdesátých letech a týkaly se právě těchto implementací.[5][6] Aby se mohly vytvořit přiměřené zásady a vzdělávací instituce, členové AMTA – Association for Machine Translation in the Americas(Sdružení pro strojový překlad v Amerikách) a EAMT – European Association for Machine Translation (Evropského sdružení pro strojový překlad) založili v roce1999 Post-editing Special Interest Group (Zájmovou skupinu pro posteditaci).[7]
Pokroky v kapacitě a propojitelnostipočítačů po devadesátých letech urychlily vývojstrojového překladu a dovolily mu rozšířit se dowebových prohlížečů, kromě jiného ve formě užitečných bezplatných doplňků pro nejznámější vyhledávače (Google Translate,Microsoft Translator,Babel Fish). Širší přijetí nedokonaléhostrojového překladu způsobilo, že i posteditace se stala všeobecně lépe akceptována. Poptávka polokalizaci zboží a služeb roste tempem, které člověk jakopřekladatel nestíhá dohnat ani s pomocí překladových pamětí a jinýchpomocných překladatelských technologií. Proto profesionální sdružení jako například TAUS – Translation Automation Users Society (Společnost uživatelů automatizace překladu) očekávají, žestrojový překlad a posteditace budou během nejbližších let hrát mnohem důležitější roli.[8]
Studie z osmdesátých let rozlišovaly mezi dvěma stupni posteditace, které byly v rámci Generálního ředitelství pro překladEvropské komise nejprve definovány jako konvenční a rychlá,[9] nebo úplná a rychlá.[10] Dnes se nejčastěji rozlišuje mezi posteditacízákladní (angl.light) aúplnou (angl.full).
Přizákladní posteditaci zasahuje posteditor dostrojového překladu jen minimálně – vždy jen tak přísně, aby koncový uživatel pochopil smysl textu. Očekává se, že klient bude takovýto překlad využívat pouze pro své interní účely. Je řešením v případech, kdy jde o urgentní překlad, nebo kdy je překlad požadován ve zkrácené lhůtě.
Přiúplné posteditaci se stupně kvality vyjednané mezi klientem a posteditorem dosahuje s pomocí vyšší úrovně zásahů; výsledkem by měl být text, jenž je nejen pochopitelný, ale také prezentovaný stylisticky vhodným způsobem, takže jej lze použít pro osvojování a dokonce i šíření, pro interní i externí účely.
Hypoteticky nejkvalitnějším výstupem úplné posteditace je text, jejž nelze odlišit od překladu vytvořeného člověkem. Nicméně se předpokládá, že překládat přímo ze zdrojového textu dá překladateli méně úsilí, než aby posteditoval verzi vygenerovanou strojem. S pokroky vstrojovém překladu se to ale může změnit. V dnešní době, kdy překladatelské nástroje pracují s pomocí kvalitních dat z konkrétních oborů, klienti dožadující sepřekladu mezi některými konkrétními jazykovými páry nebo vypracování specifických zadání často požadují odpřekladatele, aby místo řádnéhopřekladu text jen posteditovali. Věří, že tak za nižší cenu dostanou stejnou kvalitu.
Klasifikace posteditace na základní a úplnou pocházející z devadesátých let, kdy nástrojestrojového překladu vycházely ještě naCD-ROMech, může být i v případě základní posteditace vzhledem na posun v technologiích zastaralá. Při některých jazykových párech a některých druzích zadání, a to zejména když se zdrojový text preedituje, může neupravovaný výstup posloužit na uchopení hlavní myšlenky textu i bez nutnosti dalších lidských zásahů.
Posteditace se používá, když neupravovanýstrojový překlad nestačí a řádného lidskéhopřekladu není zapotřebí. Doporučuje se posteditace využít v případech, když produktivitu může alespoň zdvojnásobit, nebo v případě základní posteditace dokonce zčtyřnásobit.
Avšak efektivnost posteditace je obtížné předpovědět. Různé studie z akademické i průmyslové sféry ukázaly, že posteditace je obecně rychlejší než řádný překlad, a to bez ohledu na jazykový pár či překladatelovy zkušenosti.[11] Názory se ale neshodují v otázce, kolik času se ušetří posteditací v praxi. Zatímco odborníci v průmyslové praxi zaznamenali 40% úsporu času,[12] některé vědecké články tvrdí, že v reálných pracovních podmínkách je pravděpodobnější úspora mezi 15-20 %.[13]
Posteditace je i po třiceti letech pořád „profesí teprve se rodící“.[14] Dosud nebylo úplně prostudováno, jak by měl vypadat správný profil posteditora. Posteditace se, i když jenom částečně, překrývá spřekladem a korekturou. Mnozí by předpokládali, že ideálním posteditorem budepřekladatel, který se s nadšením nechá vycvičit v konkrétních potřebných dovednostech, ale někteří si naopak myslí, že by mohlo být jednodušší vyškolit bilingválního mluvčího, který spřekladem nemá žádné zkušenosti.[15] Nedostatečně zodpovězené zůstávají také otázky jako kdo jsou skuteční posteditoři, zda pracují většinou jako zaměstnanci nebo na volné noze, a za jakých podmínek.
Neexistují ani přesná čísla, která by ilustrovala, jak velký podíl na překladatelském průmyslu má posteditace. Nedávný průzkum ukázal, že 50 % poskytovatelů jazykových služeb ji nabízí, ale až pro 85 % z nich představuje podíl posteditace na všech jejich zakázkách jenom 10 %.[16] Prostřednictvím crowdsourcingové posteditační služby Unbabel přitom bylo přeloženo již víc než 11 miliónů slov (k listopadu 2014).[17]
Produktivita a rozšíření posteditace se vzhledem k neustálému vývojistrojového překladu jen velmi těžko odhadují. Strojový překlad se zlepšuje mimo jiné i díky tomu, že posteditované texty jsou zpětně zpracováványpřekladači, a proto čím více textu projde posteditací, tím kvalitnější mohou býtstrojové překlady. Nelze ovšem opomenout fakt, že překladače se tímto způsobem kromě správných překladů „učí“ i ty chybné.
V tomto článku byl použitpřeklad textu z článkuPostediting na anglické Wikipedii.
{{Cite web}}
označená jako k „pouze dočasnému použití“.