Movatterモバイル変換

Mine sisu juurde

Masintõlge

Allikas: Vikipeedia

See artikkelvajabtoimetamist.(Juuli 2011)
Palun aitaartiklit toimetada.(Kuidas ja millal see märkus eemaldada?)

Masintõlge (ka automaattõlge, raaltõlge^[1]) onarvutilingvistika haru, mis uurib võimalusi tõlkidatarkvara abil teksti või kõnet ühestloomulikust keelest teise.

Kõige elementaarsemal tasemel asendab masintõlge ühe keele sõnad teise keele omadega, kuid sellest ei piisa heaks tõlkeks, sest tuleb tunda ära tervedfraasid ja leida neile teises keeles vasted. Sellele probleemile lahenduste otsiminekorpuslingvistika jastatistika vahenditega on kiirelt arenev ala, mis viib paremate tõlgeteni, tegeldes eripäradegakeeletüpoloogias jaidioomide tõlkes ning keeleliste anomaaliate tuvastamisega.

Tänapäevast masintõlketarkvara võib sageli kohandada valdkonna järgi (näiteksilmateated). See tehnika on eriti tõhus valdkondades, kus kasutatakse formaalset keelt. Nii on masintõlge sobilikum tehniliste ja juriidiliste tõlgete tarbeks kui kõnekeele või vähem standardiseeritud tekstide korral.

Ajalugu

[muuda |muuda lähteteksti]

1629 –René Descartes pakub väljauniversaalkeele
1951 – esimene valdkonna teadlane Yehosha Bar-Hillel alustab uuringuidMIT-s
1954 – Georgetown-IBM süsteemi avalik demo, kus demonstreeritakse automaatset tõlget vene keelest inglise keelde
1956 – esimene masintõlke konverents Londonis
1966 – ALPACI aruanne leiab, et masintõlge ei ole end õigustanud. Valdkonna rahastus peatatakse USA valitsuse poolt
1991 –Harkovi Ülikool annab välja esimese ärilise masintõlkesüsteemi vene-inglise-saksa-ukraina keelte jaoks
1997 –AltaVista Babelfish hakkab pakkuma veebis lühikeste tekstide tasuta tõlkimist
2007 –Google Translate hakkab reeglipõhise tõlke asemel kasutama statistilisi meetodeid

Tõlkeprotsess

[muuda |muuda lähteteksti]

Inimtõlkeprotsessi saab kirjeldada kui esmalt lähteteksti tähenduse dekodeerimist ning seejärel selle tähenduse kodeerimist sihtkeelde. Sellise lihtsa kirjelduse taga toimub väga keeruline kognitiivne protsess: kogu tekst tuleb analüüsida, mis vajab väga sügavat teadmistgrammatikast,semantikast,süntaksist, idioomidest jne. Seega peaks arvuti tekstist sama hästi aru saama nagu inimene.Hetkel ei ole see tehnoloogiliselt võimalik ning ükski automaattõlke meetod ei suuda inimese abita toota kvaliteetset väljundit. Parim, mida arvuti suudab teha, on anda üldine aimdus teksti sisust. Paljude praktiliste rakenduste jaoks, kus ei pruugi inimtõlget isegi vaja minna, on see täiesti piisav.

Lähenemisviisid

[muuda |muuda lähteteksti]

Otsetõlge

[muuda |muuda lähteteksti]

Otsetõlke puhul koostatakse kahe keele vahel sõnastik ning kasutatakse seda iga sõna tõlkimiseks.

Ülekanne

[muuda |muuda lähteteksti]

Ülekandemeetodi puhul on sõnastikus vaid algvormid. Tõlkeprogramm teostab sisendil morfoloogilist analüüsi ning kasutab selle tulemusi koos lisareeglitega uude keelde tõlkimiseks.

Interlingvistiline

[muuda |muuda lähteteksti]

Tõlgitav tekst tõlgitakse esmalt vahekeelde ning alles seejärel sihtkeelde. Mida rohkem keeli on vahekeelega liidestatud, seda võimekam selline tõlkesüsteem on.

Statistiline tõlge

[muuda |muuda lähteteksti]

Statistiline masintõlge kasutab kakskeelseid lähtekorpuseid, kus sama tekst on esitatud mõlemas keeles. Nende tekstide põhjal koostab tarkvara statistilise mudeli, mida kasutada seni veel nägemata tekstide jaoks.

Hetkeprobleemid

[muuda |muuda lähteteksti]

Tähenduse mitmesus

[muuda |muuda lähteteksti]

See probleem tekib siis, kui ühel sõnal on rohkem kui üks tähendus. Tänapäeval lahendatakse probleemi kahel moel: "madala" ja "sügava" lähenemise abil. "Madala" lähenemise puhul ei eeldata sõna kohta eelteadmist, vaid uuritakse ümbritsevaid sõnu statistiliste meetodite abil. "Sügava" lähenemise puhul eeldatakse suurt eelteadmust antud sõna kohta.

Mittestandardne keel

[muuda |muuda lähteteksti]

Kõnekeelest või kõnekeelde tõlkimise puhul on see eriti suur probleem reeglipõhise tõlke puhul, kuna vaikimisi ei kasuta reeglipõhine tõlge väljaspool keelenorme olevaid allikaid.

Nimeüksused

[muuda |muuda lähteteksti]

Nimeüksuste all mõistetakse nii isikuid, kohti ja ettevõtteid kui ka aja, ruumi ja koguse väljendusi. Nimeüksused põhjustavad probleeme just statistiliste meetodite kasutamisel, kuna neid ei pruugi lähteallikates piisavalt tihti esineda.

Vaata ka

[muuda |muuda lähteteksti]

Viited

[muuda |muuda lähteteksti]

↑Tehnikaleksikon. Tallinn,Valgus, 1981. Lk 304

Välislingid

[muuda |muuda lähteteksti]

Riiklik programm "Eesti keele keeletehnoloogiline tugi (2006-2010)", Masintõlge I
13. märts 2009,Katse: veebimasin tõlgib, kuid läbi häda, maaleht.ee
16. mai 2011,Daniel Vaarik,Kuidas masintõlge muudab pilti Eestist?
Kaalep, H.-J., Koit, M. Kuidas masin tõlgib Keel ja Kirjandus 10, 2010, lk 726-738http://keeljakirjandus.eki.ee/726-738.pdf
Raido Vahtra,Masintõlge: minevik, olevik, tulevik

Pärit leheküljelt "https://et.wikipedia.org/w/index.php?title=Masintõlge&oldid=6450981"

Peidetud kategooriad:

[8]ページ先頭

©2009-2025 Movatter.jp