Movatterモバイル変換


[0]ホーム

URL:


Academia.edu no longer supports Internet Explorer.

To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.

Academia.eduAcademia.edu

Outline

Izrada modela dijalekatskog korpusa bunjevačkog govora

Profile image of Teodora VukovićTeodora Vuković

2015

visibility

description

51 pages

link

1 file

Sign up for access to the world's latest research

checkGet notified about relevant papers
checkSave papers to use in your research
checkJoin the discussion with peers
checkTrack your impact

Abstract

This thesis reports on the creation of a pilot Bunjevac dialect corpus with the main purpose of providing the basis for developing a methodology for the creation of a final version of the Bunjevac dialect corpus, as well as corpora of other Serbian dialects. The pilot corpus was compiled using a portion of the data collected during an ethnodialectological study conducted in 2009 in the area around the city of Subotica by researchers from the Institute for Balkan Sudies of the Serbian Academy of Sciences and Arts and the Faculty of Philosophy in Novi Sad. The thesis describes how the pilot Bunjevac dialect corpus was built; this process can be divided into several steps: transcription of the interviews collected during the field study, normalisation of the transcripts based on the norm of the standard Serbian language, and part-of-speech tagging and lemmatisation. The use of the corpus was tested on morphological characteristics of the Bunjevac dialect, which are also described in the main text. The goal of the research presented is to identify the particularities of spoken dialectological data that need to be taken into consideration when creating a corpus, as well as to develop strategies for their processing and adaptation in order to enable automatic annotation and provide ease of use.

Related papers

Osnovne fonološke osobine govora Srba u Ravnim Kotarima (sela Donje Biljane i Lišane Tinjske)

Philologia, 2021

Predmet ovog rada predstavlja fonološki sistem govora Srba na prostoru severne Dalmacije, u regiji Ravni Kotari. Analiziraju se vokalski, konsonantski i prozodijski, preciznije akcenatski sistem u selima Donje Biljane i Lišane Tinjske, koje pripadaju središnjem području Ravnih Kotara. Cilj rada je da se opišu osnovne fonološke karakteristike u govoru pravoslavnog stanovništva ovog regiona i postave okvirne vrednosti za složenije istraživanje, s obzirom da je ovo ogranak istočnohercegovačkog, odnosno (istočno)hercegovačko-krajiškog govornog tipa, i to onaj o kojem nema detaljnijih podataka u našoj dijalektologiji. Poznaje četvoroakcenatski sistem i postakcenatske dužine, odlikuje se čestim asimilativnim i redukcionim procesima. Primenom metode intervjua, vođeni su razgovori sa Srbima naseljenim u ova dva sela, a zatim je audio--korpusna građa sistematizovana u odgovarajuće kategorije i potom deskriptivno obrađena. Rezultati utvrđuju pripadnost ovog (i)jekavskog novoštokavskog govora gorepomenutom govornom tipu, i preciziraju njegovu poziciju u okviru severozapadnog ogranka s obzirom na neke tipične sistemske osobine koje ga razlikuju od jugoistočnih istočnohercegovačkih govora (poput rezultata asimilacije vokalske grupe -ao-ili zamene dugog jata). Ključne reči: dijalektologija, novoštokavski (i)jekavski, istočnohercegovački govorni tip, vokalizam, konsonantizam, prozodija, Ravni Kotari, Donje Biljane, Lišane Tinjske.

Njemačke leksičke inovacije i njihovi hrvatski ekvivalenti s posebnim osvrtom na rječogradne i prevoditeljske postupke

Sveučilište u Zagrebu. Filozofski fakultet. Odsjek za lingvistiku., 2020

This thesis presents a corpus linguistic research on lexical creations in German in the period between the 1990s and the second half of the 2010s as well as their translatability into Croatian. The research is based on the following underlying hypotheses: 1) The most common parts of speech among lexical creations are nouns; 2) All lexical creations, neologisms and nonce words, are coined by the same mechanisms; 3) The most common method of making lexical creations is word-building; 4) German lexical creations are usually translated into Croatian by combining two or more techniques of translating culture-specific items. The aim of the research is to describe recent tendencies in the word-building of lexical creations in the German language, to emphasize the importance of nonce words when analyzing lexical creations and to outline possible techniques for translating German lexical innovations into Croatian. Lexical creations are the result of changes a language undergoes on a nearly daily basis, attracting considerable attention from scholars and the general public. On the one hand, lexical creations emerge as a direct response to the need to refer to new concepts and phenomena that must be designated, while on the other hand, they reflect the speaker's desire for expressive communication. Thus, lexical creations are necessarily linked to a particular language community at a given point in time and to the innovativeness of their authors, i.e. the context in which they emerged. Lexical creations are a genuinely interesting linguistic topic addressed by a number of linguistic disciplines, such as lexicology, lexicography, morphology, diachronic semantics, contact linguistics, sociolinguistics, pragmatics and stylistics. The role of language policy must not be neglected, since lexical creations can at the same time be a result of the susceptibility of a language to the influence of other languages, but also a result of linguistic purism. In this thesis, the term "lexical creations" is considered to be the superordinate of the terms "neologisms" and "nonce words". Reference sources in linguistics mostly refer to "neologisms", whereas "nonce words" are either not mentioned at all, or are not considered relevant, or are referred to as "neologisms" in a broader sense of the term. The thesis opens with a theoretical framework which identifies lexical creations as a phenomenon of linguistic change, emphasizing their essence: the necessity to meet the communication and cognitive needs of the members of a particular language community (Schippan 2002). We will analyze the motivation underlying the creation of lexical creations, which can be extralinguistic or intralinguistic (e.g. Fleischer 1987, Kinne 1998, Muhvić-Dimanovski 2005, Steffens 2010). We will also provide a possible classification of the mechanisms by which lexical creations are created, the most prominent of which are wordbuilding, borrowing, creation of multiword expressions, and semantic change (e.g., Muhvić

O povijesnoj fonologiji hrvatskoga jezika akademika Milana Moguša

Fluminensia Casopis Za Filoloska Istraživanja, 2011

Dvojezični Gradišćanskohrvatski Dijalekatni Rječnici

Čakavska rič : Polugodišnjak za proučavanje čakavske riječi, 2002

Dvojezicni gradiscanskohrvatski dijalekatni rjecnici, u okviru suvremene gradiscanskohrvatske leksikografije u cjelini, opsegom su uglavnom manja djela sa srazmjerno malim brojem natuknica, jer se kapitalna djela gradiscanskohrvatske leksikografije odnose na gradiscanskohrvatski knjizevni jezik. S druge strane, dvojezicni rjecnici izvornih gradiscanskohrvatskih govora uglavnom su aneksna djela uz opsirnije dijalekatne rasprave. Do sada objavljeni dvojezicni dijalekatni rjecnici, tj. rjecnici izvornih gradiscanskohrvatskih govora, u ovom su radu klasificirani s obzirom na: a) opseg i elemente kontrastivnosti i ilustrativnosti; b) vecu iii manju izvornost natuknica; c) broj mjesnih govora obuhvacenih natuknicama i dijalekatnu pripadnost gradiscanskohrvatskih natuknica kao polaznoga jezika; d) ciljni jezik i odnos prema tom jeziku; e) strukturu leksikografskih clanaka f) tematsku razgranatost natuknica. Na temelju posto-jeCih rjecnika utvrduju se relevantni elementi koji su neizostavni pri izradbi buducih rjecnika toga tipa. GradiScanskohrvatski rJecmci u cjelini najvec1m dijelom pripadaju leksikografiji 20. stoljeca, tj. razdoblju nakon pocetaka formiranja gradiscansko-

The language of Šimun Kožičić Benja’s Misal hruacki: verb forms

2010

Modrusko-senjski biskup Simun Kožicic Benja u vlastitoj tiskari u Rijeci objavio je u sest mjeseci sest glagoljskih knjiga, među kojima je Misal hruacki najveca i najljepsa. O uređivanju jezika glagoljskih liturgijskih knjiga pisao je u posveti svoga historiografskoga djela Knižice odь žitie rimskihь arhiereovь i cesarovь osvrnuvsi se na odnos staroga (naslijeđenoga) i novoga (popravljenoga). Zbog nedovoljne proucenosti jezika Kožicicevih liturgijskih knjiga narav toga odnosa nije bila precizno određena. Na temelju usporedbe razlika u uporabi glagolskih oblika na grafematickoj, morfoloskoj, sintaktickoj, leksickoj, semantickoj i stilskoj razini u Kožicicevu Misalu i trima hrvatskoglagoljskim tiskanim misalima 15. i 16. st. (Prvotisku, Senjskom misalu, Misalu Pavla Modrusanina) doslo se do spoznaje da je Kožicic jezik svoga Misala dosljedno redigirao prema Vulgati.

Relevantnost frekvencije jezične uporabe pri opisu strukture leksema

Suvremena Lingvistika, 2001

Ovaj rad ispituje valjanost testova za odre|ivanje prototipnih zna~enja polisemnih leksema koji uklju~uju jezi~ne frekvencije i pretpostavljaju da najve}a frekvencija uporabe odgovara sredi{tu leksi~ke kategorije. Uz pomo} ra~unalnog korpusa hrvatskoga jezika, Hrvatskoga nacionalnog korpusa (HNK) i metodologije korpusne lingvistike analiziraju se frekvencijski podaci za tri hrvatske imenice i uspore|uju s intuicijom izvornog govornika u odre|ivanju prototipnog zna~enja istih leksema. Nagla{ava se da su razlozi postojanja prototipnosti u leksema kognitivne prirode te da postoje barem neke jezi~ne kategorije u kojih frekvencija uporabe nije pokazatelj prototipnosti. Kognitivna semantika prihvatila je pojam prototipa kao temeljnog na~ela organizacije kategorija. Ova je pojavnost najprije uo~ena kod perceptivnih kategorija kao {to su boje i oblici ili pak semanti~kih 2 kategorija kao {to su primjerice vo}e, ptice i namje{taj (vidi npr. Rosch 1973(vidi npr. Rosch , 1977(vidi npr. Rosch , 1978;;. Me|utim, ubrzo se uvidjelo da je organizacija ~lanova neke kategorije oko prototipa -najboljeg primjerka -po na~elu ve}e ili manje sli~nosti primjenjiva i {ire u jeziku, budu}i da su sve jezi~ne kategorije, uklju~uju}i i grama-ti~ke, kognitivni konstrukti. Nadalje, i zna~enje leksema mo'emo promatrati kao kategoriju koja ima svoju unutra{nju organizaciju u kojoj postoji jezgra 1 Ovaj rad temelji se na izlaganju pod nazivom A New View of Frequency and Prototypes, odr-'anom na skupu New Theoretical Perspectives on Syntax and Semantics in Cognitive Science od 8. do 10. rujna 2000. godine u Dubrovniku.

Prilagodba talijanskih pridjeva u dubrovačkom govoru Marina Držića

Filologija : časopis Razreda za filološke znanosti Hrvatske akademije znanosti i umjetnosti, 2019

Ka jedinstvenom modelu klasifikacije rime u divanskoj književnosti Bošnjaka: na primjeru poezije Sabita Užičanina

2017

Rima u poetici divanske književnosti ima svoje mjesto, osobito u strukturalnoj poetici, ali nju ne treba promatrati izolirano, vec kao sastavni dio cjeline poetskoga djela. U ovom radu nastojali smo predstaviti fenomen bogatstva i raznolikosti rime u divanskoj književnosti Bosnjaka na primjeru poezije Sabita Alaudina Užicanina, tragajuci za sto sirim jedinstvenim modelom analize rime sa razlicitih jezickostilistickih aspekata. U taj model analize uvrstili smo i grafostilisticki pristup analizi i klasifikaciji rime koji je dominantan u klasicnoj osmanskoj stilistici. Razlog za takav pristup je jednostavan: rima u divanskoj poeziji ne ispoljava se samo na grafostilistickoj razini analize teksta bilo koje poeme, nego predstavlja fenomen koji se odražava na ukupnu strukturu svake poeme pojedinacno na gotovo svakoj jezicnostilistickoj razini analize. U ovom radu skrenuli smo pažnju na preko stotinu vrsta rime samo u poeziji Sabita Užicanina. Model za klasifikaciju rime u divanskoj poezij...

NOVA UDŽBENIČKA LITERATURA IZ STAROSLAVENSKOGA JEZIKA, MALI STAROSLAVENSKO-HRVATSKI RJEČNIK, Sastavili: Stjepan Damjanović, Ivan Jurčević, Tanja Kuštović, Boris Kuzmić, Milica Lukić, Mateo Žagar (Matica hrvatska, Zagreb, 2004.)

Fluminensia Casopis Za Filoloska Istraživanja, 2005

O hrvatskoj leksičkoj komponenti u Miottovu "Vocabolario del dialetto veneto-dalmata

1994

U članku se obrađuju hrvatske posuđenice koje su uvrštene u Vocabolario del dialetto veneto-dalmata Luigia Miotta (Trst 1984. i 1991). Neujednačena ortografska, fonološka i morfološka adaptacija otkrivaju nam da te riječi često nisu čvrsto uklopljene u dalmatinsko mletačko narječje. Upućuje se na natuknice u kojima autor Rječnika nije prepoznao kroatizme. 3 Filipović (1986, § 2.5.3) preuzima od Haugena razlikovanje triju stupnjeva integracije posuđenih leksičkih elemenata: 1. strana riječ (engl. foreign word) ili model, 2. tuđica (foreign loan) ili kompromisna replika (compromise replica), 3. posuđenica (loanword) ili replika (replica).

Loading...

Loading Preview

Sorry, preview is currently unavailable. You can download the paper by clicking the button above.

Related papers

Neke moliškohrvatske glasovne promjene pod utjecajem abruceškomoliškoga dijalekta

Tabula : periodicus Facultatis philosophicae Polensis; rivista della Facoltà di lettere e filosofia; Journal od the Faculty of Humanities, 2018

Izvorni znanstveni rad Original scientific paper UDK 811.163.42'342.6(450.67) U članku se analizira utjecaj abruceško-moliškoga dijalekta na moliškohrvatski fonetski i fonološki sustav, a radi usporedbe navode se i likovi iz standardnoga talijanskoga jezika. Utvrđeno je da su brojne riječi iz abruceško-moliškoga dijalekta ušle u moliškohrvatski, a glasovne promjene koje se u njima uočavaju vrlo se često događaju i u izvornim hrvatskim riječima.

Čakavsko Narječje U Dijalektološkim Atlasima (S Primjerima Karata Razvoja *Ę U ‘Jezik’, ‘Jetra’, ‘Žeđ’)

Hrvatski Dijalektološki Zbornik, 2013

ČAKAVSKO NARJEČJE U JEZIČNIM ATLASIMA (s primjerima karata razvoja *ę u 'jezik', 'jetra', 'žeđ') U trenutku kad hrvatski jezik još nema svoj atlas, ali se već godinama obavljaju pripremni poslovi za njegovu izradu, hrvatski se jezični prostor, pa tako i čakavsko narječje kao njegov dio, može promatrati u okviru atlasâ koji obuhvaćaju šire područje. To su Općeslavenski jezični atlas i Europski jezični atlas. U radu je prikazana uključenost čakavskih punktova u tim atlasima. Na građi za Općeslavenski lingvistički atlas i Hrvatski jezični atlas istražen je razvoj prednjeg nazala *ę iza palatalnih suglasnika j, č, ž u vokal tipa a ili e i izrađene su tri karte. Jezični atlasi sistematizirane su zbirke karata koje prikazuju lingvistički krajobraz, odnosno ukupnost izoglosâ (linijâ koje omeđuju prostiranje neke jezične pojave) na promatranome jezičnom području, bilo da ono obuhvaća jedan jezik u cjelini ili njegov dio (npr. određeni dijalekt) ili pak više jezika. Jezični su atlasi produkti lingvističke geografije -dijalektologiji srodne lingvističke discipline koja proučava pitanja teritorijalnog rasporeda jezičnih pojava. Lingvistička se geografija bavi izradom jezičnih karata i atlasa, odnosno smještanjem jezičnih pojava u organskim govorima na zemljopisnu kartu. Prijenos jezičnih pojava na zemljovid obično pokazuje kako njihovo rasprostiranje karakteriziraju složeni odnosi u kojima se izoglose najčešće

Kolokacijske sveze u mentalnome leksikonu učenika stranoga jezika

Fluminensia, 2017

This work is licensed under a Creative Commons Attribution 4.0 International License. Ovaj rad dostupan je za upotrebu pod međunarodnom licencom Creative Commons Attribution 4.0.

GOVOR BARBANŠTINE (PRILOG ZA OPIS JUGOZAPADNOGA ISTARSKOGA ILI ŠTOKAVSKO-ČAKAVSKOGA DIJALEKTA), Lina Pliško, GOVOR BARBANŠTINE, Filozofski fakultet u Puli, Pula, 2000

2001

Tvorba riječi u hrvatskim dopreporodnim gramatikama

Rasprave: Časopis Instituta za Hrvatski Jezik i Jezikoslovlje, 2013

research on the word-formation process as described in Croatian pre-standard grammars (kašić, križanić and grammars of the kajkavian literary language) has shown that word formation is described in all grammars examined to a greater or lesser extent, but no separate chapter is devoted to this subject. These descriptions of the word-formation process are more implicit than explicit, except in križanić’s grammar. ključne riječi: tvorba riječi, dopreporodne hrvatske slovnice key words: word-formation, pre-standard grammars

Bosanski jezik i bosnistika u Mađarskoj

Književni jezik

The article presents the presence of the Bosnian language and Bosnian studies in Hungary. It discusses in detail the meaning, history and beginnings of the ethnonym Bosnian, which dates back to the 19th century. After the fall of the AustroHungarian Monarchy, the first independent South Slavic state was established, which brought not only political and economic changes, but also language and language policy changes. Post-World War II Yugoslavia was characterized by linguistic unification, which took place in the Serbo-Croatian language. The Hungarian scientific and non-scientific public faithfully followed the Yugoslav terminology, so there was no mention of the Bosnian language at all. After the breakup of Yugoslavia, a new language situation arose, which was interpreted by István Nyomárkay for the Hungarian academic public. However, information about the Bosnian language in Hungarian sources is still almost unavailable, from which it follows that there are no Bosnian studies in Hu...

Neki sociolingvistički i kognitivnolingvistički aspekti imenovanja i učenja maternjeg jezika i književnosti u bosanskohercegovačkom školstvu s fokusom na Kanton Sarajevo

Sažetak: U radu se govori o principima jezičke tolerancije i odnosu između bosanskog, hrvatskog, srpskog i srpskohrvatskog jezika u sinhronijskoj i dijahronijskoj perspektivi, s fokusom na prosvjetnopedagošku praksu i različite koncepte u imenovanju i učenju maternjeg jezika i književnosti u osnovnim i srednjim školama u Bosni i Hercegovini, specifično u Kantonu Sarajevo. Uz sociolingvistički pristup problemu, dodatno je izvršena kognitivnolingvistička analiza uloge medija i šire društvene javnosti u stvaranju različitih pogleda na ulogu maternjeg jezika u organizaciji prosvjetno-pedagoškog rada.

Građa i prilozi za leksikon Drnišana

2016

Sažetak: U radu se prvo objašnjava prostorni obuhvat (po današnjoj upravnoj organizaciji teritorija RH) koji se odnosi na prostor Grada Drniša te općina Oklaj, Ružić i Unešić. Zatim se navode kriteriji za uvrštavanje u "poznate Drnišane" (znanstvenici, književnici, novinari i urednici, istaknuti sportaši i pripadnici estrade, glumci i ostali istaknuti, poznati i/ili priznati pojedinci u raznim zanimanjima i profesijama). Uvršteni su, dakako, i oni koji su već zastupljeni u enciklopedijama, leksikonima i sličnim publikacijama. U drugom se dijelu donosi abecedarij poznatih Drnišana s osnovnim podacima i izvorima o njima.

Glagolsko-imeničke kolokacije hrvatskoga, njemačkoga i engleskoga općeznanstvenog jezika u općoj dvojezičnoj e-leksikografiji

Rasprave Instituta za hrvatski jezik i jezikoslovlje

Ovaj rad bavi se leksičkim sredstvima standardnoga jezika preuzetim u jezik znanstvene komunikacije. Zbog razlike u kolokacijskim značenjima koja se ostvaruju u hrvatskome, njemačkome i engleskome jeziku, čestih značenjskih dvojbi prevoditelja znanstvene literature i autora znanstvenih tekstova kao i nedovoljne pokrivenosti toga područja leksika i leksičkih relacija u hrvatsko-njemačkim i hrvatsko-engleskim općim dvojezičnim rječnicima rad upozorava na činjenicu da za korisnika s hrvatskim kao izvornim jezikom ostaje nedostupan jedan važan sloj leksika znanstvenoga jezika. Autorice upućuju na nedostatak pokrivenosti općeznanstvenih glagolsko-imeničkih kolokacija u postojećim tiskanim općim dvojezičnim rječnicima s hrvatskim jezikom kao izvornim jezikom rječnika te na potrebu poboljšanja leksikografskoga prikaza kolokacija u strukturi rječničkoga članka. Prijedlozi autorica mogu pridonijeti poboljšanju leksikografskoga prikaza kolokacija u postojećim dvojezičnim rječnicima, a pohranj...

Prilog proučavanju gramatičke terminologije Franjevačke turske slovnice iz Fojnice

2017

U radu se, na osnovu opcih ortografskih osobitosti gramaticke terminologije anonimne i nedatirane turske gramatike / slovnice koja se cuva u Franjevackom samostanu u Fojnici, kao i usporedbom te terminologije sa terminologijom iz drugih gramatickih djela koja su se koristila u Bosni u 19. stoljecu, pokusava odrediti kojoj gramatickoj tradiciji pripada spomenuta slovnica i kada je mogla nastati. Tabelarni prikaz i usporedba terminologije u Slovnici sa istom ili slicnom terminologijom u drugim djelima ukazuje na to da se radi o osobenoj terminologiji tzv. južnoslavenske gramaticke tradicije, koja se razvijala odvojeno od osmanskoga obrazovnog sistema u Bosni u tom periodu. U radu ponuđena analiza potvrđuje da se u Bosni u 19. stoljecu gramaticka terminologija za opis turskog jezika razvijala unutar razlicitih gramatickih tradicija. Slovnica je jedna od rijetkih bosanskohercegovackih gramatika turskog jezika iz 19. stoljeca gdje se koristi iskljucivo domaca gramaticka terminologija. Re...

Related topics

  • Spoken Language Technologies
  • South Slavic Languages
  • South Slavic Languages and Liter...
  • Academia
    Academia
    580 California St., Suite 400
    San Francisco, CA, 94104
    © 2025 Academia. All rights reserved

    [8]ページ先頭

    ©2009-2025 Movatter.jp