Detalji projekta

Nove objave

Arhiv objava

Pregled projekata u radu

Pregled programa u radu

Arhiv projekta

Svibor (1990.-1995.)

Procedura

Upute za prijavu

Prijava projekta

Prijava programa

Upute za recenzente i prosudbene skupine

Prosudbene skupine

Recenzenti

Česta pitanja

Kontaktni obrazac

Korisne hiperveze

Uzorci obrazaca

zProjekti

zProjekti

ZNANSTVENI PROJEKTI 2026-7-3

Rang lista prihvaćenih znanstvenih projekata

Lista prihvaćenih znanstvenih programa

Liste prihvaćenih znanstvenih projekata

Arhiv projekta
(2002. - 2005.)

Pretraživanje arhiva
(2002. - 2005.)

Arhiv projekata
(1996. - 2002.)

Pretraživanje arhiva
(1996.-2002.)

Svibor (1990.-1995.)

Detalji
Projekt:	Hrvatski jezični resursi i njihovo obilježavanje
Voditelj:	Marko Tadić
Ustanova:	Filozofski fakultet, Zagreb
Sažetak:	Danas je bilo kakva empirijska, a time posredno opće- i specifičnolingvistička, istraživanja teško provesti bez pomoći računalnoga korpusa. Interpersonalna provjerljivost i egzaktna mjerljivost korpusnih podataka omogućuje lingvistici pristup jezičnome opisu koji se svojom strogošću može mjeriti s prirodnim znanostima. Ovaj projekt želi postići takvu korpusnolingvističku razinu u nekoliko ciljeva: 1) proširiti postojeći Hrvatski nacionalni korpus (HNK) sa 101 na 200 milijuna pojavnica i pri tom posvetiti pozornost na uravnoteženo uzorkovanje tekstnih uzoraka prema različitim vrstama, medijima, žanrovima, područjima s kojih ti uzorci dolaze 2) obogatiti HNK lingvističkim oznakama na morfološkoj (vrste riječi, gramatičke kategorije, leme), sintaktičkoj (sintaktički odsječci, rečenične strukture) i semantičkoj (oznake leksičkoga značenja iz Hrvatskoga WordNeta) 3) obaviti temeljna statistička istraživanja evidencije, frekvencije i distribucije jezičnih jedinica i njihovih kombinacija na više jezičnih razina 4) sastaviti stanovit broj manjih korpusa hrvatskoga jezika za pojedina specijalistička područja 5) za potrebe višejezičnih lingvističkih proučavanja odnosa identiteta hrvatskoga jezika u europskome okružju i razvitka višejezičnih jezičnih tehnologija (JT), sastaviti niz usporednih korpusa “hrvatski — jezik X” opsega barem milijun pojavnica 6) sastaviti i usporedive korpuse ukoliko ne bude dovoljno paralelnih e-tekstova za sastavljanje usporednih korpusa. Svako sastavljanje i istraživanje korpusa donosi nove, često neočekivane rezultate i metode. Takvi uvidi u usustavljenu jezičnu građu često nadopunjuju intuitivno i introspektivno sagledavanje jezičnih pojava. U ovom se projektu očekuje čitav niz takvih novih teorijskih uvida, istraživačkih i metodoloških postupaka koji još nikad nisu bili provjereni u obradbi tako opsežne hrvatske jezične građe. Svrha je projekta osigurati hrvatskome reprezentativan korpus u skladu s najsuvremenijim dostignućima i spoznajama iz korpusne i računalne lingvistike. Taj bi korpus služio kao usustavljena jezična građa za sve vrste teorijskih i praktičnih kroatističkih, opće- i računalnolingvističkih istraživanja. Takav je korpus ujedno nezaobilazan i temeljni jezični resurs za izgradnju jezičnih tehnologija za hrvatski jezik (JTHJ). Razvitak JTHJ — što je i jedna od svrha nadređenoga programa — posredno će osigurati hrvatskome jeziku ravnopravno sudjelovanje u izgradnji informacijskoga društva tj. društva znanja u EU.

Natrag

Copyright ©2002-2006 Ministarstvo znanosti, obrazovanja i športa Republike Hrvatske. Sva prava zadržana.