|
|
|
|
|
|
Detalji |
Projekt: |
Leksička semantika u izradi Hrvatskog WordNeta |
Voditelj: |
Ida Raffaelli |
Ustanova: |
Filozofski fakultet, Zagreb |
Sažetak: |
Temelj projekta Leksička semantika u izradi Hrvatskog WordNeta predstavljaju dvije okosnice istraživanja. Prva je okosnica vezana kako uz neka temeljna opće semantička i leksikološka istraživanja tako i uz teorijske pretpostavke, spoznaje i rezultate istraživanja u okviru leksičke semantike hrvatskoga jezika. Druga je okosnica preuzimanje i prilagodba, za hrvatski jezik, rezultata i postignuća vezanih uz projekte EuroWordNet1 i 2 te BalkaNet. Izrada Hrvatskog Wordneta temeljit će se na spoznajama gore navedenih projekata što će posebice doći do izražaja pri izradi vršne ontologije (top ontology) i pri definiranju temeljnih koncepata (base concepts) koji su zajednički svim jezicima obuhvaćenim spomenutim projektima, a čime se zadržava elementarna kompatibilnosti i međujezična povezanost između navedenih resursa i budućeg Hrvatskog WordNeta. Time će se Hrvatski Wordnet moći ravnopravno uključiti u višejezično pretraživanje semantičkih baza podataka što će omogućiti usporedbu hrvatskog semantičkoga sustava sa sustavima ostalih jezika za koje takve baze već postoje. Preuzimanju i prilagodbi ovih rezultata istovremeno će se pristupiti kritički kako bi se uočile prednosti i nedostaci pri obradi hrvatskoga jezika i daljnjoj izradi Hrvatskog WordNeta koja će se temeljiti na izradi jezičnih ontologija. Bit je jezičnih ontologija odražavati jezične posebnosti odnosa unutar hrvatskoga leksičko-semantičkog sustava. Hrvatski WordNet imat će stoga obilježja tzv. nacionalnog WordNeta u kojemu će se vrlo jasno moći uočiti leksičko-semantičke strukture hrvatskoga jezika kao odraza i specifične organizacije konceptualnoga sustava. Ciljevi istraživanja su: a) uočavanje i definiranje konceptualne i leksičke posebnosti hrvatskoga jezika u odnosu na ostale jezike, odnosno opis semantičkoga sustava hrvatskoga jezika; i b) izrada Hrvatskoga WordNeta koji bi bio kompatibilan obrađenim jezicima uključenima u projekte EuroWordNet 1 i 2 te BalkaNet. Izrada nacionalnog WordNeta je bitna jer se nijedna viša razina razvitka jezičnih tehnologija danas ne može odvijati bez tog oblika računalno potpomognutog leksičkog modela. Hrvatski će Wordnet osim kompatibilnosti s jezicima obrađenim unutar navedenih projekata odražavati i specifične leksičko-konceptualne strukture hrvatskoga jezika, pružati bitan temelj za daljnju razradu i eventualnu reinterpretaciju teorijskih načela leksičke semantike za hrvatski jezik, ali omogućiti i razradu opće semantičkih načela i spoznaja. |
|
|
|
|
|
|