Strukturiranje diskurza v večjezični Evropi - TextLink (COST)
Nosilna institucija/podjetje:
Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
Ostale institucije/podjetja:
Universite catholique de Louvain, Belgija
Ime področja:
Informatika
Datum začetka:
15.04.2014
Kontakt:
Prof. dr. Borut Žalik, dekan
Status partnerstva:
V teku
Kontakt:
dr. Darinka Verdonik
Opis:
Za učinkovit diskurz v kateremkoli jeziku so značilna jasna razmerja med stavki in skladno strukturo. Vendar pa se jeziki razlikujejo prav v tem, kako so ta razmerja in strukture nakazana. Medtem ko lahko enojezični slovarji in slovnice označujejo besede in stavke nekega jezika, dvojezični slovarji pa lahko to omogočajo med dvema jezikoma, pa za diskurz to ne velja. Tu so vse bolj na voljo z diskurzi označeni korpusi (discourse-annotated corpora) v različnih jezikih.
Projekt bo pospešil evropsko večjezičnost z (1) identificiranjem in oblikovanjem portala takšnih virov znotraj Evrope - vključno z označevalnimi orodji, iskalniki, z diskurzi označeni korpusi; (2) z navedbo dimenzije in lastnosti označevanja diskurzov med korpusi; (3) organizacijo teh lastnosti v deljive taksonomije (sharable taxonomy); (4) spodbujanje uporabe te taksonomije v poznejši označevanjih diskurzov in v med-jezičnem iskanju in študijah naprav, ki se nanašajo in strukturirajo diskurza; in (5) spodbujanje uporabe portala, njegovih virov in deljive taksonomije. S partnerji iz vse Evrope, bo projekt TextLink poenotil številne, vendar razpršene jezikovne vire v diskurzivni strukturi. TextLink bo s svojimi viri, ki jih je mogoče iskati po obliki in/ali pomenu, in virom dragocenih korespondenc omogočil izboljšanje izkušnje in dela prevajalcev, piscev slovarjev, jezikovnih tehnologij in učencem jezikov.