Euskaltzaindiak Euskararen Erreferentzia Corpusa (ECC) aurkeztu du

Euskaltzaindiak Euskararen Erreferentzia Corpusa (ECC) aurkeztu du astelehenean bere egoitzan, Bilbon, duela lau urte abian jarri zen euskararen egunerokotasuna ezagutzeko proiektua.

Andres Urrutia Akademiako lehendakariak “erreferentziazko” proiektu gisa definitu du, eta “hizkuntzaren xehetasun zehatzak eta orekatuak bildu nahi ditu, hainbat arlotako laginak bilduz eta egungo euskararen isla emanez”.

“Funtsezko tresna”

EEC “funtsezko tresna” da, Miriam Urkia Ikerreko arduradunak nabarmendu duenez — ikerkuntzan diharduen Akademiako atala —, “hizkuntza-ikerketetan hizkuntza-azterketa, ikaskuntza automatikoa edo hipotesiak baliozkotzeko” balio du, baina “corpus estandar edo erreferente gisa” ere erabil daiteke, “hizkuntza-, literatura- edo ikerketa-helburuetarako”, euskararen “egungo egoera” islatzen duen neurrian.

Diseinua eta “erreferentzialtasuna”

Euskararen corpus honek euskaraz idatzitako testuak biltzen ditu, batez ere bertsio elektronikoetatik abiatuta, eta ahozko transkripzioak baztertzen ditu, nahiz eta ahozko transmisiorako prestatutako idatziak biltzen dituen, hala nola telesail edo filmetarako gidoiak.

Jatorrizko komunikabideei dagokienez, testuen % 4 Interneterako berariaz sortutako materialetik datoz; gainerakoak, berriz, erdi bana banatzen dira liburuen eta aldizkako argitalpenen artean. Sailkapenari dagokionez, idatzien % 25 fikziozkoak dira eta % 75 ez-fikziozkoak. Bestalde, EECk beti bilatuko du azken 25 urteetako testuak jasotzea, eta, beraz, urtero eguneratuko da.

“Erreferentzialtasuna”, Urkiak azaldu duenez, hiru irizpide hauen konbinazio “orekatuaren” ondorio da: bitartekoak, sailkapena eta kronologia. “Hori da erreferentziazko corpusak definitzen duena, nahiz eta oreka mantentzea beti erraza ez izan”, dio. Aldi berean, Ikerreko arduradunak esan du jarraibide horiek “hiztegiko kontsultak beharren arabera mugatzeko” aukera ematen dutela.