Berriak Hezkuntza, Hizkuntza Politika eta Kultura
Eu

Hizkuntza Politikarako Sailburuordetzaren eta EHUren Euskara Institutuaren arteko lankidetzak ekarritako produktuak

2016.eko maiatzak 06

Hizkuntzen Arteko Corpusa aurkeztu dute Jaurlaritzak era EHUk, hizkuntzak lan-tresna dituzten profesionalentzat corpus baliagarria

Hizkuntza Politikarako sailburuorde Patxi Baztarrikak eta EHUren Euskara Institutuaren zuzendari Pello Salaburuk, corpus eleaniztun berritzaile bat aurkeztu dute gaur goizean Abandoibarrako Bizkaia Aretoan egin den prentsaurrekoan: Hizkuntzen Arteko Corpusa (HAC), hain zuzen ere. Hizkuntzak lan-tresna dituzten profesionalentzat oso baliagarri izango da corpus berria, bai itzultzaile, irakasle, idazle nahiz ikertzaileentzat. Era berean, euskaren corpusik handienaren (Egungo Testuen Corpusa) azken eguneratzea ere aurkeztu da. Aipatzekoa da EHUren Euskara Institutuak Hizkuntza Politikarako sailburuordetzaren diru laguntza jaso duela azkeneko 12 urte hauetan. Aipatutako bi corpus hauetaz gain, Euskara Institutuak garatutako beste bi produktu ere aurkeztu dira.

Hizkuntza Corpusa:

Hizkuntza Corpus bat formatu elektronikoan bildutako testu multzo bat da. Izan ere, corpusak erreminta paregabeak dira hizkuntza bat ikertzeko eta kontsultak egiteko orduan. Bere helburua da esaldi edota hizkuntza baten alderdi konkreturen bat ikertzerakoan erreferentziazko elementua izatea.

Corpusak ezinbestekoak dira gaur egun. Izan ere, hizkuntza guztiek egiten dituzte corpusak helburu desberdinekin. Euskara Institutuak ere baditu zenbait corpus. Askotan ezinbestekoa da corpus hauetan kontsultak egitea, informazio handia ematen baitute.

Esan bezala, gaur goizean zenbait nobedade aurkeztu dira eta hauek dira produktu horien ezaugarri nagusiak:

Hizkuntzen Arteko Corpusa (HAC):

Corpus berezi eta berritzaile honek lau hizkuntza parekatzen ditu, testu berberekin: euskara, gaztelania, frantsesa eta ingelesa. Parekoak diren testuetan idazle bakoitzak hitza nola erabili duen ikusten da. Izan ere, corpus hau itzulpenak egiteko, adibidez, oso baliagarria da. Aldi berean, itzultzaileen lan egokia zein batzuetan ezinbestean egin behar diren “tranpatxoak” agerian uzten ditu.

Hizkuntzen Arteko Corpusak lau hizkuntza hauetan idatzita dauden liburu eta testuak jasotzen ditu. Hau da, berdin du jatorrizko hizkuntza zein den. Izan ere, corpus honek bere barruan ditu Aristotelesen ‘Metafisika’ lana edota Jonathan Swiften ‘Gulliver-en bidaiak’  liburua. Lan hauek beste hainbat hizkuntzara egokitu dira baina frantsesez, euskaraz, gaztelaniaz eta ingelesez daudenez, badute tokia corpus honetan.

Honela, bilatzailean ‘etxea’ hitza idazten badugu, adibidez, testu hauetan zehar ‘etxea’ hitza agertzen diren esaldi guztiak agertuko zaizkigu eta itzultzaileek esaldi horiek nola itzuli dituzten ikusi ahal izango dugu. Erreminta paregabea da hau hizkuntza lan tresnatzat duten profesionalentzako. Alegia, oso baliagarria da beste itzultzaileen erreferentziak izateko.

Egungo Testuen Corpusa (ETC)

ETC XXI. mendeko testuekin egindako corpusa da eta bilaketak lemaka edo hitzeka egiteko aukera ematen du. Gordeta dituen testuak espresuki aukeratuak dira. Alegia, ez dira estatistikaz itsu-itsuan aukeratu, baizik eta argitaratzen diren testuen kalitateagatik aukeratu dira. Iturriak askotarikoak dira: liburuak, eleberriak, egunkariak, aldizkariak, eta abar. Testu hauek jatorrizkoak edota itzulpenak izan daitezke. Aipatu beharra dago dagoeneko 270 milioi hitz dituela Egungo Testuen Corpusak (hasiera batean 205 milioi hitz zituen eta azken eguneratzea dela eta, beste 65 milioi hitz gehitu zaizkio).

Corpus honen hitz kopurua izugarri handia da. Izan ere, euskaraz dagoen corpusik handiena da. RAEren mende honetako testuen corpusarekin alderatuta, Egungo Testuen Corpusak hitz kopuru gehiago dauka. 2015ean egin zuten azken eguneratzea eta garai hartan 215 milioi hitz zituen RAErenak.

Bestalde, batez ere ikasleei begira egin diren bi aplikazio aurkeztu dira:

Euskal Adizkitegi Automatikoa (ordenagailuan, telefono eta tabletetan). Euskal adizkien berri ematen du. Aditz formanteak (nor-nori-nork), aldia (oraina, iragana) eta ahala (bai, ez) aukeratu eta modu automatikoan sortzen ditu adizkiak. Edo alderantziz: adizkia eman eta osagaiak ateratzen ditu kolore ezberdinetan.

Euskal Kasutegi Automatikoa (ordenagailuan): nahi den hitza hartu, numeroa (sing/pl), kasua edo postposizio mota aukeratu, eta berehala emango du adibide bat, eta esteka egiten du datu-baseetan ditugun gainerako adibide guztietara. Hitzaren definizioa ere ematen du.

Hizkuntza Politikarako sailburuordeak esan du: “2008an sinatu zuen Eusko Jaurlaritzak Institutuarekin lehenbiziko lankidetza hitzarmena; eta, zorionez, elkarlan hori fruitu bikainak ematen ari da; gaur Salaburu jaunak azaldu dituen proiektu zehatzez gainera, hor dago, besteak beste, Euskal Gramatika Sarean egitasmoa ere, Institutua duela zenbait urte lantzen ari dena eta hasiera beretik sarean eskuragarri egon dena”.

Eta gehitu du: “Euskarak, gaur, ez du arrotz eskola, ez unibertsitatea, ez teknika, ez hedabideak, ez lan mundua, ez kirola, ez beste ezein arlo. Euskarak era askotako erabiltzaileak ditu, gero eta gehiago. Zorionez, baita gero eta arlo gehiagotan ere: idazle, kazetari, itzultzaile, ikasle, irakasle, profesional eta abar.

Eta euskara-erabiltzaileok lanabes eta erreferentzia egokiak behar ditugu, kontsultatzen errazak eta gure jarduna etengabe hobetzeko baliagarriak. Gaur Euskara Institutuak aurkeztu dituen corpusak horren adibide bikaina dira. Aukera ematen digute gaur egungo hizkuntza produkzioen berri modu  hautatu eta sistematikoan berehala jasotzeko”.

“Helburuetan helburu da, euskara bizia, gero eta biziagoa izatea. Horretarako ez dago erabilera beste errezetarik, eta erabiltzeko, lehen esan bezala, tresna arina, aberatsa eta erosoa izan behar zaigu euskara. Horretarako lagungarria da, bete-betean, Euskara Institutuaren lana eta gaur hemen aurkeztu dena”, bukatu du Baztarrikak.

Pello Salaburuk honakoa adierazi du: “Oso pozik gaude urteotan Eusko Jaurlaritzarekin izan dugun elkarlanarekin. Guretzako ezinbestekoa zaigu elkarlan hau. Gaur hemen aurkeztu duguna oso erabilgarria izango zaie hizkuntzarekin lan egiten duten guztiei”.

Oraindik ez dago iruzkinik
  • Faceless avatar thumb 70
    Zerbait esan nahi duzu?… iruzkindu albiste hau
Komunikabideek behera kargatzeko
Ekitaldiko kargudunak
(X legealdia 2012 - 2016)
Beste gonbidatu batzuk
  • Pello Salaburu