
Incorporación de tecnologías de IA al proceso de recuperación y promoción del Euskera
Esta semana, la famosa empresa desarrolladora de Inteligencia Artificial OpenAI ha anunciado la futura salida de la tecnología de interpretación y generación de textos GPT-4.
Este año ya ha ido conociéndose el potencial, tanto positivo como negativo, de este tipo de tecnologías. Herramientas como ChatGPT, ya sea por primera mano o por que nos lo han contado, han irrumpido en nuestras vidas, para la mayoría de nosotros, inesperadamente, y han proporcionado funcionalidades que hace un año se creían ciencia ficción.
En la presentación de este nuevo GPT-4, se han hecho propuestas para su uso de lo más interestanes. Por ejemplo, herramientas de aprendizaje de lenguaje como Duolingo ya han anunciado que se va a utilizar como un “coach” personal para complementar las lecciones. Por otro lado, Khan Academy, la academia online sin ánimo de lucro más grande del mundo, ya ha confirmado que utilizarán esta tecnología como un profesor particular virtual, que ayude a los alumnos en cualquier tipo de asignatura, desde matemáticas y física hasta economía e historia, ayudando también a, por ejemplo, mejorar su capacidad crítica y de debate manteniendo conversaciones en las que la máquina adopte un punto de vista contrario al alumno. Pero quizás lo más significativo para mí, y lo en lo que a esta propuesta respecta, OpenAI colaborará con el Gobierno de Islandia para el mantenimiento y desarrollo del idioma islandés.
El islandés se encuentra en una situación parecida a nuestra lengua. Una población que conoce el idioma, pero que no lo utiliza en el día a día por la influencia de naciones externas mucho más poderosas que hacen mucho más cómodo utilizar su lengua, en este caso el inglés. La apuesta del Gobierno Islandés es colaborar con OpenAI para mejorar las capacidades de estas nuevas tecnologías con el idioma, para que una población cada vez más expuesta a las inteligencias artificiales tenga herramientas extremadamente potentes para poder lograr información fiable y de calidad en islandés.
Mi propuesta no sólo al Departamento de Cultura y Política Lingüística y a nuestro sailburu, sino a HABE y las demás instituciones y organizaciones no gubernamentales que colaboran en la euskaldunización de la población vasca, es entablar conversaciones con OpenAI para incluir al euskera en un proyecto similar al islandés. Una colaboración público-privada que ponga a Euskadi como un referente en política lingüística. Que en cuestión de menos de dos años los vascos tengamos acceso a potentes herramientas para utilizar en nuestra vida privada, en la universidad, en el trabajo, para poder encontrar información en nuestra lengua, para aprender sobre la misma.
Todavía estamos empezando a ver todas las funcionalidades que estas novedosas tecnologías nos ofrecen, y todavía estamos viendo únicamente la punta del iceberg. El euskera tiene el potencial de ser más fuerte que nunca acompañado por las inteligencias artificiales, y este es precisamente el momento para moverse, no dentro de cinco o diez años, no: ahora.
Me imagino, en un futuro espero que no muy lejano, un chatbot que asesore a un ciudadano que esté visitando una sede electrónica, o un euskaltegi que ofrezca cursos autodidactas con un profesor virtual, o una herramienta educativa en la que, por ejemplo, un alumno de secundaria o bachillerato pregunte cómo se hace un ejercicio de física y que se lo explique paso a paso, las opciones son infinitas, y todo ello mientras, incluso sin darnos cuenta, el euskera va convirtiéndose en algo mucho más presente en todas nuestras vidas.
-
-
2023 May 17
Lagun hori,
Gracias por recurrir a Irekia para realizar su pregunta.
En estos tiempos de nuevas tecnologías, el Gobierno Vasco está apostando fuerte por contar con las mejores herramientas tecnológicas en Euskera y por ponerlas a disposición de la ciudadanía. En su día se utilizaron tanto el enfoque semántico como el sintáctico y en los últimos años se han creado grandes oportunidades con la ayuda de la inteligencia artificial. El proyecto Itzuli refleja uno de esos desarrollos de la inteligencia artificial. Este proyecto ha permitido desarrollar traducciones de calidad, transcripción (de voz a texto) o síntesis (de texto a voz). Todos estos servicios están disponibles en la página web https://www.euskadi.eus/itzuli en la App del móvil y en un plugin para navegadores.
En cuanto a la tecnología: ChatGPT utiliza redes neuronales y en concreto el procedimiento denominado Transformer ( https://es.wikipedia.org/wiki/ChatGPT ). El procedimiento Transformer es precisamente el que se utiliza en el traductor neuronal del Gobierno Vasco. Para explicarlo brevemente, funciona de la siguiente manera: a la “máquina” se le muestran múltiples datos y ésta “recuerda” lo más “repetido o lo más común”, y al cabo de unos días se consigue tener un modelo. La información que lleva el modelo en su interior es el alma de lo visto y tiene la capacidad de recordarlo una vez preguntado al respecto y generar respuestas. En el caso de ChatGPT, se consigue entrenar a la máquina desde conversaciones de Internet, o desde conversaciones múltiples creadas directamente por su su propietario (OpenAI) o pagadas. ( https://www.muycomputerpro.com/2023/01/19/openai-mejoro-chatgpt-pagando-trabajadores-kenia ). Así que la máquina no "aprende" o "recuerda" cosas nuevas directamente, sino que una vez que ha dado nuevos contenidos, crea un nuevo modelo. Si el ChatGPT ha mejorado probablemente sea porque los nuevos contenidos se han mostrado a la máquina o porque un equipo de trabajo ha estado guardando, analizando y dirigiendo las conversaciones con la máquina.
OpenAI nació en 2015 como una entidad con el objetivo de que la inteligencia artificial pueda ser utilizada de forma libre y útil en todo el mundo. En 2018 se cambió el enfoque y se decidió que los servicios que iban a crear serían cerrados y de pago
https://www.eleconomista.es/tecnologia/noticias/12156187/02/23/Elon-Musk-reniega-de-OpenAI-la-creadora-de-ChatGPT-No-la-funde-para-esto.html . A este respecto, no está claro cómo será el futuro, sobre todo porque en toda está ámbito se cruza la cuestión de la protección de datos. Hay que tener en cuenta que el objetivo del Gobierno debe ser garantizar la protección de datos de la ciudadanía, por lo que debemos tener mucho cuidado a la hora de ofrecer este tipo de productos o servicios, ya que es muy probable que se produzca un choque con la normativa de protección de datos personales. Sin embargo, estamos en contacto con Microsoft para analizar cuáles pueden ser los usos y en qué condiciones se podrían ofrecer estos servicios.Esperando que la información le haya sido de utilidad,
Reciba un cordial saludo.
*******
Lagun hori,
Eskerrik asko Irekiara jotzeagatik zure galderarekin.Eusko Jaurlaritza apustu sendoa egiten ari da teknologia berrien garai honetan Euskarazko tresnarik onenak izateko eta herritarren eskura jartzeko. Bere garaian ikuspegi semantikoa zein sintaktikoa erabili izan zen eta azkenengo urteetan adimen artifizialak lagunduta izugarrizko aukerak sortu dira. Itzuli proiektuan islatu da adimen artifizialaren garapen handiena. Proiektu honi esker, kalitatezko itzulpenak, transkripzioa (ahotsetik testura) edo sintesia (testutik ahotsera) garatu ahal izan dira. Zerbitzu guzti hauek erabilgarri daude web orrialdean ( https://www.euskadi.eus/itzuli ), mugikorreko App-an eta nabigatzaileentzako plugin batean.
Teknologiari dagokionez; ChatGPTk sare neuronalak erabiltzen ditu eta hain zuzen ere Transformer deituriko prozedura ( https://es.wikipedia.org/wiki/ChatGPT ). Transformer prozedura da hain zuzen ere Jaurlaritzaren itzultzaile neuronalean erabiltzen dena. Labur laburrean azaltzeko, honela funtzionatzen du: “Makinari” datu anitz erakusten zaio eta makinak “ohikoena” "gogoratzen” du eta egun batzuren bueltan modelo bat izatea lortzen da. Modeloak bere barnean daraman informazioa da ikusitakoaren arima eta gaitasuna du behin horren inguruan galdetuta gogoratzeko eta erantzunak sortzeko. ChatGPTren kasuan, internetetik edo bere jabeak (OpenAI) zuzenean sortutako eta ordaindutako elkarrizketa anitzetatik ( https://www.muycomputerpro.com/2023/01/19/openai-mejoro-chatgpt-pagando-trabajadores-kenia ) makina trabatzea lortzen da. Beraz, makinak ez ditu gauza berriak zuzenean "ikasten" edo "gogoratzen" baizik eta eduki berriak eman ondoren, modelo berri bat sortzen du. ChatGPTk hobera egin badu ziurrenik izango da eduki berriak makinari erakutsi zaizkiolako edo makinarekin izandako elkarrizketak lantalde bat gordetzen, aztertzen eta zuzentzen aritu delako.
OpenAI entitate bezala 2015ean sortu zen, adimen artifiziala askea eta erabilgarria mundu osoan erabili ahal izateko helburuarekin. 2018an ikuspegia aldatu zen eta erabaki zen sortu behar zituzten zerbitzuak itxiak eta ordaindu beharrekoak izango zirela https://www.eleconomista.es/tecnologia/noticias/12156187/02/23/Elon-Musk-reniega-de-OpenAI-la-creadora-de-ChatGPT-No-la-funde-para-esto.html Gai honi dagokionez, ez dago argi zein izango den etorkizuna batez ere datu babesaren kontua tartean dagoelako. Kontutan izan Jaurlaritzaren helburua izan behar dela herritarren datu babesa bermatzea eta, beraz, kontu handiarekin ibili behar gara horrelako produktuak edo zerbitzuak eskaintzeko garaian, oso litekeena delako herritarren datu babesaren legearekin talka egitea. Hala ere, Microsoftekin harremanetan gabiltza aztertzeko zeintzuk izan daitezkeen erabilerak eta ze nolako baldintzetan eskaini ahal izango liratekeen zerbitzu horiek.
Informazioa baliagarria izango zaizulakoan,
Ondo izan