Construir sistemes de traducció automàtica per a llengües menors: reptes i efectes (CA-EN)

Mikel L. Forcada

Resum


La creació de sistemes de traducció automàtica per a llengües desfavorides, que anomenaré llengües menors, presenta diversos reptes alhora que obri la porta a noves oportunitats. Després de definir conceptes preliminars com ara els de llengua menor i traducció automàtica, i d’explicar breument els tipus de traducció automàtica existents, els usos més comuns, el tipus de dades en què es basen, i els drets d’ús i les llicències del programari i de les dades de traducció automàtica, es discuteixen els reptes a què s’enfronta la construcció de sistemes de traducció automàtica i els possibles efectes sobre l’estatus de la llengua menor, usant com a exemples llengües menors d’Europa.


Paraules clau


traducció automàtica; llengües menors; recursos lingüístics; aragonés; bretó; sami; noruec bokmål; noruec nynorsk; occità; català; valencià

Cites


Armentano-Oller, Carme, i Forcada, Mikel L. (2006). Open-source machine translation between small languages: Catalan and Aranese Occitan. Dins Strategies for developing machine translation for minority languages (5th SALTMIL workshop on Minority Languages) (p. 51–54) [organitzat en conjunció amb LREC 2006 (22-28.05.2006)].

Carrera, Aitor. (2008). Acòrds dera Comission Lingüistica deth traductor automatic catalan-occitan occitancatalan”. (164 p.).

Casacuberta Nolla, Francisco, i Peris Abril, Álvaro. (2017). Traducción automática neuronal. Tradumática: Tecnologies de la Traducció, 15, 66–74.

Forcada, Mikel. (2006). Open source machine translation: an opportunity for minor languages. Dins Proceedings of the Workshop “Strategies for developing machine translation for minority languages”, LREC (vol. 6) (p. 1-6).

Forcada, Mikel. L. (2017). Making sense of neural machine translation. Translation Spaces, 6(2), 291-309.

Estudio de Filología Aragonesa. (2010). Propuesta ortografica provisional de l’Academia de l’Aragonés. Saragossa: Edicions Dichitals de l’Academia de l’Aragonés.

Eurobarometer Special. (2012). Europeans and their Languages. Comissió Europea.

Jakez, Fulup. (2019). [Comunicació personal].

Martínez, Juan Pablo. (2019). [Comunicació personal].

Moorkens, Joss, i Lewis, Dave. (2019). Research questions and a proposal for the future governance of translation data. Journal of Specialised Translation, 32, 2-25.

Nurminen, Mary. (2019). Decision-making, risk, and gist machine translation in the work of patent professionals. Dins Proceedings of the 8th Workshop on Patent and Scientific Literature Translation

(p. 32-42).

Rivera Pastor, Rafael, Tarín Quirós, Carlota, Villar García, Juan Pablo, Badia Cardús, Toni, i Melero Nogués, Maite. (2017). Language equality in the digital age: Towards a human language project [Estudi IP/G/STOA/FWC/2013-001/Lot4/C2]. Parlament Europeu.

Sánchez-Cartagena, Víctor. M., Sánchez-Martínez, Felipe, i Pérez-Ortiz, Juan Antonio. (2011). Enriching a statistical machine translation system trained on small parallel corpora with rule-based bilingual phrases. Dins Proceedings of the International Conference Recent Advances in Natural Language Processing 2011 (p. 90-96).

Sánchez-Cartagena, Víctor M., Forcada, Mikel L., i Sánchez-Martínez, Felipe. (2020). A multi-source approach for Breton-French hybrid machine translation [acceptat per a ser presentat en el 22nd Annual Conference of the European Association for Machine Translation (EAMT 2020), del 3 al 5 de novembre de 2020].

Streiter, Oliver, Scannell, Kevin P., i Stuflesser, Mathias. (2006). Implementing NLP projects for non-central languages: instructions for funding bodies, strategies for developers. Machine Translation, 20(4), 267-289.

Tyers, Francis M. (2009). Rule-based augmentation of training data in Breton-French statistical machine translation. Dins Proceedings of the 13th Annual Conference of the European Association of Machine Translation EAMT09 (p. 213-218).

Tyers, Francis M. (2010). Rule-based Breton to French machine translation. Dins Proceedings of the 14th Annual Conference of the European Association of Machine Translation (p. 174-181).

Unhammer, Kevin. (2019). [Comunicació personal].

Unhammer, Kevin, & Trosterud, Trond. (2009). Reuse of free resources in machine translation between Nynorsk and Bokmål. Dins Pérez-Ortiz, Juan Antonio, Sánchez-Martínez, Felipe, i Tyers, Francis M. (coords.) Proceedings of the First International Workshop on Free/Open-Source Rule-Based Machine Translation (p. 35–42) [congrés celebrat a la Universitat d’Alacant el novembre de 2009].

Williams, Briony, Nadeu, Climent, Sarasola, Kepa, Ó’Cróinin, Donncha, i Petek, Bojan. (2001). Speech and language technology for minority languages. Dins Proceedings of Eurospeech 2001.




DOI: http://dx.doi.org/10.2436/rld.i73.2020.3404



 

Reconeixement - NoComercial - SenseObraDerivada (by-nc-nd): No es permet un ús comercial de l'obra original ni la generació d'obres derivades.