Estabilitat idiolectal de l’espanyol a través de quatre gèneres de comunicació: aportacions a l’anàlisi de l’autoria forense

Andrea Mojedano Batel, Neus Alberich Buera, Krzysztof Kredens

Resum


L’anàlisi d’autoria forense es basa en que cada parlant té la seva pròpia versió d’una llengua o idiolecte els trets lingüístics del qual són recurrents de manera relativament estable (Coulthard et al., 2011). En lingüística, hi ha una gran disparitat entre el coneixement del concepte de l’idiolecte i el seu estudi amb dades empíriques (Barlow, 2013). En aquesta investigació multigenèrica (cross-genre, en anglès) vam cobrir part d’aquestes llacunes, amb dades de corpus escrits i orals de l’espanyol mexicà. A través d’una anàlisi de n-grames de paraules, vam identificar quatre àrees d’estabilitat idiolectal en espanyol: llenguatge avaluatiu i expressions de quantitat, de modalitat deòntica i de modalitat epistèmica. Els nostres resultats mostres que les construccions gramaticals són útils en l’anàlisi de l’autoria, considerant el context forense, amb anàlisis motivades lingüísticament combinades amb eines quantitatives. Així mateix, vam proporcionar una anàlisi lingüística fonamentada en la teoria de la gramàtica de construccions basada en l’ús, cosa que dona compte adequadament de l’ús recurrent i particular de les construccions idiolectals.


Paraules clau


idiolecte, anàlisi multigenèrica; variació idiolectal; anàlisi de l’autoria; lingüística forense

Cites


Anthony, Laurence. (2017). AntConc (Version 3.5.0) [Computer Software]. Waseda University.

Baayen, Harald, Van Halteren, Hans, Neijt, Anneke, y Tweedie, Fiona. (2002). An experiment in authorship attribution. Proceedings of JADT 2002: 6es Journées internationales d’Analyse statistique des Données Textuelles, 69-75.

Barlow, Michael. (2013). Individual differences and usage-based grammar. International Journal of Corpus Linguistics, 18(4), 443-478. https://dx.doi.org/10.1075/ijcl.18.4.01bar

Bell, Allan. (1984). Language style as audience design. Language in society, 13(2), 145-204.

Blas Arroyo, José Luis. (2017). ¿Identidades lingüísticas invariables? Trayectorias idiolectales ante la variación y el cambio lingüí stico en el español clásico. Revista Internacional de Lingüística Iberoamericana, 30, 117-144.

Bloch, Bernard. (1948). A set of postulates for phonemic analysis. Language, 24(1), 3-46.

Bucholtz, Mary, y Hall, Kira. (2010). Locating identity in language. En Carmen Llamas y Dominic Watt (eds.), Language and identities (pp. 18-28). Edinburgh University Press.

Bybee, Joan, y Eddington, David. (2006). A Usage-Based Approach to Spanish Verbs of ‘Becoming.’ Language, 82(2), 323-355.

Bybee, Joan, Perkins, Revere, y Pagliuca, William. (1994). The evolution of grammar: Tense, aspect and modality in the languages of the world. The University of Chicago Press.

Cicres, Jordi, y Queralt, Sheila. (2019). An n-gram based approach to the automatic classification of schoolchildren’s writing. Vigo International Journal of Applied Linguistics, 16, 53-80.

Coulthard, Malcolm, Grant, Tim, y Kredens, Krzysztof. (2011). Forensic linguistics. En Ruth Wodak, Barbara Johnstone y Paul E. Kerswill (eds.), The SAGE Handbook of Sociolinguistics (pp. 531-544). SAGE Publishing. https://sk.sagepub.com/reference/hdbk_sociolinguistics/n36.xml

De Houwer, Annick. (2005). Bilingual development in the early years. En Encyclopedia of Language & Linguistics (2a ed.). Elsevier.

Drummond, Rob, y Schleef, Erik. (2016). Identity in variationist sociolinguistics. En The Routledge handbook of language and identity (pp. 50-65). Routledge.

Eckert, Penelope. (2000). Linguistic variation as social practice. Blackwell.

Eguren, Luis, y Sánchez, Cristina. (2007). Grammar and history of Spanish cierto. En Georg A. Kaiser y Manuel Leonetti (eds.), Proceedings of the Workshop “Definiteness, Specificity and Animacy in Ibero-Romance Languages”. Arbeitspapier, 122. Fachbereich Sprachwissenschaft, Universität Konstanz, 1-22.

Gibbons, John, y Turell, Maria Teresa (eds.). (2008). Dimensions of Forensic Linguistics. John Benjamins.

Giles, Howard, y Powesland, Peter. (1975). Speech style and social evaluation. Academic Press. https://dx.doi.org/10.1017/S0047404500005820

Goldberg, Adele. (2003). Constructions: A new theoretical approach to language. Trends in cognitive sciences, 7(5), 219-224. https://doi.org/10.1016/S1364 6613(03)00080-9

Goldstein-Stewart, Jade, Winder, Ransom, y Sabin, Roberta. (2009). Person identification from text and speech genre samples. “Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics”, 336-344.

Grant, Tim. (2010). Text messaging forensics Txt 4n6: Idiolect free authorship analysis?En Malcolm Coulthard y Alison Johnson (eds.), The Routledge handbook of forensic linguistics (pp. 536-550). Routledge. https://doi.org/10.4324/9780203855607.cU33

Grant, Tim. (2022). The Idea of Progress in Forensic Authorship Analysis (Elements in Forensic Linguistics). Cambridge University Press.

Hopper, Paul. (1987). Emergent Grammar. Berkeley Linguistics Society, 13, pp. 139-157.

Iglesias, Olivier. (2016). “Se le quedó mirando”: la atracción de clíticos en un corpus de idiolectos (s. xix-xxi). En Johannes Kabatek (ed.), Lingüística de corpus y lingüística histórica iberorrománica (pp. 424-448). De Gruyter. https://doi.org/10.1515/9783110462357-019

Johnson, Alison, y Wright, David. (2017). Identifying idiolect in forensic authorship attribution: an n-gram textbite approach. Language and Law = Linguagem e Direito, 1(1), 37-69.

Juola, Patrick. (2008). Authorship Attribution. Now Publishing. http://dx.doi.org/10.1561/1500000005

Kiesling, Scott F. (2013). Constructing identity. En J. K. Chambers y Natalie Schilling (eds.), The handbook of language variation and change (2a ed., pp. 448-467). John Wiley and Sons.

Kredens, Krzysztof. (2002). Towards a corpus-based methodology of forensic authorship attribution: a comparative study of two idiolects. En Barbara Lewandowska-Tomaszczyk (Ed.), PALC’01: Practical Applications in Language Corpora (pp. 405-437). Peter Lang.

Labov, William. (1972). Language in the inner city: Studies in the Black English vernacular. University of Pennsylvania Press. https://doi.org/10.1177/089124167600400410

Labov, William. (1984). Field methods of the project on linguistic change and variation. En John Baugh y Joel Sherzer (eds.), Language in Use: Readings in Sociolinguistics (pp. 28-53). Prentice Hall.

Langacker, Ronald. (1987). Foundations of cognitive grammar. Volume I: Theoretical prerequisites. Stanford University Press.

Litvinova, Tatiana, Seredin, Pavel, Litvinova, Olga, Dankova, Tatiana, y Zagorovskaya, Olga. (2018). On the stability of some idiolectal features. En Alexey Karpov, Oliver Jokisch y Rodmonga Potapova (eds.), Speech and Computer. SPECOM 2018. Lecture Notes in Computer Science (vol. 11096). Springer, Cham. https://doi.org/10.1007/978-3-319-99579-3_35

Litvinova, Tatiana, Litvinova, Olga, y Seredin, Pavel. (2018, 13-16 de noviembre). Assessing the level of stability of idiolectal features across modes, topics and time of text production [Ponencia]. 23rd Conference of Open Innovations Association (FRUCT), Boloña, Italia, pp. 223-230.

Milroy, James. (1992). Linguistic Variation and Change. Blackwell.

Mojedano Batel, Andrea, Soler Bonafont, Amparo, y Kredens, Krzysztof. (En prensa). Epistemic modality constructions as stable idiolectal features: A cross-genre study of Spanish. International Journal for the Semiotics of Law.

Moore, Emma. (2011). Variation and identity. En Warren Maguire y April McMahon (eds.), Analysing variation in English (pp. 219-236). Cambridge University Press.

Mufwene, Salikoko. (2010). SLA and the emergence of creoles. Studies in Second Language Acquisition, 32(3), 359-400. https://doi.org/10.1017/S027226311000001X

Nuyts, Jan. (2005). The modal confusion: On terminology and the concepts behind it. En Alex Klinge y Henrik Müller (eds.), Modality: Studies in form and function (pp. 5-38). Equinox.

Nuyts, Jan. (2016). Analyses of the Modal Meanings. En Jan Nuyts y Johan van der Auwera (eds.), The Oxford Handbook of Modality and Mood (pp. 31-49). Oxford University Press.

Ochs, Elinor. (1992). Indexing gender. En Alessandro Duranti y Charles Goodwin (eds.), Rethinking context: language as an interactive phenomenon (pp. 335-358). Cambridge University Press.

Overdorf, Rebekah, y Greenstadt, Rachel. (2016). Blogs, twitter feeds, and reddit comments: Cross-domain authorship attribution. Proceedings on Privacy Enhancing Technologies, 3, 155-171. https://doi.org/10.1515/popets-2016-0021

Queralt, Sheila. (2014). Acerca de la prueba lingüística en atribución de autoría hoy. Revista de Llengua i Dret, 62, 35-48.

Queralt, Sheila, y Giménez García, Roser. (2018). La imitación como contraargumento en peritajes de atribución de autoría: estudio de un caso. Estudios de Lingüística Aplicada, 36(68), 131-164.

Rauniomaa, Mirka. (2003). Stance accretion. Estudio presentado en el Language, Interaction, and Social Organization Research Focus Group. University of California, Santa Barbara (febrero de 2003).

Rickford, John, y McNair-Knox, Faye. (1994). Addressee-and topic-influenced style shift: A quantitative sociolinguistic study. En Douglas Biber y Edward Finnegan (eds.), Perspectives on Register: Situating Register Variation within Sociolinguistics (pp. 235-276). Oxford University Press.

Romano, Manuela, y Porto Requejo, María Dolores. (2013). Emotion, attention and idiolectal variation in radio narratives. Revista Española de Lingüística Aplicada, (volumen monográfico), 143-164.

Solan, Lawrence, y Tiersma, Peter. (2004). Author identification in American courts. Applied linguistics, 25(4), 448-465. https://doi.org/10.1093/applin/25.4.448

Soler Bonafont, María Amparo. (2022). Esto es lo que creo... El dominio de la opinión en el español hablado a través de los usos construccionales de creo. Círculo de Lingüística Aplicada a la Comunicación, 91, 219-231. http://dx.doi.org/10.5209/CLAC.77196

Spassova, Maria. (2009). El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español. [Tesis doctoral]. Universitat Pompeu Fabra.

Spassova, Maria S., López, Fernanda, Queralt, Sheila, Gavaldà, Núria, Cicres, Jordi, García Barrero, David, y Marquina, Montse. (2014). Idiolectometria forense: estat de la qüestió. En Núria Gavaldà Ferré, Montserrat Forcadell Guinjoan y Raquel Casesnoves-Ferrer (eds.), Ens queda la paraula: estudis de lingüística aplicada en honor a M. Teresa Turell. Sèrie monografies, 3. Documenta Universitaria.

Stamatatos, Efstathios. (2013). On the robustness of authorship attribution based on character n-gram features. Journal of Law and Policy, 21(2), 421-439.

Stamatatos, Efstathios. (2017). Authorship attribution using text distortion. “Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics”, vol. 1, Long Papers, 1138-1149. https://doi.org/10.18653/v1/E17-1107

Swales, John. (1990). Genre Analysis: English in Academic and Research Settings. Cambridge University Press.

Thompson, Geoff, y Hunston, Susan. (2000). Evaluation: an introduction. En Susan Hunston y Geoff Thompson (eds.), Evaluation in text: authorial stance and the construction of discourse (pp. 1-27). Oxford University Press.

Turell, Maria Teresa. (2011). La tasca del lingüista detectiu en casos de detecció de plagi i determinació d’autoria de textos escrits. Llengua, Societat i Comunicació, 9, 69-85.

Turell, Maria Teresa, y Gavaldà, Núria. (2013). Towards an index of idiolectal similitude (or distance) in forensic authorship analysis. Journal of Law and Policy, 21(2), 495-514.

Troya Déniz, Magnolia. (2015). Quizá(s) y tal vez en novelistas de España y América. Philologica Canariensia, 21, 109-132. https://doi.org/10.20420/PhilCan.2015.0036

Van der Auwera, Johan. (1996). Modality: the three-layered scalar square. Journal of Semantics, 13(3), 181-195.

Wright, David. (2014). Stylistics versus Statistics: A corpus linguistic approach to combining techniques in forensic authorship analysis using Enron emails [Tesis doctoral]. University of Leeds.

Wright, David. (2017). Using word n-grams to identify authors and idiolects: A corpus approach to a forensic linguistic problem. International Journal of Corpus Linguistics, 22(2), 212-241. https://doi.org/10.1075/ijcl.22.2.03wri




DOI: http://dx.doi.org/10.58992/rld.i79.2023.3951



 

Reconeixement - NoComercial - SenseObraDerivada (by-nc-nd): No es permet un ús comercial de l'obra original ni la generació d'obres derivades.