The frequency dictionary derived from CORPES

Authors

DOI:

https://doi.org/10.17979/rlex.2024.30.11847

Keywords:

frequency dictionaries, lexical statistics, diatopic distribution of the lexicon

Abstract

The article aims to summarize the most important features of the frequency dictionary based on CORPES (v. 10) data published by the Real Academia Española in 2024, with version 1.1 of the corpus. In addition to providing the structure of the two components of this resource, we briefly analyze some of the consequences that can be deduced from the data obtained and highlight the advantages of a frequency dictionary conceived and developed in electronic format.

Downloads

References

ALAMEDA, José Ramón y Fernando CUETOS (1995): Diccionario de frecuencias de las unidades lingüísticas del castellano, Oviedo, Universidad de Oviedo, 2 vols.

ALMELA PÉREZ, Ramón, Pascual CANTOS, Aquilino SÁNCHEZ, Ramón SARMIENTO y Moisés ALMELA (2005): Frecuencias del español: Diccionario y estudios léxicos y morfológicos, Madrid, Universitas.

BIBER, Douglas, Randi REPPEN, Erin SCHNUR y Romy GHANEM (2016): «On the (non)utility of Juilland’s D to measure lexical dispersion in large corpora», International Journal of Corpus Linguistics, 21, pp. 439-464. DOI: https://doi.org/10.1075/ijcl.21.4.01bib

BONTRAGER, Terry (1991): «The development of Word Frequency Lists Prior to the 1944 Thorndike-Lorge List», Reading Psychology, 12, 2, pp. 91-116. DOI: https://doi.org/10.1080/0270271910120201

BREZINA, Vaclav (2018): Statistics in Corpus Linguistics. A practical guide, Cambridge, Cambridge University Press. DOI: https://doi.org/10.1017/9781316410899

BUCHANAN, Milton A. (1927): A Graded Spanish Word Book, Toronto, University of Toronto Press.

BUSTOS TOVAR, Eugenio de (1966): «Un nuevo recuento del vocabulario español», Filología moderna, 25-26, pp. 171-192.

BYBEE, Joan (2007): Frequency of Use and the Organization of Language, Oxford, Oxford University Press. DOI: https://doi.org/10.1093/acprof:oso/9780195301571.001.0001

CARTWRIGHT, C. W. (1925): «A Study of the Vocabularies of Eleven Spanish Grammars and Fifteen Spanish Reading Texts», The Modern Language Journal, 10, 1, pp. 1-14. DOI: https://doi.org/10.1111/j.1540-4781.1925.tb03721.x

CASTILLO FADIĆ, María Natalia (2021): Léxico básico del español de Chile, Santiago de Chile, Liberalia Ediciones.

DAVIES, Mark (2006): A Frequency Dictionary of Spanish. Core Vocabulary for Learners, Nueva York-Londres, Routledge.

DAVIES, Mark y Kathy H. DAVIES (2018): A Frequency Dictionary of Spanish. Core Vocabulary for Learners, Nueva York-Londres, Routledge. Presentado como segunda edición de Davies (2006). DOI: https://doi.org/10.4324/9781315542638

EGBERT, Jesse, Brent BURCH y Douglas BIBER (2020): «Lexical dispersion and corpus design», International Journal of Corpus Linguistics, 25, 1, pp. 89-115. DOI: https://doi.org/10.1075/ijcl.18010.egb

EZQUERRA, Raimundo (1974): «Los diccionarios de frecuencia en español», Boletín de la Asociación Europea de Profesores de Español, 10, pp. 3-27.

EZQUERRA, Raimundo (1977): «Los diccionarios de frecuencia en español II». Boletín de la Asociación Europea de Profesores de Español, 16, pp. 43-54.

GARCÍA HOZ, Víctor (1953): Vocabulario usual, vocabulario común y vocabulario fundamental, Madrid, CSIC, Instituto «San José de Calasanz».

GRIES, Stefan Th. (2008): «Dispersions and adjusted frequencies in corpora», International Journal of Corpus Linguistics, 13, 4, pp. 403-437. DOI: https://doi.org/10.1075/ijcl.13.4.02gri

JUILLAND, Alphonse y Eugenio CHANG-RODRIGUez (1964): Frequency Dictionary of Spanish Words, La Haya, Mouton. DOI: https://doi.org/10.1515/9783112415467

JUSTICIA, Fernando (1995): El desarrollo del vocabulario. Diccionario de frecuencias, Granada, Universidad de Granada.

KENISTON, Hayward (1920): «Common words in Spanish», Hispania, 3, 2, pp. 85-96. DOI: https://doi.org/10.2307/331305

KENISTON, Hayward (1933): List of Spanish Words and Idioms, Chicago, University of Chicago Press.

KENISTON, Hayward (1941): A Standard List of Spanish Words and Idioms, Boston, D. C. Heath and Co.

LIJFFIJT, Jefrey y Stefan Th. GRIES (2012): «Correction to Stefan Th. Gries’ “Dispersions and adjusted frequencies in corpora”, International Journal of Corpus Linguistics, 13:4 (2008), 403-437», International Journal of Corpus Linguistics, 17, 1, pp. 147-149 DOI: https://doi.org/10.1075/ijcl.17.1.08lij

MILLER, Don (2020): «Analysing Frequency Lists», en M. Paquot y S. Th. Gries, eds., A Practical Handbook of Corpus Linguistics, Springer, pp. 77-97. DOI: https://doi.org/10.1007/978-3-030-46216-1_4

MILLER, Don y Douglas BIBER (2015): «Evaluating reliability in quantitative vocabulary studies. The influence of corpus design and composition», International Journal of Corpus Linguistics, 20, 1, pp. 30-53. DOI: https://doi.org/10.1075/ijcl.20.1.02mil

MORALES, Amparo (1986): Léxico básico del español de Puerto Rico, San Juan, Academia Puertorriqueña de la Lengua Española.

MULLER, Charles (1965): «Un dictionnaire de fréquence de l’espagnol moderne», Zeitschrift für romanische Philologie, 81, 5-6, pp. 476-483.

NATION, I. S. P. (2006): «How Large a Vocabulary Is Needed for Reading and Listening?», The Canadian Modern Language Review / La Revue canadienne des langues vivantes, 63, 1, pp. 59-82. DOI: https://doi.org/10.3138/cmlr.63.1.59

NATION, I. S. P. (2016): Making and Using Word Lists for Language Learning and Testing, Amsterdam-Filadelfia, John Benjamins. DOI: https://doi.org/10.1075/z.208

ROBLES-GARCÍA, Pablo (2020): «3K-LEx. Desarrollo y validación de una prueba de amplitud léxica en español», Journal of Spanish Language Teaching, 7, 1, pp. 64-76. DOI: https://doi.org/10.1080/23247797.2020.1770465

RODRÍGUEZ BOU, L. (1952): Recuento de vocabulario español, Río Piedras, Universidad de Puerto Rico.

ROJO, Guillermo (2011): «Frecuencia de inventario y frecuencia de uso», Revista Española de lingüística, 41, 1, pp. 5-43. DOI: https://doi.org/10.31810/rsel.v41i1.5

ROJO, Guillermo (2022): «Sobre algunos rasgos estadísticos del léxico de la lengua oral», en Carmen Díaz Alayón, coord., Studia philologica in honorem José Antonio Samper, Madrid, Academia Canaria de la Lengua-Arco/Libros, pp. 877-894.

ROJO, Guillermo (2021): Introducción a la lingüística de corpus en español, Londres-Nueva York, Routledge. DOI: https://doi.org/10.4324/9781003119760

ROJO, Guillermo (2023): Análisis informatizado de textos, Santiago de Compostela, Universidade de Santiago de Compostela (Servizo de Publicacións).

ROJO, Guillermo (en prensa a). «Un breve apunte sobre las frecuencias léxicas».

ROJO, Guillermo (en prensa b). «¿Cuántos lemas hay que dominar para entender la prensa uruguaya?».

ROJO SASTRE, Antonio José, Paul RIVENC y Adán FERRER (1969): Vida y diálogos de España, París, Didier, 4 vols.

SCHMITT, Norbert, Xiangying JIANG y William GRAHE (2011): «The percentage of words known in a text and reading comprehension», Modern Language Journal, 95, 1, pp. 26-43. DOI: https://doi.org/10.1111/j.1540-4781.2011.01146.x

SEBASTIÁN GALLÉS, Nuria, coord., M.ª Antònia MARTÍ ANTONÍN, Manuel Francisco CARREIRAS VALIÑA, Fernando CUETOS VEGA (2000): Léxico informatizado del español, Barcelona, Universitat de Barcelona.

THORNDIKE, Edward L. e Irving Lorge (1944): The teacher's word book of 30,000 words, Nueva York, Teachers College Press.

ZIPF, George Kingsley (1935): The Psycho-biology of Language. An Introduction to the Dynamic Philology, Cambridge (MA), MIT Press.

ZIPF, George Kingsley (1949): Human Behaviour and the Principle of Least-Effort, Cambridge (MA), Addison-Wesley.

Published

2025-03-19

How to Cite

Rojo, G. (2025). The frequency dictionary derived from CORPES. Revista de Lexicografía, 30, 133–159. https://doi.org/10.17979/rlex.2024.30.11847