Compartir
Publicidad

¿Cuántas palabras usamos? Descubre la riqueza de tu vocabulario (I)

¿Cuántas palabras usamos? Descubre la riqueza de tu vocabulario (I)
Guardar
7 Comentarios
Publicidad
Publicidad

Admito que, en uno de mis arrebatos de juventud, tuve la osadía de leerme mi diccionario Vox entero. En tres ocasiones. En cada lectura, tomaba nota de las palabras que ignoraba y que me resultaban más curiosas. Como escible.

Sin embargo, la mayoría de gente no se lee el diccionario entero. Incluso los hay que jamás lo consultan. Así que nuestro vocabulario, en general, es bastante limitado.

En la versión inglesa de Orgullo y prejuicio, Jane Austen usa más de 6.000 palabras diferentes. Pero cualquier lector medio puede leerla sin problemas. De hecho, el vocabulario pasivo de una persona normal puede perfectamente superar las 10.000 palabras (vocabulario pasivo significa palabras que conocemos pero que no usamos necesariamente en nuestra vida cotidiana). El vocabulario activo, no obstante, apenas es de unos centenares de palabras.

En cualquier caso, existe un experimento casero para averiguar cuál es nuestro vocabulario, cuántas palabras conocemos. Pero antes de explicaros en qué consiste, quiero hablaros de culturomics.org

Culturomics es la mayor base de datos de la historia y está formada por todos los libros digitalizados hasta el momento: nada menos que el 4 % de todos los volúmenes publicados en el mundo desde el principio de la imprenta. Es decir, 15 millones de libros.

El acceso total a todos estos textos ha permitido que nazca una nueva disciplina llamada culturónica, basada en el análisis textual y la frecuencia de aparición a lo largo de los libros. Algo así como la ley de Zipf, pero a lo bestia. Y es que las estadísticas se pueden llevar a cabo con billones de palabras.

361.000 millones de palabras en inglés. 45.000 millones en francés. 45.000 millones en español. 37.000 millones en alemán. 35.000 millones en ruso. 13.000 millones en chino. 2.000 millones en hebreo.

Adicionalmente, la herramienta online Google Books Ngram Viewer permite al usuario elaborar una cadena de hasta cinco palabras y observar en una gráfica la evolución de su uso, lo cual puede permitir a los científicos sociales, los científicos informáticos y los matemáticos el observar la aparición y evolución de las tendencias culturales a través del tiempo.

Así, por ejemplo, podemos determinar la frecuencia de aparición de palabras para contemplar la evolución de la cultura escrita. Durante las primeras décadas de la invención de la imprenta, apenas se imprimían unos pocos miles de palabras al año. Pero ya en 1800 se imprimían 60 millones de palabras por año. En 1900, un billón al año. Y en el año 2000, 8 billones anuales.

También podemos averiguar los cambios en el lenguaje, las modas lingüísticas, las tendencias, la censura de determinadas palabras, el auge de algunos personajes, el ocaso de otros. Por ejemplo, aparece más el nombre de Freud que el de Galileo, Darwin y Einstein.

En los textos rusos del siglo XX no se encuentra el nombre de Trotsky. Tampoco el de Tiannanmen en os chinos.

La palabra God (Dios) está en declive, sobre todo en el siglo XX.

Podéis hacer vuestras propias búsquedas en la web de culturomics. Una curiosa: entre 1890 y 1910 hubo un pico del uso en inglés de la palabra Google.

Ah, pero os prometí cómo podíais calcular el número de palabras que forma vuestro vocabulario. Lo prometido es deuda, pero en la próxima entrega de este artículo.

Vía | Cómo los números pueden cambiar tu vida Graham Tattersall / Culturónica: leer sin leer de Màrius Serra

Temas
Publicidad
Comentarios cerrados
Publicidad
Publicidad
Inicio