miércoles, 22 de julio de 2009

CORDURA TRANSITORIA - UNA EXPLOSION DE SENTIDO COMUN


[“Mi actividad principal consiste en tomar el pelo a aquellos que se toman a sí mismos y a la calidad de su conocimiento demasiado en serio” (Nassim Nicholas Taleb)]

Efecto Joule-Thomson o Joule-Kelvin: La temperatura de un gas desciende si se somete a un descenso de presión. Este descenso de presión puede conseguirse, entre otras muchas formas, haciendo pasar el gas a través de una abertura estrecha.

Coloquemos ahora la mano a 5 centímetros frente a la boca. Ahora coged aire. Empezad a echar el aire sobre la mano, primero con la boca muy abierta, e id cerrando poco a poco los labios hasta terminar formando con ellos un estrecho orificio. El aliento está caliente pero el soplido está frío. Al hacer pasar el aliento (inicialmente a temperatura corporal) a través de una abertura estrecha sufre una compresión y descompresión que provocan el descenso de su temperatura. Así funciona el aire acondicionado. [Sacado de CPI]

Todo esto para hablar del tema del post de hoy: La ley de Zipf – lingüista y filólogo de EEUU. Transcribo aquí un texto de Wagensberg – como no :-) – ampliado. Me gustó su propuesta y busqué más información sobre el tema.

Zipf aplicó el análisis estadístico al estudio de diferentes lenguas. Su Ley dice: “Un pequeño número de palabras son utilizadas con mucha frecuencia, mientras que frecuentemente ocurre que un gran número de palabras son poco empleadas”. Se toma un texto con un gran número de palabras – mayor de 5000 – y se calcula cuantas veces aparece cada palabra. Se ordena la tabla de palabras de más a menos frecuente. El orden en que aparece cada palabra en esta lista ordenada se llama “rango”. En textos en inglés la palabra más frecuente suele ser “the” y por ello su rango es 1. En castellano las palabras más comunes son también los artículos y proposiciones, mientras que palabras como “lingüística” son muy poco frecuentes y tendrán (si aparecen en el texto citado) un rango muy alto. La ley de Zipf dice, en términos matemáticos, que el número Y de veces que aparece una palabra es inversamente proporcional a su rango X de forma que Pn= 1/ n elevado a "a".

Y esto se cumple seas un escritor con un lenguaje más amplio o seas un escritor con un lenguaje más pobre. No puedes evitar, aunque manejes un vocabulario rico, utilizar las palabras más frecuentes.

Otro estudio estadístico en relación a esta Ley y al lenguaje establece que, al principio, el vocabulario crece bastante, pero a medida que el texto se va haciendo mayor, habrá un menor número de palabras nuevas y por tanto el crecimiento del vocabulario será menor.

Otra forma de calcular la Ley de Zipf es, contar cuantas veces aparece una palabra, y dividirla entre el número total de palabras del texto. Luego, según ese rango, se aplica la Ley…y, por una razón parecida, hay más insectos que mamíferos, más ratones que perros, más perros que caballos, más caballos que ballenas, más arbustos que arboles, más pinos que secuoyas…A igual cantidad de recursos, es la distribución más económica…Lo más frecuente es más corto sino sería un auténtico derroche de tinta y papel, de saliva y teléfono.

Y una reflexión siempre deja preguntas flotando a su alrededor. Por ejemplo, ¿cuál es la longitud media de una palabra en un texto? El cálculo es sencillo: medimos el número de palabras y el número de letras. Dividiendo el primer número por el segundo, sabremos el número de letras por palabra. La respuesta para este libro concreto – dice Wagensberg en relación a su libro “El gozo intelectual” – es de 4.93 letras por palabra. ¿Es esta cifra homogénea a lo largo del libro? Curiosamente la primera parte – la teoría – tiene un valor de 5.03, y la 2ª parte – la práctica – lo tiene de 4,89. Es decir, este número depende de la clase de texto. Un texto de ensayo utiliza palabras, en principio, más improbables que un texto narrativo. Y una palabra es tanto más larga cuanto mayor sea su improbabilidad. Por lo tanto: la longitud media de las palabras debería ser mayor en un párrafo filosófico que en un párrafo narrativo. En este libro - sigue razonando Wagensberg - una medida de este índice da 4,60 letras por palabra, en un párrafo de una historia, mientras que da una media de 5,10 letras por palabra en un párrafo de una reflexión.

¿Servirá este número como índice perverso para medir el grado filosófico de un cuentista, o el grado de cuentista de un filósofo?

¿Permanece estable el índice para cualquier texto mínimamente extenso, mientras no varíe ni el género literario ni el idioma?

Si es así ¿tiene cada idioma una característica longitud media de palabra?

Un ejemplo práctico que aplica esta Ley: ¿Conoceis el manuscrito Voynich (el de la foto que encabeza este post)? Este es el nombre que recibe un misterioso libro escrito hace unos 500 años por un autor de identidad desconocida que utilizó un lenguaje y un alfabeto de igual manera desconocidos, incluso en la actualidad. A través del tiempo se han realizado numerosos estudios intentando entender el lenguaje en el que está escrito y así revelar su contenido, pero todos los intentos han fallado, incluso cuando fue estudiado por expertos en criptografía británicos y estadounidenses de la segunda guerra mundial. Esto ha llevado a muchos a sospechar que el manuscrito simplemente podría tratarse de algún engaño y que realmente solo se trata de símbolos al azar y sin sentido. Pero hay un argumento fuerte contra esta posibilidad y es el hecho de que los manuscritos cumplen con la llamada ley de Zipf, que dice que, en todos los lenguajes conocidos, las palabras que más se repiten son las más cortas...lo que se cumple con el texto en el manuscrito perfectamente...y no en otros lenguajes "artificiales" creados en la modernidad. El manuscrito permanece actualmente en la Universidad de Yale, esperando que se revelen sus secretos [Sacado del comentario colgado por Nightingale en el foro de http://foroanime.com/foros-de-anime/sobrenatural-107/algunos-misterios-de-ciencia-8107.html].

Un saludo a tod@s

...y, aunque no tenga 5000 palabras, ¿algun@ se atreve a calcular esto mismo para este post o cualquiera de los anteriores, que no sea uno de los dos mini posts? ;-) Podría meterlo en el concurso…no debe ser tan difícil con el contador de palabras del Office ¿no?

5 comentarios:

Jose Ig dijo...

Hola

Aquí tienes los datos del texto.
No he tenido en cuenta aquello caracteres que no son palabras propiamente dichas: los números con decimales, la fórmula, el enlace, etc.

El texto tiene 1020 palabras.
La media de nº de letras de las palabras es 4,685.
La palabra más larga tiene 15 letras ("estadounidenses").

Las 20 más usadas son (entre paréntesis el nº de veces):

de (60)
el (41)
un (32)
que (31)
en (30)
la (27)
y (27)
a (24)
más (20)
se (16)
palabras (15)
es (14)
una (14)
número (12)
palabra (12)
por (12)
texto (11)
su (10)
con (9)
del (8)

A mandar.

JoseIg

Anónimo dijo...

...de todas formas:

"no puede haber más árboles que ramas"

los idiomas se agrupan en muy pocas familias. Los alfabetos (que no las escrituras) derivan todos de uno solo, el alfabeto protosinaítico...

Un mundo ininteligible sería un mundo cuyas realidades no comparten nada de sus respectivas historias ("más árboles que ramas")

Saludos
Mayéutica

Rupit (Ricardo Texidó) / Pruit (Núria Tabares) dijo...

ley de Zipf: me ha encantado, la desconocía y le veo mucha aplicación para un escritor que no quiere poner limites. Todo un reto hacer la excepción a la ley de zipf!!!

Pruit

Anónimo dijo...

Sin aplicar leyes matemáticas: tus post siempre tienen un rango muy alto de interés y profundidad.
Me gusta cómo siempre buscas nuevos caminos para seguir reflexionando acerca del lenguaje, nuevas preguntas,relexiones, más misterios...
Por cierto, cuando ví en la ilustración del post esas plantas, pensé,¿ más quién-es-quién botánico? pero no! Conseguiste sorprenderme, como siempre.
Busqué algo de información sobre esas plantas del manuscrito, parece que la mayoría eran falsas: "Frankenplantas".Más misterio... o más cachondeíto por parte del creador del manuscrito.

Muchos besos de Ana de Madrizzz

Vivir es una casualidad dijo...

Gracias a l@s incondicionales que me seguís leyendo y otro especial para aquellos que además comentais...GRACIAS SINCERAS PARA TOD@S VOSOTR@S, de corazón.

- Jose Ig eres increíble....si alguien tenía que ponerse a hacer ese análisis, ese eras tú, sin duda :-) Espectacular análisis....y frecuentes resultados que hacen aún más fuerte la Ley de Zipf.
Un beso enorme

- Mayéutica, muy "Wagensbergiano" tu comentario y, precisamente por ello, mágico ;-)
De hecho, si hacemos caso de los antropólogos y genetistas, el lenguaje apareció en el momento de la especiación hace entre 100.000 y 200.000 años, en Africa...o puede que en el Próximo Oriente.
Un besazo

- Me alegra que te haya gustado, Pruit :-) y es un reto buscar la excepción a la Ley, en efecto, pero recuerda que el que una Ley tenga una excepción...anula la Ley en si misma jeje.
Un besote

- Gracias Ana de Madrid...me encanta haberte sorprendido (me gusta jugar con los títulos de mis posts, dicho sea) y me estimula sobremanera que algo que cuelgue en un post estimule a quién lo lee para buscar más información...es el método socrático aplicado en la era moderna...apasionante que pase eso :-)
Un beso...lo leas desde dónde sea que esteis :-)