[“Mi actividad principal consiste en tomar el pelo a aquellos que se toman a sí mismos y a la calidad de su conocimiento demasiado en serio” (Nassim Nicholas Taleb)]
Efecto Joule-Thomson o Joule-Kelvin: La temperatura de un gas desciende si se somete a un descenso de presión. Este descenso de presión puede conseguirse, entre otras muchas formas, haciendo pasar el gas a través de una abertura estrecha.
Coloquemos ahora la mano a 5 centímetros frente a la boca. Ahora coged aire. Empezad a echar el aire sobre la mano, primero con la boca muy abierta, e id cerrando poco a poco los labios hasta terminar formando con ellos un estrecho orificio. El aliento está caliente pero el soplido está frío. Al hacer pasar el aliento (inicialmente a temperatura corporal) a través de una abertura estrecha sufre una compresión y descompresión que provocan el descenso de su temperatura. Así funciona el aire acondicionado. [Sacado de CPI]
Todo esto para hablar del tema del post de hoy: La ley de Zipf – lingüista y filólogo de EEUU. Transcribo aquí un texto de Wagensberg – como no :-) – ampliado. Me gustó su propuesta y busqué más información sobre el tema.
Zipf aplicó el análisis estadístico al estudio de diferentes lenguas. Su Ley dice: “Un pequeño número de palabras son utilizadas con mucha frecuencia, mientras que frecuentemente ocurre que un gran número de palabras son poco empleadas”. Se toma un texto con un gran número de palabras – mayor de 5000 – y se calcula cuantas veces aparece cada palabra. Se ordena la tabla de palabras de más a menos frecuente. El orden en que aparece cada palabra en esta lista ordenada se llama “rango”. En textos en inglés la palabra más frecuente suele ser “the” y por ello su rango es 1. En castellano las palabras más comunes son también los artículos y proposiciones, mientras que palabras como “lingüística” son muy poco frecuentes y tendrán (si aparecen en el texto citado) un rango muy alto. La ley de Zipf dice, en términos matemáticos, que el número Y de veces que aparece una palabra es inversamente proporcional a su rango X de forma que Pn= 1/ n elevado a "a".
Y esto se cumple seas un escritor con un lenguaje más amplio o seas un escritor con un lenguaje más pobre. No puedes evitar, aunque manejes un vocabulario rico, utilizar las palabras más frecuentes.
Otro estudio estadístico en relación a esta Ley y al lenguaje establece que, al principio, el vocabulario crece bastante, pero a medida que el texto se va haciendo mayor, habrá un menor número de palabras nuevas y por tanto el crecimiento del vocabulario será menor.
Otra forma de calcular la Ley de Zipf es, contar cuantas veces aparece una palabra, y dividirla entre el número total de palabras del texto. Luego, según ese rango, se aplica la Ley…y, por una razón parecida, hay más insectos que mamíferos, más ratones que perros, más perros que caballos, más caballos que ballenas, más arbustos que arboles, más pinos que secuoyas…A igual cantidad de recursos, es la distribución más económica…Lo más frecuente es más corto sino sería un auténtico derroche de tinta y papel, de saliva y teléfono.
Y una reflexión siempre deja preguntas flotando a su alrededor. Por ejemplo, ¿cuál es la longitud media de una palabra en un texto? El cálculo es sencillo: medimos el número de palabras y el número de letras. Dividiendo el primer número por el segundo, sabremos el número de letras por palabra. La respuesta para este libro concreto – dice Wagensberg en relación a su libro “El gozo intelectual” – es de 4.93 letras por palabra. ¿Es esta cifra homogénea a lo largo del libro? Curiosamente la primera parte – la teoría – tiene un valor de 5.03, y la 2ª parte – la práctica – lo tiene de 4,89. Es decir, este número depende de la clase de texto. Un texto de ensayo utiliza palabras, en principio, más improbables que un texto narrativo. Y una palabra es tanto más larga cuanto mayor sea su improbabilidad. Por lo tanto: la longitud media de las palabras debería ser mayor en un párrafo filosófico que en un párrafo narrativo. En este libro - sigue razonando Wagensberg - una medida de este índice da 4,60 letras por palabra, en un párrafo de una historia, mientras que da una media de 5,10 letras por palabra en un párrafo de una reflexión.
¿Servirá este número como índice perverso para medir el grado filosófico de un cuentista, o el grado de cuentista de un filósofo?
¿Permanece estable el índice para cualquier texto mínimamente extenso, mientras no varíe ni el género literario ni el idioma?
Si es así ¿tiene cada idioma una característica longitud media de palabra?
Un ejemplo práctico que aplica esta Ley: ¿Conoceis el manuscrito Voynich (el de la foto que encabeza este post)? Este es el nombre que recibe un misterioso libro escrito hace unos 500 años por un autor de identidad desconocida que utilizó un lenguaje y un alfabeto de igual manera desconocidos, incluso en la actualidad. A través del tiempo se han realizado numerosos estudios intentando entender el lenguaje en el que está escrito y así revelar su contenido, pero todos los intentos han fallado, incluso cuando fue estudiado por expertos en criptografía británicos y estadounidenses de la segunda guerra mundial. Esto ha llevado a muchos a sospechar que el manuscrito simplemente podría tratarse de algún engaño y que realmente solo se trata de símbolos al azar y sin sentido. Pero hay un argumento fuerte contra esta posibilidad y es el hecho de que los manuscritos cumplen con la llamada ley de Zipf, que dice que, en todos los lenguajes conocidos, las palabras que más se repiten son las más cortas...lo que se cumple con el texto en el manuscrito perfectamente...y no en otros lenguajes "artificiales" creados en la modernidad. El manuscrito permanece actualmente en la Universidad de Yale, esperando que se revelen sus secretos [Sacado del comentario colgado por Nightingale en el foro de http://foroanime.com/foros-de-anime/sobrenatural-107/algunos-misterios-de-ciencia-8107.html].
Un saludo a tod@s
...y, aunque no tenga 5000 palabras, ¿algun@ se atreve a calcular esto mismo para este post o cualquiera de los anteriores, que no sea uno de los dos mini posts? ;-) Podría meterlo en el concurso…no debe ser tan difícil con el contador de palabras del Office ¿no?