a – 11,96%
b – 0,92%
c – 2,92%
d – 6,87%
e – 16,78%
f – 0,52%
g – 0,73%
h – 0,89%
i – 4,15%
j – 0,30%
k – 0,00%
l – 8,37%
m – 2,12%
n – 7,01%
ñ – 0,29%
o – 8,69%
p – 2,77%
q – 1,53%
r – 4,94%
s – 7,88%
t – 3,31%
u – 4,80%
v – 0,39%
w – 0,00%
x – 0,06%
y – 1,54%
z – 0,15%
Así que si cogemos cualquier escrito, lo suficientemente largo, y en términos estadísticos, podemos ver algunas cosas como:
- Aunque pueda parecer que sea la "a", la letra más usada en el castellano es la "e"
- Sólo la "a" y la "e" juntas se usan en más de un tercio
- Todas las vocales casi resultan ser la mitad de todas las letras usadas (no pasa en todos los idiomas esto)
- La "ñ" se usa mucho más que la "z" y casi tanto como la "j"
- Letras tan "famosas" como la "f" apenas llegan al 0,5% de su uso
- La "y" tiene un alto porcentaje más por su uso de conjunción copulativa que por estar en palabras
- De la misma forma, la "s" (sin contar los plurales) tiene un elevadísimo uso rozando el 8%
- La "w" prácticamente es nula en nuestra idioma, casi como la "k" o la "x"
- La "l" dispone de un porcentaje alto gracias a los artículos
Otro día haré lo mismo con el inglés, el polaco o el euskera (por ejemplo) para ver como varían estos porcentajes.