media

1 Star2 Stars3 Stars4 Stars5 Stars
Loading ... Loading ...
Escrito por Alex como 100cia, Sabías que el 14 de enero de 2008 a las 7:00 pm

Cómo hacer una buena media en un sistema de votaciones: media bayesiana

He tenido que lidiar con muchos sistemas de votaciones a lo largo de mi vida como programador y siempre me he dado cuenta de un problema: los elementos que tienen pocos votos con mucha puntuación. Pondré un ejemplo para ilustrarlo mejor. Imaginemos que tenemos 2 elementos que pueden recibir votos:

  • El primer de ellos recibe 10 votos, a saber: 9.4, 9.1, 9.9, 7.5, 8.2, 8.6, 9.1, 9.3, 6.5 y 8.3
  • El segundo de ellos recibe 2 votos, a saber: 10.0 y 9.8

La media aritmética, que es el sistema de votaciones que se usa en casi todos los sistemas de votaciones en páginas web, que es aquella que divide la suma de las votaciones entre el número de votos, daría un 8.59 para el primer elemento, y un 9.9 para el segundo elemento. Al realizar la típica lista "Top10″, pondría al segundo elemento en primer puesto, ya que tiene una media aritmética mayor, pero no es lógico o justo para el primer elemento, que ha recibido muchos más votos, por tanto dispone de un universo de votaciones mucho más rico y leal a la nota que realmente tenga.

Para este tipo de casos y poder realizar una media más justa existe una solución basada en la media bayesiana. En muchos sistemas de votaciones en los que hace falta conocer, de la manera más fiel posible un ranking, uno de los elementos puede estar "viciado" por los pocos votos recibidos de mucha puntuación, como hemos visto en el segundo elemento del ejemplo. La media bayesiana es una técnica usada para reducir el ruido por estos elementos con tan pocas votaciones. De hecho, cuantos menos votos recibe un elemento, el resultado bayesiano más se acerca a la media global de todos ellos.

La fórmula es la siguiente:

Media = (v / (v+m)) × R + (m / (v+m)) × C

donde:

  • R = media aritmética de un elemento
  • v = número de votos de un elemento
  • m = mínimo número de votos requeridos para ser listado
  • C = la media de todos los votos de todos los elementos

De esta forma se equilibran mucho mejor los pesos y la influencia de cada elemento respecto a los demás. El primer sumando (V/(V+M)) R indica el peso dado a la media propia, mientras que el segundo sumando (M/(V+M))*C es el peso dado a la media general. Si se obtienen muchos votos de un elemento, pesa más la propia media de ese elemento que la general, y viceversa, si tienes muy pocos votos, pesa más la media general. Otra forma de explicarlo es que, cuantos más votos tiene un elemento, menos deriva o se modifica el resultado bayesiano de la media aritmética de ese elemento.

Veamos un ejemplo con una tabla de datos real (con m = 50):

Elemento Media de votos (r) Votos recibidos (v) Media total (c) Media Bayesiana
2531 6.01 6700 5.33 6.007
1727 7.66 535 5.33 7.460
2135 7.57 367 5.33 7.300
1543 7.76 298 5.33 7.406
1633 4.18 262 5.33 4.360
1671 4.97 231 5.33 5.033
1462 4.55 209 5.33 4.700
2100 5.47 193 5.33 5.437
2309 7.01 180 5.33 6.645
2333 6.91 169 5.33 6.549
1691 6.14 158 5.33 5.944
2636 8.75 150 5.33 7.896
1882 6.94 144 5.33 6.522
2903 8.30 139 5.33 7.515
542 4.84 134 5.33 4.974
3810 9.03 128 5.33 7.990
1502 6.61 122 5.33 6.240
1903 7.06 117 5.33 6.541
2460 7.26 112 5.33 6.662
1074 5.90 105 5.33 5.711
2148 6.82 101 5.33 6.326
1576 5.85 96 5.33 5.673
1944 6.89 92 5.33 6.340
2303 6.77 87 5.33 6.243
1771 7.01 81 5.33 6.368
2459 5.77 74 5.33 5.591
618 5.07 69 5.33 5.179
2328 5.11 61 5.33 5.210
709 5.81 54 5.33 5.580
556 4.71 49 5.33 5.023
15 3.60 43 5.33 4.530
1170 3.62 37 5.33 4.601
1452 6.64 33 5.33 5.847
2656 9.52 29 5.33 6.864
2682 8.12 26 5.33 6.280
1437 6.39 23 5.33 5.661
1360 6.29 21 5.33 5.609
750 7.37 19 5.33 5.888
1999 6.94 18 5.33 5.754
2690 9.12 17 5.33 6.288
1231 5.73 15 5.33 5.420
1182 5.07 14 5.33 5.270
1345 7.31 13 5.33 5.734
961 6.50 12 5.33 5.553
2901 9.33 12 5.33 6.101
658 3.45 11 5.33 4.988
177 6.30 10 5.33 5.488
909 6.78 9 5.33 5.547
572 4.56 9 5.33 5.208
1244 6.00 8 5.33 5.418
2859 9.25 8 5.33 5.867
316 7.29 7 5.33 5.566
957 7.67 6 5.33 5.576
574 5.00 6 5.33 5.291
1009 7.80 5 5.33 5.550
652 4.20 5 5.33 5.223
1214 4.00 4 5.33 5.227
2939 9.50 4 5.33 5.635
837 8.67 3 5.33 5.515
2938 4.33 3 5.33 5.269
3132 6.00 3 5.33 5.364
348 6.50 2 5.33 5.371
3077 7.50 2 5.33 5.409
3413 5.50 2 5.33 5.332
197 7.00 1 5.33 5.358

NOTA: He tomado un valor de m = 50, por poner un ejemplo, pero se puede variar esta constante para maximizar o minimizar la influencia del número de votos de los elementos. Es bueno jugar con una m baja al principio e ir ajustando hasta encontrar un valor lo más aproximada al sentido común, y suele ser en torno al 1% del número de votos recibido por el elemento que más votos haya conseguido.

En la primera columna aparece el identificador numérico del elemento (he cogido estos datos de un sistema de más de 4000 elementos donde todos reciben votaciones, la imagen del día de Observatorio.info).

En la segunda aparece r, la media de votos aritmética de ese elemento, es decir, la suma de todas las puntuaciones que ha recibido ese elemento dividido entre el número de votos que ha recibido dicho elemento.

En la tercera columna v, que es simplemente los votos que ha recibido dicho elemento.

En la cuarta vemos c, que es la media global de todos los elementos del conjunto, es decir, la suma de todas las votaciones de todos ellos, dividido por el número de votos que han recibido todos los elementos.

Y en la quinta por fín, el resultado de la media bayesiana.

Como se puede apreciar y como se comentaba, cuantos más votos tiene un elemento (la tabla está ordenada así en descenso), menos se altera su media aritmética original, y mientras menos tiene, el resultado bayesiano modifica su valor acercándose más a la media global del conjunto.

Veamos un ejemplo de esta tabla que ilustra muy bien este sistema y su "justicia":

  • El elemento 2309, tiene una media aritmética normal de 7.01, conseguida con 180 votos.
  • El elemento 1771, también tiene una media aritmética de 7.01, pero sólo fueron 81 personas las que votaron.

En cambio, el primero de ellos, con la fórmula bayesiana obtiene un resultado de 6.645, mucho más justo y fiel ya que se ha formado con un mayor número de personas que fueron las que votaron, mientras que el segundo obtiene un resultado bayesiano de tan sólo 6.368, habiéndose variado más y acercándose más a la media global, por el poco peso que tiene los más de la mitad de los votos que recibió respecto al primero.

Todo esto se inició mientras que veía un ranking de cartelera, en donde, tras votar una película que no tenía ningún voto (porque fui el primero en votarla) con una puntuación de 9, se trasladó a ser "la mejor película votada por los usuarios", cuando en realidad, otras con muchas más votaciones estaban en puestos inferiores. Esta es la solución con la que he trabajado estos días para crear un sistema de votaciones mucho más justo para mi web de Observatorio y poder formar un ranking más acorde a la realidad. Espero haberme explicado bien y a partir de ahora, ya sabéis como hacer un sistema de votaciones con ranking algo más justo.

Más información en la Wikipedia: Media Bayesiana y en este documento

, , , , ,

RelacionadasTodos a pagar en el 2010Cuidado en la F1Video raroChiki Chiki a por Eurovisión
1 Star2 Stars3 Stars4 Stars5 Stars
Loading ... Loading ...
Escrito por Alex como Gadgets, Increibles, Noticiero el 28 de septiembre de 2007 a las 7:26 pm

Usa el mundo entero real para jugar a tus juegos virtuales

Estaba claro que esto tenía que pasar algún día. Al menos no es un fake como lo fue el intento de difusión del video de la Nintendo rara, que aunque falsa, prometía lo que la tecnología nos podía deparar en un futuro.

Ahora el futuro está aquí. Me entero a través de Xataka de la tecnología Mscape de HP, que ya es corroborado no es irreal, no es un bulo de Internet… es real. Como dicen en Xataka, la mejor manera de entenderlo es el video. Obviamente, el final del mismo es ya pasarse, estaría genial que ocurriera pero me temo que con un "Congratulations!" nos daremos por satisfechos.

Y ahora en serio… ¿no os parece la mejor forma de jugar? Desde aquí lo digo, que, aunque tenga 40 años cuando la saquen, me veréis por la calle jugando con eso. Lo que no han tenido en cuenta son las obras que no aparecen en los GPS, y por ejemplo, aquí en Zaragoza, (o en Madrid) seguro que los jugadores acababan todos en zanjas no marcadas en el mapa, jejeje. Luego vendrán las demandas tontas contra HP que seguro que, al ser el campo de juego tan incontrolable, pondrá unos términos de uso y servicio de su consola que seguro supera en páginas a la Biblia :)

En fin, disfrutemos en video de su demostración y guardaros baba para seguir babeando porque al menos 5 años tardará en llegar a las tiendas…

MScape Game Demo: Roku's Reward –
, , , , ,

RelacionadasPacMan más pequeño del mundoJuegos de Nintendo de 8bits onlineJuegos de 4 segundosVirtuSphere
1 Star2 Stars3 Stars4 Stars5 Stars
Loading ... Loading ...
Escrito por Alex como 100cia, Como la vida misma el 30 de enero de 2007 a las 12:10 am

La media aritmética hay que saber usarla

Cuántas veces he oido este tipo de conversaciones:

- (Nota de prensa) "Este año los españoles nos hemos gastado una media de 20 € en lotería por persona"
- ¡Ah! pues entonces si yo no me he gastado nada, quiere decir que alguien se ha gastado 40 €

La media aritmética o promedio, de una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. Es uno de los principales estadísticos muestrales.

Veamos hasta que punto puede ser cierta esta frase. Vamos a poner un ejemplo muy pequeño con ese ejemplo de la lotería para que podamos comprenderlo. Vamos a suponer que somos sólo 10 españoles (porque si lo hacemos al principio con 40 millones nos podemos volver un poco locos).

Está claro que si cada una de las 10 personas se gasta 20 € eso da un total de 200 euros. Para sacar la media aritmética simplemente se divide el total por el número de elementos, y efectivamente da una media de 20 €/persona.

Ahora bien, supongamos que una de ellas (por ejemplo yo, que en verdad no me gasté ni un duro en la lotería de Navidad de este año, y luego para colmo me quejo de que no me toca) no se gasta ni un euro. Popularmente con la frase tan dicha que he comentado al principio la solución sería la siguiente:

caso 1) Si yo no me he gastado nada, y otra persona se ha gastado 40 euros, el resto de las 8 personas son las que se han gastado 20 € de media

Pero lo más lógico no es eso, sino que el sobrante que yo no me he gastado se ha de repartir entre el resto de personas del grupo:

caso 2) por tanto, si yo no me he gastado nada, el resto de las 9 personas se han tenido que gastar 200 €, con lo que sale a una media de 200/9 = 22.22 €

De aquí se puede ir deduciendo efectivamente que, además de mi que no me he gastado nada, cuantas cuántas más personas se hayan acercado a la media aritmética del grupo que falte por contabilizar, quedará alguien al final que haya realmente gastado 40 euros.

Pero estadísticamente hablando (plasmándolo en una gráfica) siempre se dan curvas muy poco pronunciadas y simétricas en estos casos, es decir, que si hay casos como en la Lotería de gente que no se gasta nada de dinero, lo normal no es que en la otra punta se genere exáctamente lo contrario sino que como he explicado, el grupo de personas restantes van "asimilando" dicho defecto aumentando simple y ligeramente la media aritmética.

Espero haberme explicado con claridad, aunque seguro que hay fórmulas matemáticas para todo esto, sólo que yo dejé el Algebra en C.O.U. y no me acuerdo de nada ;)

, , ,

RelacionadasTodos a pagar en el 2010La fiebre de la loteríaCambio de la página de la RAEUna ciudad desierta
1 Star2 Stars3 Stars4 Stars5 Stars
Loading ... Loading ...
Escrito por Alex como 100cia, Como la vida misma, Las Listas, Sabías que el 19 de enero de 2007 a las 12:55 am

Coeficiente Inteligencia (IQ)

El cociente intelectual, abreviado CI (en inglés IQ) es un número que resulta de la realización de un test estandarizado para medir las habilidades cognitivas de una persona, "inteligencia", en relación con su grupo de edad.

Se expresa de forma normalizada para que el CI medio en un grupo de edad sea 100 – es decir, una persona con un CI de 110 está por encima de la media entre las personas de su edad. Lo más normal es que la desviación estándar (σ) de los resultados sea de 15 o 16, y los tests se diseñan de tal forma que la distribución de los resultados sea aproximadamente la distribución normal o gaussiana, es decir, que siguen la curva normal.

El Cociente Intelectual se le llama Coeficiente Intelectual cuando se le multiplica por la media. (Edad Mental / Edad Corpórea)x 100 = Coeficiente Intelectual.

Aun así, con esta definición, algunos expertos comentan que 100 no es precisamente la media y que ha ido creciendo últimamente. Hmmm, para eso tenemos este mapa que me he encontrado en la Wikipedia que nos dice la media de IQ en el mundo por países.

Voy a hacer un análisis totalmente personal sobre el gráfico porque creo que es interesante las formas y zonas que han salido en dicho mapa:

Tenemos en primer lugar a Australia y Botswana (en África) donde la media de IQ es de 60, increiblemente baja y desconozco cual puede ser el origen.

Luego, curiosamente toda el continente africano central y del hemisferio Sur también disponen de un IQ bajo, alrededor de 70, pero todos juntos.

El siguiente grupo se centra (también curiosamente) en todo el continente americano y el ecuador del mapa que disponen un ligero IQ inferior a la media teórica. Me parece remarcable la zona horizontal de este grupo y cómo se extiende en el mapa.

Luego, Europa y Rusia obtienen un IQ medio, y la inteligencia se centra principalmente en China, donde la media supera al resto del mundo.

Me sigue pareciendo sorprendente lo bien marcado que están las zonas medias de IQ en el mundo, y la únicas razones que se me ocurren son en menor medida el clima y por supuesto (debido a lo bien delimitadas que están las zonas) la condición social y desarrollo de los países, aunque en ésta última característica se iría de la norma China.

Mucho que pensar da este mapa de todas formas…

, , , ,

RelacionadasLa memoria fotográfica más impresionanteExperimento con metal líquidoYo era un CERDO GORDONo pulses el botón rojo
Artículo aleatorio Artículo aleatorio
Busca en 86400:
Artículo aleatorio

Te invito a otros blogs ...