86400 – Blog de viajes

Heraldo.es saca versión nueva de su web con un RSS incompatible

¿Te gusta el artículo? ¡Valóralo!

0 media basada en 0 votos

  • Excelente
    0
  • Muy bueno
    0
  • Normal
    0
  • Regular
    0
  • Malete
    0
El Heraldo de Aragón, principal periódico de Aragón, cambió recientemente el pasado 8 de enero su página Web a un estilo "más 2.0", aunque a muchos les parezca una burla copia de 20minutos mal hecha por las deficiencias que tiene como periódico online.

La blogosfera aragonesa no tardó en hacerle crítica sobre todo en un punto clave en un periódico online de hoy en día: el sistema RSS para poder sindicar contenidos.

Nada más y nada menos que 48 horas después de que varios blogs comentaran este grave defecto, el Heraldo colocó un RSS en su página Web. De qué forma lo colocó que nadie se dio mucha cuenta si no dispones de un gestor de RSS que lee etiquetas del código fuente. Me explico. Mientras que otras páginas utilizan enormes y preciosos botones con el logotipo estandar del RSS para comunicar la posibilidad de la sindicación de contenidos, el Heraldo simplemente añadió la linea en su código fuente para que, sólo con lectores que leen automáticamente estas líneas, puedan saber si existe o no RSS en una página Web:

<link rel="alternate" type="application/rss+xml" title="RSS" href="/index.php/mod.portadas/mem.rss" />

Pero el error no llega hasta ese punto, sino que el RSS que "tan rápido que parece colocaron" le falta una línea muy importante, la del encoding o codificación de caracteres. Debido a la gran variedad lingüistica del ser humano, la informática ha tenido que crear diferentes codificaciones para los textos que se muestran en las páginas. Existe ISO-8559-1, UTF-8, … y un sin fin de ellas. Si algún programador está leyendo esto, sabrá los quebraderos de cabeza que conlleva la creación de una compatibilidad cuando se manejan diferentes codificaciones o contenidos entre bases de datos, XML's, etc…

Todos los XML llevan generalmente una línea que identifica esta codificación de caracteres, pero la del Heraldo no la lleva. Todo esto me di cuenta cuando probé a usar con típicas librerías de PHP el RSS del Heraldo, y saltaba un error como que existían caracteres inválidos.

Lo probé con Netvibes, una de las herramientas de páginas de inicio más usadas, y el error era claro: por problemas de dicha codificación y de que no está fijada en el código fuente del RSS, el propio Netvibes leía mal las noticias y se cortaban los textos de los títulos cuando encontraba un acento o "ñ", así como que éstos no se veían en el texto de la noticia:

Otros lectores como Google o el propio Firefox, son algo más bestias y si que consiguen leerlo, pero el propio Internet Explorer directamente no carga la página.

Con un validador de Feed (RSS) estandar, vemos la cantidad de errores que tiene el RSS del Heraldo, y todo debido a este problema de codificación. Todo esto se podría solucionar añadiendo simplemente al principio del RSS (esto va para el programador del Heraldo):

<?xml version="1.0″ encoding="ISO-8859-1″ ?>
(o la codificación que se quiera…)

No me he metido en profundidad a ver la nueva Web (a nivel analítico como programador), pero

es signo de que han salido con demasiadas prisas, y ciertamente, es un periódico con suficiente importancia para estos fallos que he podido ver en apenas 5 minutos. Ya digo que no me he metido a fondo a investigar posibles SQL Inyections, Cross-site scripting y otros problemas que me huelo por un primer vistazo que pueden tener, aunque prefiero no insinuar nada todavía.

A ver si por lo menos, el programador del RSS del Heraldo ve esto y añade la línea para que (estimo) la mitad de los lectores de RSS puedan ver bien las noticias.

[tags]heraldo, rss, sindicación, encoding, utf-8, codificación, caracteres[/tags]
Salir de la versión móvil