jueves, mayo 31, 2007

Terminando...

A unos pocos días de acabar ya empiezo a tener algunos proyectos en mente pero por el momento lo único que puedo decir es que volveré dentro de poco y con algunas sorpresillas que espero que os gusten a más de uno ;)

Ya os contaré...

Mientras tanto, os dejo sabiendo que la Justicia estadounidense arrestó a un empresario responsable de enviar tal cantidad de correos electrónicos basura que fue calificado por los investigadores como el "rey del spam". Robert Soloway, de 27 años, fue arrestado en Seattle, Washington, una semana después de haber sido acusado por un gran jurado federal de robo de identidad, lavado de dinero y fraude postal y electrónico. Si es hallado culpable, deberá purgar más de 65 años de prisión.

Esperemos que repercuta en miedo para los demás spammers y poco a poco entre filtros y denuncias se acaben estas prácticas.

FUENTE: http://www.perfil.com/contenidos/2007/05/30/noticia_0097.html

lunes, mayo 07, 2007

Variables de programación

Elemento de la programación que almacena datos.

Suele tener un nombre que mola, como:
  • double con_queso;
  • double dragon;
  • int electual;
  • int pepe;
  • int errupcion;
  • int ifada; /* se usa mucho en Israel y Palestina */
  • char cutero;
  • char mander;
  • String sadguibasduiga;
  • String gente;
  • int nicar; for (nicar = 0; nicar <>
  • bool eria; bool eriiia;
  • long aniza;
  • bool taco;
  • FileInputOutputObjectStreamDeLaMuerteYVivaJavaYLaMadreQueLoParioException f;
  • float ador;
  • Bool cà (en catalan)
  • Long Horn (a partir de ahora Vista)
  • Long rabo

FUENTE: Revistes UPC

sábado, mayo 05, 2007

Cómo Google rastrea un blog instantáneamente

Hace algunos años cada página se actualizaba en los servidores de Google cada varios días si tenías suerte, y, también, dependiendo mucho del PR e importancia de tu sitio.
Otros factores era y son tenidos en cuenta, como la frecuencia de actualización, pero Google es consciente de que, cada vez más, la frecuencia de actualización es crucial para mantener un buscador actualizado y sobre todo para las noticias, pues aún existiendo Google News la mayoría de la gente sigue buscando en el buscador principal.
Sabiéndolo la estrategia cambia a extrapolar todo al buscador principal, y tener los otros buscadores como buscadores temáticos más específicos.
Así, si buscamos imágenes cristianas (búsqueda sugerida por Google) vemos como Google nos enseña parte de la búsqueda de imágenes cristianas en Google Images:
Lo mismo hace cuando realizamos búsquedas relacionadas con noticias recientes como comentan en SeroundTable, aunque no tan a menudo, sin embargo empieza a hacerlo más y más, y no sólo de esos servicios, pues se prevée que se haga lo mismo con Google Base (para vender productos, competidor de Google contra eBay).

Pero lo que no hacía hasta por lo menos hace bien poco es realizar actualizaciones casi instantáneas. En esta imagen de Dirson podemos ver como una web se actualiza en indexa en el buscador en menos de dos horas, pero ayer me pasó algo curioso en mi blog.

Debido a mi despite, posteé en el blog equivocado (este) en vez de en el que debía, así que nada más postear, borré el post. Sin embargo, hoy, por curiosidad, reviso la caché de mi página y cual es mi sorpresa que la caché correspondía (y ahora mismo todavía corresponde) con la copia de la página con la noticia equivocada que apenas estuvo on-line un minuto. Sin embargo, Google ya la había rastreado antes de que tuviera tiempo de borrarla. Aun así, la indexación y paso al buscador tardó algo menos de un día, pero algunas horas.
Segúramente sea debido a que rastrear un post debido a los feed les es mucho más rápido, o tal vez porque sea de blogger, aunque no creo que sea la razón.

Poco a poco vemos como Google, no sólo con el buscador de blogs, empieza a buscar que la información sea la más fresca posible.

jueves, mayo 03, 2007

Sistema OCR gratuito con Gmail

Gmail nos ofrece un servicio indirecto de OCR (Reconocimiento óptico de carácteres, de una imagen nos da los carácteres que incluye) a través de las imágenes de los archivos adjuntos. Para ello hay que hacer lo siguiente:

  • Enviamos en Gmail un documento pdf con imágenes a nosotros mismos. Al recibirlo elegimos ver como HTML (view as HTML):
  • Y ya esta, nos mostrará sólo el texto ya procesado. Visto que son sólo imágenes, Google utilizará su sistema OCR para reconocérnoslo:
  • Y aquí podemos ver la imagen que contenía el documento pdf original:
Interesante, ¿no?

El sistema no es perfecto, pero funciona bastante bien. En este ejemplo como podemos ver sólo se equivoca en el DE que lo reconoce como OE. Incluso detecta tipos de letra, negrita, cursiva, tamaños, etc.

Hay que recordar que Google ofrece gratuitamente como software libre Ocropus, software que segúramente utilizará internamente para realizar el reconocimiento y se presupone que utiliza para el reconocimiento OCR de Google Books.
Este software sólo soporta Linux, así que si quieres probarlo pásate a Linux ;-)

miércoles, mayo 02, 2007

Difunde este número. Crackea el sistema HD-DVD

09 F9 11 02 9D 74 E3 5B D8 41 56 C5 63 56 88 C0. ¿Quieres saber qué es este número y por qué es tan importante?

Es nada más y nada menos que la clave hexadecimal que se usa para reproducir las películas de alta definición en linux y en ordenadores sin HDCP (HD-DVD), es decir, para crackear el sistema. Gracias a esto, aunque este número se revoque (pues según el consorcio que soporta este estándar tienen la posibilidad de revocar claves de reproducción para que no sean válidas anymore) se podrán ver películas en linux y usar programas como BackupHDDVD para grabar estas películas e incluso quitarles los fastidiosos avisos legales que tienes que tragarte obligatoriamente, es decir, mejorar las películas originales.

Ahora los responsables de este sistema (AACS) están enviando amenazas legales a todas las páginas y blogs que tienen este número incluido a Google, pero hace meses que salió una sentencia a favor de DeCSS (programa con usos similares para DVD) que se desestimó todo por falta de argumentos legales.

Así que difunde este número.

martes, mayo 01, 2007

Mucho que decir

Empieza la recta final, apenas un mes y todo se acaba...
Todos desean que llegue el verano...

Tiempo no es lo que me sobra precísamente ahora, pero intentaré que el blog no parezca muerto.

En fin, mucho que pensar, poco que decir.