Metáfora: Funcionamiento de los spiders de los buscadores

Juanjo 1 de Enero de 2008

Los buscadores disponen de programas que rastrean Internet en busca de nuevas páginas para indexarlas. Estos programas son conocidos como robots rastreadores o arañas (spiders) que se mueven por la red de Internet (World Wide Web, o Gran Telaraña Mundial literalmente).

En el libro “Search Engine Optimization – An hour a day” de Jennifer Grappone y Gradiva Couzin, aparece la siguiente metáfora sobre el funcionamiento de dichos robots:

Los robots o spiders de los buscadores son como hormigas exploradoras que dejan la colonia con un único pensamiento en su mente: encontrar comida. En este caso la comida es texto HTML, preferiblemente en grandes cantidades, y para encontrarlo estas hormigas necesitan avanzar de forma fácil, a través de caminos libres de obstáculos: los enlaces HTML. Siguiendo esos caminos, las hormigas, con su único instinto de insecto, llevan la comida (texto HTML) hasta su colonia y la almacenan en el hormiguero (la base de datos del buscador). Así, miles y miles de pequeñas hormigas exploran y almacenan información a lo largo de todo Internet. Sin embargo, si el camino esta roto o bloqueado, las hormigas se darán por vencido y se irán a otro lugar. Igualmente si llegan a un sitio donde no hay comida (webs sin contenido), regresarán sin traer nada.

Metáfora: Robots rastreadores como hormigas

Cuando desde la web de un buscador se realiza una petición de búsqueda, se procesa la información almacenada en las bases de datos (la comida guardada en el hormiguero) y se devuelven los resultados coincidentes ordenados de forma proporcional a su relevancia, según determine el algoritmo de búsqueda y ordenación del que cada buscador dispone.

Borradores “públicos” de WordPress

Juanjo 29 de Diciembre de 2007

Gracias a Telendro me he enterado de un nuevo bug de WordPress que hará las delicias de cotillas y plagiadores puesto que permite ver las entradas privadas, entradas programadas, y borradores de cualquier blog de WordPress.

Es tan fácil como escribir la siguiente URL:
http://dominiodelblog/?x=wp-admin/&paged=xxx donde xxx es el número de la página que se desea ver.

De esta forma solo hay que tener en cuenta que los borradores se almacenan con fecha antigua para buscar la última página del blog y leer todo lo que allí se encuentre. Los blogs que usan un paginador lo ponen aun más fácil ya que a simple vista dan a conocer cual es el número de la última página, sin embargo aun sin conocerla basta un simple tanteo de apenas unos segundos para descubrir cual es ésta.

Existen formas de evitar esto como por ejemplo no tener borradores, o activar la opción de URLs amigables para buscadores. De todas formas ya ha salido, de forma urgente, una actualización de WordPress, la 2.3.2, que corrige este bug además de otros por lo que se recomienda actualizar.

Cómo actualizar Kaspersky sin conexión a Internet

Juanjo 10 de Diciembre de 2007

Este artículo es la respuesta a los comentarios que preguntaban acerca de alternativas para actualizar su producto Kaspersky debido a problemas con el servidor o cómo hacerlo sin tener conexión a Internet en el PC donde está instalado el antivirus. Para estos casos Kaspersky ofrece la alternativa de actualizar las bases de datos de virus y amenazas de ataques a través de redes mediante archivos ZIP de forma offline, es decir, sin conexión a Internet.

Aunque en las guías de usuario para Kaspersky se comenta un poco sobre este tema en el apartado “Selección de un origen de actualizaciones” (en el capítulo “Actualizaciones del programa” de cada guía), en este artículo explicaremos de forma más detallada todos los pasos a seguir y consideraciones necesarias para llevar a cabo la actualización de forma offline.

Los archivos ZIP actualizados, con las bases de datos de virus y amenazas, son colocados con regularidad en la carpeta zips del sitio web oficial de Kaspersky Lab y en sus FTPs:

El primer paso es explicar las diferencias entre los distintos archivos de actualización que podemos encontrar en dicha carpeta, para tener claro cual o cuales de ellos hay que descargar. Estos son:

  • av-i386-daily.zip – contiene las últimas amenazas de virus identificadas desde el último Domingo hasta el momento actual. Kaspersky Lab actualiza a cada hora su base de datos para tener siempre identificadas todas las amenazas y este archivo también es actualizado cada hora.
  • av-i386&ids-daily.zip – igual que el anterior pero además incluye identificación de ataques a través de redes.
  • av-i386-weekly.zip - contiene las amenazas de virus identificadas durante la última semana (de Domingo a Domingo). El archivo es actualizado de forma semanal cada Domingo.
  • av-i386&ids-weekly.zip – igual que el anterior pero además incluye identificación de ataques a través de redes.
  • av-i386-cumul.zip - contiene todas las amenazas de virus identificadas hasta el último Domingo. Es actualizado de forma semanal cada Domingo.
  • av-i386&ids-cumul.zip – igual que el anterior pero además incluye identificación de ataques a través de redes.

NOTA: Las bases de datos de ataques a través de redes son actualizadas tan pronto como un nuevo ataque es detectado.

De esta forma si el producto Kaspersky instalado dispone de Firewall o protección frente a ataques a través de redes es necesario descargar el archivo que contiene las actualizaciones de las bases de datos de amenazas por virus y ataques de redes, sino dispone de dicha protección simplemente hay que descargar el archivo con las actualizaciones de las bases de datos de amenazas por virus.

Igualmente, dependiendo de cuando se realizó la última actualización será necesario descargar unos u otros archivos. Veamos un ejemplo:

  • Si la última actualización se realizó durante la semana actual (después del último Domingo), entonces solo hay que descargar el archivo *daily.zip.
  • Si se realizó la semana pasada, entonces hay que descargar los archivos *weekly.zip y *daily.zip.
  • Si se hizo hace dos semanas o más, entonces hay que descargar los archivos *cumul.zip y *daily.zip.

Una vez que sabemos que archivos o archivos de actualización necesitamos y haberlo/s descargado existen otras sencillas cuestiones que hay que tener en cuenta a la hora de descomprimirlos para extraer su contenido:

  • El archivo *cumul.zip debe descomprimirse en una carpeta aparte (no descomprimir los archivos *weekly.zip y/o *daily.zip en esa misma carpeta)
  • Los archivos *weekly.zip y *daily.zip se pueden descomprimir en la misma carpeta. Si este es el caso, se pueden sobrescribir o reemplazar los archivos con el mismo nombre.
  • No descomprimir archivos con diferente contenido de bases de datos (virus y virus + ataques a través de redes) en la misma carpeta.

Después de descomprimir los archivos simplemente hay que ejecutar la actualización automática de las bases de datos respetando el orden temporal, es decir primero los más antiguos. Esto es:

  • Primero actualizar las bases de datos con el contenido del archivo *cumul.zip (si existe)
  • Después actualizar las bases de datos con el contenido de los archivos *weekly.zip y *daily.zip.
  • Para finalizar veremos como configurar la actualización desde una carpeta local y sin conexión a Internet. Tenemos que ir al menú superior “Configuración” (”Settings”) y luego a “Servicio > Actualizar” (”Service > Update”) en el menú de la parte izquierda. A la derecha aparecerán las opciones de dicho menú y en “Configuración de actualizaciones” (”Update settings”) pulsamos en el botón “Configurar…” (”Configure…”). Ahora aparecerá una nueva ventana: “Configuración: Actualizar” (”Settings: Update”) en la que debemos pulsar sobre la pestaña “Origen de actualizaciones” (”Update source”), seguidamente sobre el botón “Agregar…” (”Add…”), y especificar la carpeta en la que previamente se realizó la descompresión de los archivos de actualización. Para finalizar desactivaremos las actualizaciones desde Internet desmarcando la opción “Servidores de actualización de Kaspersky Lab” (”Kaspersky Lab’s update servers”).

    En la siguiente imagen se pueden observar todos estos últimos pasos realizados para un producto en versión inglesa (opciones entre paréntesis):

    Cómo actualizar Kaspersky sin conexión a Internet

    NOTA: La imagen corresponde a Kaspersky Internet Security, pero los pasos son los mismos para Kaspersky Anti-Virus.

Cuando no tienes el .COM

Juanjo 19 de Noviembre de 2007

El TLD (Top Level Domain o Dominio de Nivel Superior en español) o, dicho de manera más cotidiana, la extensión de dominios de Internet más conocida es sin lugar a dudas el .COM. Y los culpables de esto somos los usuarios. ¿Quien no tiende o ha tendido alguna vez a escribir el nombre del dominio en la barra de navegación de su navegador y colocarle el .COM, dando por hecho que esa es la extensión correcta de la página a la que quiere acceder? Incluso quienes no saben mucho acerca de Internet han oído eso del “punto com” y cuando comienzan a aprender un poco y adentrarse en la red de redes piensan que es el único tipo de dominios existente.

Por esta razón, el típico pensamiento al registrar un nuevo dominio para un proyecto es “Si no puedo registrar un nombre de dominio bajo .COM buscaré otro nombre”. De forma que no se pierda ningún visitante o éste acabe en otra página de la competencia. Incluso de esta manera lo comentan en com.es (de donde cojo el título para esta especie de réplica).

Pero no hay que tomarse las cosas a la ligera ya que esto no siempre es así. Todos los TLDs o extensiones existentes tienes su razón de ser, y su utilidad, a pesar de que esto no se respete demasiado… Veamos los fines con que fueron creados algunos dominios genéricos:

  • .BIZ, para negocios
  • .COM, para fines comerciales
  • .INFO, para información
  • .NET, para infraestructura de red
  • .ORG, para organizaciones

¿Pero si tenemos un buen nombre de dominio pensado que no este disponible como .COM? Pues podemos pensar otro nombre y comprobar si se encuentra libre en dicha extensión, o registrar el primero con una extensión diferente si lo consideramos suficientemente bueno para el proyecto que vayamos a desarrollar.

Por ejemplo, si tenemos un proyecto dirigido a un público local o nacional, es decir, habitantes de un determinado país, entonces una muy buena opción es utilizar el dominio geográfico de dicho país.

Si el proyecto es global entonces es preferible uno de los dominios genéricos anteriormente citados. Y nótese que digo preferible y no obligatorio, para muestra este blog: dirigido a todo aquel que desee leerlo y sin embargo su dominio es .COM.ES

En cuanto a la perdida de visitas hacia el dominio del mismo nombre pero bajo la extensión .COM es algo que depende de muchos factores (si ambos sitios web son de la misma temática, la calidad de ambos, etc.) Dado que si un visitante que llega al sitio equivocado no encuentra lo que busca se irá de allí y buscará el sitio correcto. Igualmente podemos ayudar a los visitantes a recordar la extensión de nuestro sitio haciendo hincapié en él, por ejemplo en el título, en el logotipo, en los banners,…

Para acabar comentar que dispongo de una web cuyo dominio es .NET y recibe entre 1500 y 2000 visitas únicas al día. Sin embargo el dominio .COM del mismo nombre, a pesar de tener más antigüedad y dedicarse a la misma temática, como está muy mal desarrollado y no presenta un sitio de calidad a los visitantes su cantidad de visitas oscila entre 8 y 33 visitas únicas diarias (dispone de un sistema de estadísticas públicas). Con lo cual, suponiendo que todas esas visitas buscaran mi página apenas llega a ser un 1.5% en el peor caso. Y siempre se puede reducir ayudando a los usuarios a recordar la extensión de las formas comentadas anteriormente.

Por lo tanto, todos preferimos un dominio .COM, pero si el nombre esta cogido y tenemos la opción de registrar un nombre de dominio bajo una extensión diferente que siga siendo afín con el proyecto que tenemos en mente, ¿por qué no usarlo?

Combatir el SPAM

Juanjo 21 de Octubre de 2007

El SPAM es un gran negocio, muy lucrativo y difícil de combatir, sobre todo si quienes lo sufrimos no hacemos nada para evitarlo. ¿Pero que se puede hacer para evitar recibir mensajes de correo no deseado? La respuesta a esta pregunta es la que la mayoría esta pensando: denunciar.

La mayoría del SPAM lo recibiremos de empresas extranjeras ante las cuales es más complicado actuar debido a la falta de cooperación entre los diferentes organismos de forma internacional. Aunque igualmente se puede denunciar ante la agencia SpamCop.

Para el SPAM español la cosa es bastante más sencilla, simplemente denunciarlo en la Agencia Española de Protección de Datos (AGDP). La forma de actuar es la siguiente:

  • Descargar, rellenar e imprimir el modelo de denuncia que nos facilita la AGPD. En dicho formulario daremos nuestros datos y los de la empresa que nos envía los correos publicitarios no solicitados. Si se desconocen los datos de la empresa podemos hacer un whois al dominio que publicitan.
  • Imprimir los emails con las cabeceras completas, de forma que pueda comprobarse quien envía realmente el email. Todos los clientes de correo tienen una opción para mostrar las cabeceras de los emails.
  • Y por ultimo enviar todas las hojas firmadas y una fotocopia del DNI mediante fax al número 91 445 56 98 o mediante correo postal a la siguiente dirección:
    Agencia Española de Protección de datos
    C/ Jorge Juan, 6
    28001-Madrid

Esto es así de simple ya que se esta vulnerando nuestro derecho fundamental de protección de datos. Además en este caso no es necesario un abogado (aunque es recomendable estar bien asesorado), ni personarse en un juicio o vista oral, ni hay costas del proceso (aun cuando no se nos de la razón). Por lo tanto es fácil, cómodo, y gratuito.

Otro paso en la denuncia que no se ha comentado es el de avisar a la empresa que nos envía los correos sobre las medidas que se van a tomar, aunque no es necesario hacerlo.

Incluso muchas veces basta con realizar una advertencia sobre nuestras intenciones de tomar medidas legales si continúan enviándonos correos publicitarios no solicitados, para que cesen en su empeño de enviar SPAM. Aunque claro, con esto solo dejarán de enviárnoslo a nosotros. Para evitar que continúen haciendo negocio pisoteando nuestros derechos la única solución es denunciarlos.

« Artículos siguientes - Artículos anteriores »