Resultados de Búsqueda

Crea tu propio rastreador de sitios web, tu copia de Google

¿Qué pasará cuando Microsoft Bing se coma definitivamente a Yahoo? Seguro que herramientas como Site Explorer serán historia y cada se complicará más el uso de herramientas como Advanced Link Manager, en definitiva nos tocará crear nuestra propia araña para indexar y recorrer páginas web sin depender de los grandes buscadores.

Existen hoy muchas opciones para crear nuestro propio spider, soluciones de código abierto que son realmente potentes.

Nutch es posiblemente la mejor opción para crear tu propia araña o rastreador de páginas web. Este fue construido sobre el concepto de Lucene (tiene una opción comercial) y soportado por Hadoop usando MapReduce (similar a Google) para grandes volúmenes y consultas de datos. Todos estos están basados en Java, pero existen versiones basadas en .net como Lucene.NET, Nutch.NET y Hadoop.NET que han sido portados a C#.

Pero la cosa no queda aquí y aunque Nutch es posiblemente la mejor opción para crear un rastreador y tener tu propio Google o Bing, hay otras opciones que os detallamos en esta pequeña lista:

 

Etiquetas : , , , , , ,

Acelera tus páginas webs hasta un 50% con Apache

mod pagespeed y google Acelera tus páginas webs hasta un 50% con Apache

Desde luego Google es un gran hermano y un gran generador de aplicaciones de código abierto para mejorar Internet y la web en general, pero no son los únicos. El caso que hace unos días publicaron un módulo para Apache llamado mod_pagespeed con el cual aseguran que es posible acelerar las transferencias de datos web hasta un 50% de cara al usuario que nos visita.

Este módulo funciona realizando modificaciones en el contenido/código de nuestra web, agrupando ficheros CSS y JS en uno único, minimizando y comprimiendo todos los html, css, .js, … incluso es capaz de comprimir y cambiar las imágenes por data:uris si tienes tu servidor web listo para hacerlo.

Todo esto con la licencia de Apache 2.0. Desde luego tendremos que pensar en probarlo, total no perdemos nada por hacerlo y si mejora todo pues mejor que mejor. Ya os contaré nuestra experiencia, vamos a ver si lo ponemos en marcha en alguno de los nuevos servidores virtualizados que vamos a montar para Color vivo Internet, no se si probaremos en alguno con Plesk o si el, pero creo que los candidatos para probar serían las webs con más tráfico como Juegos Web, Decoración 2.0 o Navidad.

Sitio Oficial de mod_pagespeed. Documentación de como instalar mod_pagespeed.
Gracias por la referencia a Barrapunto y al equipo de Marketing de Acens (donde también trabajo entre otros proyectos).

0

Problemas con Plesk y la actualización de OpenSSL

Si tenéis el panel de control plesk 9.x instalado sobre un servidor con CentOS 4/5 o RedHat 4/5 y habéis actualizado recientemente el paquete OpenSSL es probable que el panel de control no funcione, no es posible iniciarlo y en los logs (/var/log/sw-cp-server/error_log) sale información tal que así:

2010-04-06 11:00:00: (log.c.75) server started
2010-04-06 11:00:00: (network.c.336) SSL: error:00000000:lib(0):func(0):reason(0)
2010-04-06 12:00:00: (log.c.75) server started
2010-04-06 12:00:00: (network.c.336) SSL: error:00000000:lib(0):func(0):reason(0)
2010-04-06 13:00:00: (log.c.75) server started
2010-04-06 13:00:00: (network.c.336) SSL: error:00000000:lib(0):func(0):reason(0)

Para solucionar este problema con el panel de hosting de Parallels es necesario actualizar un paquete del propio panel, para lo que sus creadores nos proporcionan la versiones necesarias y el como hacerlo.

En mi caso hay que descargar el RPM para Centos 5 64 bits:
Leer el resto de la entrada »

Etiquetas : , , , , , ,

0

Usando Amazon S3 y CloudFront con WordPress

Llevamos tiempo pensado en como optimizar la carga de nuestros servidores dedicados de forma extrema, entre las tareas que nos hemos puesto destacan las siguientes:

Amazon Simple Storage Service o S3 es un gran servicio de almacenamiento distribuido que virtualmente ofrece capacidad de almacenamiento ilimitada. Son muchas las empresas que lo están utilizando para reducir costes de infraestructuras y almacenar con un nivel de seguridad muy aceptable. Pero como S3 no parecía suficiente la gente de Amazon lanzó CloudFront un servicio CDN (Content Delivery Network) cuya finalidad es facilitar el acceso a los datos alojados en S3 de manera distribuida como hacen por ejemplo Akamai, CacheFly, Velocix (que probamos hace unas semanas), CoralCDN (ha desaparecido), …

Lo bueno de CloudFront, es fácil de implementar y distribuirá tus contenidos de forma automática desde alguna de sus múltiples localizaciones:

Después de varios meses probando opciones de CDN para mejorar la carga y rendimiento de WordPress he optado por probar la solución de Amazon y realmente de momento me está impresionando. Para poder utilizarlo en WordPress de forma sencilla hacemos uso del Plugin W3 Total Cache que facilita toda la operativa de puesta en marcha y copia de contenidos de forma automática al Bucket S3. Posiblemente tengas problemas para crear el Bucket en S3 para esa tarea puedes recurrir a un cliente S3 que te facilitará esta tarea, yo al hacerlo desde la oficina he utilizado CloudBerry Explorer, pero hay multitud de opciones gratis. Además no tendrás que mostrar que CDN utilizas ya que puedes reescribir la URL, en nuestro caso utilizamos cdn.decoracion2.com.

No voy a ponerme a explicar mucho más el proceso de activación porque es realmente intuitivo y siempre podéis recurrir a la documentación oficial de Amazon o las referencias que os dejamos a continuación.

Más referencias de como usar Amazon S3 y CloudFront: W3 Total Cache, Paul Stamatiou, más plugins con soporte CloudFront, Kovshenin, …

Etiquetas : , , ,

Actualizar servidores: Nuevo Plesk 9.2.3

Acabo de darme cuenta que hay una nueva versión de Parallels Plesk Panel 9.2.3, en la que tenemos algunas novedades y mejoras, por lo que es muy interesante actualizar nuestros servidores dedicados, siempre que lo haga un profesional. Nosotros hemos actualizado ya uno de los servidores de gestión de publicidad interna de Color Vivo Internet con OpenX.

Entre las novedades de esta versión del panel de control plesk podemos comentar:

Más información sobre novedades en Plesk 9.2.3.
Descargar Plesk 9.2.3 para diferentes sistemas operativos.

Etiquetas : , , , , , , , , , , , , , ,