Archivo de Notas
   
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Aspectos de SEO que pueden evitar el Indexado

Por Gennady Lager (c) 2007
 

A menudo me piden encontrar las razones por las cuales un sitio no está clasificando. Esta es una cuestión muy amplia que requiere mucha investigación para llegar al fondo. La mejor manera de comenzar es determinar cual página está siendo optimizada para que término específico. Tome la URL e ingrésela en una consulta de búsqueda. Si no aparece nada, la página no está indexada en el motor de búsqueda y por lo tanto, no clasificará para ese término.

En situaciones como esta, comienzo mi checklist mental de las cosas que podrían estar evitando ser crawleada e indexada una página. Este es mi checklist en orden de importancia:

Robots.txt Protocol Exclusión

Las páginas y carpetas directorio excluidas a través de los robot.txt nunca serán crawleadas porque el archivo le dice que no lea la página. Un archivo robots.txt es el primer archivo que llama el bot del motor de búsqueda y si éste excluye una página, no lo leerá ni lo indexará.

“No Index” Meta Tag

Si una página tiene la siguiente Meta tag: <meta name=”robots” content=”noindex” />, esto esencialmente es lo mismo que un archivo de exclusión robots.txt. La página no será indexada.

Contenido Duplicado

Dos página con URL’s únicas a menudo son filtradas de los resultados de búsqueda y a veces una es quitada del index por el simple hecho de que el motor de búsqueda podría no permitir que la calidad de sus resultados de búsqueda sufrieran por mostrar la misma información una tras otra. A menudo, este es el caso por el que la gente no puede conseguir que una página específica sea indexada.


Múltiples Versiones Canónicas de URL

Como con el contenido duplicado, las múltiples versiones de URL del mismo contenido actúan de la misma forma. Mientras que los motores de búsquedas están constantemente mejorando sus algoritmos para evitar este tema, aún puede causar problemas de indexación.

URL’s Dinámicas

Las URLs Dinámicas tienden a proveer el mismo contenido en una única cadena URL la cual dispara los filtros de contenido duplicado. Estas trabajan de la misma manera que la duplicación directa y las múltiples versiones de URL canónicas.

Problemas de Conformidad del Algoritmo

Puesto simple, si usted hace algo que no les gusta a los motores de búsquedas como el uso de técnicas black hat, ellos pueden fácilmente des-indexar una página o quitar el dominio completo del index.


Replicación de Title y Meta Tags

A veces he notado que cuando dos páginas tienen contenido similar, y el título y la Meta description y keywords tags están replicadas entre las dos páginas, la página a menudo no es indexada porque dispara el filtro de contenido duplicado.

Uso de Lenguaje de Programación

Los motores de búsquedas, generalmente sólo leen HTML. Ellos están haciendo avances en indexar JavaScript y Flash pero aún tienen un lago camino por recorrer. Con esto, una página compuesta de sólo JavaScript, Flash, o imágenes puede tomarle tiempo ser indexada porque los motores de búsquedas no tienen nada que leer.

Tamaño de Archivo de la Página

Google recomienda un tamaño de archivo de página de menos de 99k. Trato de cumplir con esto y he notado que las páginas grandes pueden causar problemas de indexación.

Layout basado en Tablas

Las tablas anidadas a menudo causan que los crawlers de los motores de búsquedas salten sobre las secciones de una página y no indexen cierto contenido. Si ellos pierden sus cosas importantes, no podrán indexarlo para nada.

Estructura de Navegación y de Enlazado

Es vital conseguir que el crawler llegue a la página. Esto debe ser hecho con enlaces de texto standard HTML preferiblemente sin los atributos rel=”nofollow” en aquellos enlaces. Después, algunos enlaces en las páginas con más de 100 enlaces de navegación pueden no ser crawleados y seguidos al index. Cada página no debería estar a más de 3 clicks de profundidad desde la homepage. A menudo, esto puede ser realizado usando sitemaps, barras de navegación CSS, enlaces breadcrumb, e interlazado de contenido cruzado. A veces, los motores de búsquedas aún pueden llevar tiempo en indexar algunas páginas. En tales casos, le recomiendo alimentar un sitemap directo a través de cosas como XML.

Tiempo

A menudo veo a la gente, simplemente ansiosa por ver la indexación. Los recursos de los motores de búsquedas son limitados y ellos se dedicarán en correlación directa con que tan importante es un sitio. La importancia, normalmente es determinada por los perfiles de enlaces y la frescura del contenido. Si un sitio es juzgado como menos importante, el crawler puede llegar menos a menudo y no cavar más abajo sin colocar enlaces en el index de las nuevas páginas y simplemente no indexar todas sus páginas porque su sitio no provee bastante valor al index.

Estoy seguro que estas no son todas las posibles razones por las que una página podría no ser indexada. ¿Alguien puede comentar alguna otra razón posible?


 

============================================================================================

============================================================================================

 
     
 
 
 
   
 
Copyright Marketing-web.com.ar - Todos los derechos reservados.