A menudo me piden encontrar las razones por las cuales
un sitio no está clasificando. Esta es una cuestión
muy amplia que requiere mucha investigación para llegar
al fondo. La mejor manera de comenzar es determinar cual página
está siendo optimizada para que término específico.
Tome la URL e ingrésela en una consulta de búsqueda.
Si no aparece nada, la página no está indexada
en el motor de búsqueda y por lo tanto, no clasificará
para ese término.
En situaciones como esta, comienzo mi checklist mental de
las cosas que podrían estar evitando ser crawleada
e indexada una página. Este es mi checklist en orden
de importancia:
Robots.txt Protocol Exclusión
Las páginas y carpetas directorio excluidas a través
de los robot.txt nunca serán crawleadas porque el archivo
le dice que no lea la página. Un archivo robots.txt
es el primer archivo que llama el bot del motor de búsqueda
y si éste excluye una página, no lo leerá
ni lo indexará.
“No Index” Meta Tag
Si una página tiene la siguiente Meta tag: <meta
name=”robots” content=”noindex” />,
esto esencialmente es lo mismo que un archivo de exclusión
robots.txt. La página no será indexada.
Contenido Duplicado
Dos página con URL’s únicas a menudo
son filtradas de los resultados de búsqueda y a veces
una es quitada del index por el simple hecho de que el motor
de búsqueda podría no permitir que la calidad
de sus resultados de búsqueda sufrieran por mostrar
la misma información una tras otra. A menudo, este
es el caso por el que la gente no puede conseguir que una
página específica sea indexada.
|
Replicación de Title y Meta Tags
A veces he notado que cuando dos páginas tienen contenido
similar, y el título y la Meta description y keywords
tags están replicadas entre las dos páginas,
la página a menudo no es indexada porque dispara el
filtro de contenido duplicado.
Uso de Lenguaje de Programación
Los motores de búsquedas, generalmente sólo
leen HTML. Ellos están haciendo avances en indexar
JavaScript y Flash pero aún tienen un lago camino por
recorrer. Con esto, una página compuesta de sólo
JavaScript, Flash, o imágenes puede tomarle tiempo
ser indexada porque los motores de búsquedas no tienen
nada que leer.
Tamaño de Archivo de la Página
Google recomienda un tamaño de archivo de página
de menos de 99k. Trato de cumplir con esto y he notado que
las páginas grandes pueden causar problemas de indexación.
Layout basado en Tablas
Las tablas anidadas a menudo causan que los crawlers
de los motores de búsquedas salten sobre las
secciones de una página y no indexen cierto contenido.
Si ellos pierden sus cosas importantes, no podrán
indexarlo para nada.
Estructura de Navegación y de Enlazado
Es vital conseguir que el crawler llegue a la página.
Esto debe ser hecho con enlaces de texto standard HTML
preferiblemente sin los atributos rel=”nofollow”
en aquellos enlaces. Después, algunos enlaces
en las páginas con más de 100 enlaces
de navegación pueden no ser crawleados y seguidos
al index. Cada página no debería estar
a más de 3 clicks de profundidad desde la homepage.
A menudo, esto puede ser realizado usando sitemaps,
barras de navegación CSS, enlaces breadcrumb,
e interlazado de contenido cruzado. A veces, los motores
de búsquedas aún pueden llevar tiempo
en indexar algunas páginas. En tales casos, le
recomiendo alimentar un sitemap directo a través
de cosas como XML.
|
|
Tiempo
A menudo veo a la gente, simplemente ansiosa por ver la indexación.
Los recursos de los motores de búsquedas son limitados
y ellos se dedicarán en correlación directa
con que tan importante es un sitio. La importancia, normalmente
es determinada por los perfiles de enlaces y la frescura del
contenido. Si un sitio es juzgado como menos importante, el
crawler puede llegar menos a menudo y no cavar más
abajo sin colocar enlaces en el index de las nuevas páginas
y simplemente no indexar todas sus páginas porque su
sitio no provee bastante valor al index.
Estoy seguro que estas no son todas las posibles razones
por las que una página podría no ser indexada.
¿Alguien puede comentar alguna otra razón posible?
|