Crawl caching proxy Google

Matt Cutts explica ¿Varias personas han notado el contenido de otro Google bots el hacer resaltar en nuestro índice principal de web, y se preguntan … por qué/cómo pasa esto? La semana pasada yo estaba en Boston WebmasterWorld y hablé de esta publicación(cuestión) allí, pero me gustaría hacer un poste de blog sobre la velocidad lenta de Google caching el poder, porque algunas personas tienen preguntas sobre ello.Primero de, déjeme mencionar lo que un poder caching debe solamente(justo) asegurarse que de todo el mundo consciente. Usaré un ejemplo de un contexto diferente: Agencias de servicio del Internet (ISPs) y usuarios. Cuando usted hace surf alrededor del web, usted trae páginas vía su ISP. Algunas páginas web de escondrijo ISPs y luego pueden servir aquella página a otros usuarios que visitan a la misma página. Por ejemplo, si el usuario un solicita(ruega) www.cnn.com, un ISP puede entregar aquella página al usuario un y el escondrijo aquella página. Si el usuario la B solicita(ruega) www.cnn.com un segundo más tarde, el ISP puede devolver la página de cached. Mucho ISPs y empresas hace esto para salvar(ahorrar) la amplitud de banda. Por ejemplo, el Calamar es un escondrijo por poderes de web que es libre(gratis) y común del cual mucha gente se ha enterado.

Como la parte del intercambio de infraestructura Bigdaddy, Google ha estado trabajando sobre marcos para el avance lento más simpático, ha mejorado canonicalization, y el mejor incluir en un índice. Sobre el frente más simpático que avanza lentamente, una de las cosas hemos estado trabajando sobre es la amplitud de banda reducción. Por ejemplo, el pre-Bigdaddy webcrawl Googlebot con el agente-usuario “ Googlebot/2.1 (+http: // www.google.com/bot.html) ” a veces permitiría a la codificación de gzipped. Bigdaddy más reciente Googlebots con agente-usuario “ Mozilla/5.0 (compatible; Googlebot/2.1; +http: // www.google.com/bot.html) ” mucho con mayor probabilidad apoyan la codificación de gzip. Esto reduce el uso de amplitud de banda de Googlebot para propietarios de sitio y administradores de sitio web. De mis conversaciones con el equipo avanzar lentamente/incluir en un índice, suena hay mucha altura para administradores de sitio web para reducir su bandwith por conectando gzip la codificación.

Otro camino que Bigdaddy salva(ahorra) la amplitud de banda de administradores de sitio web es por usando una velocidad lenta caching el poder. Yo maxxed hacia fuera mis habilidades PowerPoint de producir una ilustración. Como un ejemplo hipotético, imagínese si usted participa en AdSense, Google trae urls para nuestra búsqueda de blog, y Google también avanza lentamente sus páginas para su índice principal de web. Un día típico podría parecerse a esto:

La página trae bajo la vieja velocidad lenta

En este diagrama, Atienda un podría ser Adsense y Atender la N podría ser blogsearch. Como usted puede ver, el sitio consiguió 11 traídas de página del incluir en un índice principal Googlebot, 8 traídas del Adsense bot, y 4 traídas de blogsearch, para un total de 23 traídas de página. Ahora vaya a mirar como un escondrijo de velocidad lenta puede salvar(ahorrar) la amplitud de banda:

¡Un escondrijo de velocidad lenta es mucho más simpático!

En este ejemplo, si la velocidad lenta de blogsearch o AdSense quieren traer una página que la velocidad lenta de web ya traído, puede conseguirlo de la velocidad lenta caching el poder en vez de traer más páginas. Esto podría reducir el número de páginas traídas abajo a así poco como 11. De la misma manera, una página que fue traída para AdSense podría ser cached y luego volvió a si la velocidad lenta de web lo solicitó(rogó).

Entonces la velocidad lenta caching el poder trabaja como esto: si el servicio X trae una página, y el servicio luego posterior Y habría traído la misma página exacta, Google a veces usará la página del poder caching. Uniendo el servicio X (AdSense, blogsearch, la velocidad lenta de Noticias, cualquier servicio de Google que usa un bot) no hace cola las páginas para ser incluyen en nuestro índice principal de web. También, note que las reglas de robots.txt todavía se aplican a cada servicio de velocidad lenta de manera apropiada. Si permitieran al servicio X para traer una página, pero un archivo robots.txt previene el servicio Y de traer la página, el servicio Y no conseguiría la página del poder caching. Finalmente, note que la velocidad lenta caching el poder no es la misma cosa que la página de cached que usted ve pulsando sobre el eslabón de “Cached” por resultados de web. Aquellas páginas de cached sólo son puestas al día cuando una nueva página es añadida a nuestro índice. Es más exacto pensar en la velocidad lenta caching el poder como un sistema que se sienta fuera de webcrawl, y que a veces puede devolver páginas sin poner extra la carga sobre sitios externos.

Tal como siempre, participando en AdSense o ser en nuestro blogsearch no le consigue ningún avance lento “suplementario” (o la clasificación) en nuestro índice de web en absoluto. Usted no consigue ninguna representación suplementaria en nuestro índice, usted no se hace avanzado lentamente/incluido en un índice cualquier más rápido por nuestro webcrawl, y usted no consigue ningún empujón en la clasificación.

Esta velocidad lenta caching el poder fue desplegada con Bigdaddy, pero esto trabajaba tan suavemente que yo no sabía era vivo. Esto debería decirle que esto no es algún tipo webspam la comprobación de capa; el objetivo aquí debe reducir la amplitud de banda de velocidad lenta. Gracias a Gregorio Boser para notar esto, y gracias a Jensense para notar que una de nuestras respuestas en línea tenía la información añeja. El equipo de apoyo ha puesto al día aquella respuesta

Tags:

Anímate a escribir un comentario o suscribirte al feed y obtener los artículos futuros en tu lector de feeds.

Comentarios

Aún no hay comentarios.

Escribe un comentario

(requerido)

(requerido)


Spam Protection by WP-SpamFree