Crawl caching proxy Google
Matt Cutts explica ¿Varias personas han notado el contenido de otro Google bots el hacer resaltar en nuestro Ãndice principal de web, y se preguntan … por qué/cómo pasa esto? La semana pasada yo estaba en Boston WebmasterWorld y hablé de esta publicación(cuestión) allÃ, pero me gustarÃa hacer un poste de blog sobre la velocidad lenta de Google caching el poder, porque algunas personas tienen preguntas sobre ello.Primero de, déjeme mencionar lo que un poder caching debe solamente(justo) asegurarse que de todo el mundo consciente. Usaré un ejemplo de un contexto diferente: Agencias de servicio del Internet (ISPs) y usuarios. Cuando usted hace surf alrededor del web, usted trae páginas vÃa su ISP. Algunas páginas web de escondrijo ISPs y luego pueden servir aquella página a otros usuarios que visitan a la misma página. Por ejemplo, si el usuario un solicita(ruega) www.cnn.com, un ISP puede entregar aquella página al usuario un y el escondrijo aquella página. Si el usuario la B solicita(ruega) www.cnn.com un segundo más tarde, el ISP puede devolver la página de cached. Mucho ISPs y empresas hace esto para salvar(ahorrar) la amplitud de banda. Por ejemplo, el Calamar es un escondrijo por poderes de web que es libre(gratis) y común del cual mucha gente se ha enterado.
Como la parte del intercambio de infraestructura Bigdaddy, Google ha estado trabajando sobre marcos para el avance lento más simpático, ha mejorado canonicalization, y el mejor incluir en un Ãndice. Sobre el frente más simpático que avanza lentamente, una de las cosas hemos estado trabajando sobre es la amplitud de banda reducción. Por ejemplo, el pre-Bigdaddy webcrawl Googlebot con el agente-usuario “ Googlebot/2.1 (+http: // www.google.com/bot.html) †a veces permitirÃa a la codificación de gzipped. Bigdaddy más reciente Googlebots con agente-usuario “ Mozilla/5.0 (compatible; Googlebot/2.1; +http: // www.google.com/bot.html) †mucho con mayor probabilidad apoyan la codificación de gzip. Esto reduce el uso de amplitud de banda de Googlebot para propietarios de sitio y administradores de sitio web. De mis conversaciones con el equipo avanzar lentamente/incluir en un Ãndice, suena hay mucha altura para administradores de sitio web para reducir su bandwith por conectando gzip la codificación.
Otro camino que Bigdaddy salva(ahorra) la amplitud de banda de administradores de sitio web es por usando una velocidad lenta caching el poder. Yo maxxed hacia fuera mis habilidades PowerPoint de producir una ilustración. Como un ejemplo hipotético, imagÃnese si usted participa en AdSense, Google trae urls para nuestra búsqueda de blog, y Google también avanza lentamente sus páginas para su Ãndice principal de web. Un dÃa tÃpico podrÃa parecerse a esto:

En este diagrama, Atienda un podrÃa ser Adsense y Atender la N podrÃa ser blogsearch. Como usted puede ver, el sitio consiguió 11 traÃdas de página del incluir en un Ãndice principal Googlebot, 8 traÃdas del Adsense bot, y 4 traÃdas de blogsearch, para un total de 23 traÃdas de página. Ahora vaya a mirar como un escondrijo de velocidad lenta puede salvar(ahorrar) la amplitud de banda:

En este ejemplo, si la velocidad lenta de blogsearch o AdSense quieren traer una página que la velocidad lenta de web ya traÃdo, puede conseguirlo de la velocidad lenta caching el poder en vez de traer más páginas. Esto podrÃa reducir el número de páginas traÃdas abajo a asà poco como 11. De la misma manera, una página que fue traÃda para AdSense podrÃa ser cached y luego volvió a si la velocidad lenta de web lo solicitó(rogó).
Entonces la velocidad lenta caching el poder trabaja como esto: si el servicio X trae una página, y el servicio luego posterior Y habrÃa traÃdo la misma página exacta, Google a veces usará la página del poder caching. Uniendo el servicio X (AdSense, blogsearch, la velocidad lenta de Noticias, cualquier servicio de Google que usa un bot) no hace cola las páginas para ser incluyen en nuestro Ãndice principal de web. También, note que las reglas de robots.txt todavÃa se aplican a cada servicio de velocidad lenta de manera apropiada. Si permitieran al servicio X para traer una página, pero un archivo robots.txt previene el servicio Y de traer la página, el servicio Y no conseguirÃa la página del poder caching. Finalmente, note que la velocidad lenta caching el poder no es la misma cosa que la página de cached que usted ve pulsando sobre el eslabón de “Cached” por resultados de web. Aquellas páginas de cached sólo son puestas al dÃa cuando una nueva página es añadida a nuestro Ãndice. Es más exacto pensar en la velocidad lenta caching el poder como un sistema que se sienta fuera de webcrawl, y que a veces puede devolver páginas sin poner extra la carga sobre sitios externos.
Tal como siempre, participando en AdSense o ser en nuestro blogsearch no le consigue ningún avance lento “suplementario” (o la clasificación) en nuestro Ãndice de web en absoluto. Usted no consigue ninguna representación suplementaria en nuestro Ãndice, usted no se hace avanzado lentamente/incluido en un Ãndice cualquier más rápido por nuestro webcrawl, y usted no consigue ningún empujón en la clasificación.
Esta velocidad lenta caching el poder fue desplegada con Bigdaddy, pero esto trabajaba tan suavemente que yo no sabÃa era vivo. Esto deberÃa decirle que esto no es algún tipo webspam la comprobación de capa; el objetivo aquà debe reducir la amplitud de banda de velocidad lenta. Gracias a Gregorio Boser para notar esto, y gracias a Jensense para notar que una de nuestras respuestas en lÃnea tenÃa la información añeja. El equipo de apoyo ha puesto al dÃa aquella respuesta
Anímate a escribir un comentario o suscribirte al feed y obtener los artículos futuros en tu lector de feeds.






























Comentarios
Aún no hay comentarios.
Escribe un comentario