Robot szukacza (zbieracz) samodzielnie przeszukuje Internet, wędrując po linkach od witryny do witryny, od dokumentu do dokumentu. Do budowanego przez siebie archiwum dokumentów polskich dodaje te strony, które uzna za polskie. W szczególności za strony takie uznaje wszystkie te, które zawierają słowa z polskimi literami (ą, ć, ę, ł, ń, ó, ś, ź, ż). Dodaje je niezależnie od tego, czy pochodzą one z witryny z końcówką ".pl", czy nie. Do archiwum dodaje zarówno strony statyczne, jak i dynamiczne.
Więcej informacji o zbieraczu znajdziesz w dokumencie Jak działa robot Szukacza? Znajdziesz tam także informacje o tym, jak można uniknąć indeksowania niektórych stron oraz całych fragmentów witryny.
Możesz wymusić na zbieraczu, aby zajrzał do Twojej witryny i włączył ją do kolekcji polskiej.
Wystarczy, jeśli wpiszesz poniżej pełny URL tej strony, na którą ma zajrzeć. Nie spodziewaj się jednak, że strona ta oraz wszystkie, do których wiodą z niej linki, pojawią się natychmiast w aktywnej kolekcji, którą Szukacz wykorzystuje, odpowiadając na pytania. Najprawdopodobniej pojawią się dopiero następnego dnia.
Jeśli w Twojej witrynie są strony z polskimi słowami, a jednocześnie żadnych stron z Twojej witryny nie ma w kolekcji polskiej, to bardzo prawdopodobne jest, że zbieracz próbował już wielokrotnie się do tych stron dostać i je ściągnąć do swojej bazy, ale z jakiegoś powodu mu się to nie udało lub nie spełniły one warunków opisanych poniżej.
Aby zbieracz Szukacza uznał stronę za wartą archiwizowania i dołączenia do kolekcji polskiej, strona ta musi zawierać co najmniej 10 słów. Muszą być też na niej polskie słowa. Strona taka nie może składać się wyłącznie z elementów graficznych z napisami wykonanymi jako grafiki. Nie może też być wykonana w technice "flash". Szukacz ściąga i indeksuje wyłącznie dokumenty HTML i zwykłe tekstowe. Muszą one zawierać słowa, które zbieracz rozpozna jako polskie.
Jeśli strona główna Twojej witryny zawiera same elementy graficzne lub jest wykonana w technice "flash", możesz specjalnie dla zbieracza i innych robotów przygotować inną stronę "wejściową", najlepiej w zwykłym, statycznym HTML-u, i adres tej strony wpisać powyżej. Na stronie tej możesz umieścić opis witryny i linki do tych wszystkich stron, do których zbieracz powinien dotrzeć (oczywiście znowu nie mogą być one wyłącznie graficzne lub typu "flash").
Przykładem takiej strony wejściowej w witrynie Szukacza jest strona Spis dokumentów.
Copyright © 24 Godziny Sp. z o.o. 2000–2011