Ataxo / Informacje / Wyszukiwarki internetowe
Wyszukiwarki internetowe i katalogi
Serwery wyszukujące można podzielić na dwa podstawowe typy:
- Wyszukiwarki pełnotekstowe
- Katalogi
Na tej stronie możesz się dowiedzieć, jaka jest różnica pomiędzy wyszukiwarkami pełnotekstowymi a katalogami, jak one działają oraz jak w obu wariantach można poprawić wyniki wyszukiwania stron.
Jak działają wyszukiwarki pełnotekstowe?
Roboty i Crawlery
Gdy wyszukiwarka pełnotekstowa otrzyma zapytanie, to w przeciwieństwie do ogólnego przekonania, nie szuka danego wyrazu w Internecie, ale na swoim serwerze. Istnieją bazy danych stron internetowych, którymi dysponuje każdy serwer wyszukujący. Program wyszukiwarki pełnotekstowej (który jest również nazywany robotem indeksowym) działa w następujący sposób: skanuje Internet, za pomocą linków dostaje się na kolejne strony i zapisuje ich treść w swojej bazie danych. Dlatego też robota indeksowego wyszukiwarki pełnotekstowej potocznie nazywa się spider (pająk) lub crawler (pełzacz). Elektroniczny robot przemieszcza się jak pająk po powiązaniach - linkach, które łączą poszczególne strony internetowe między sobą, tworząc sieć.
Robot skanuje kod źródłowy html strony internetowej, a jeżeli znajdzie w nim jakieś linki na kolejną stronę, przechodzi na nią i tam kontynuuje indeksację. Podczas indeksowania robot analizuje i zapisuje kod źródłowy strony w bazie danych na serwerze wyszukiwarki. To jest baza danych, w której następnie my, użytkownicy, szukamy. A zatem wyszukiwanie nie przebiega w rzeczywistym czasie w Internecie, ale na serwerze wyszukiwarki, a ten następnie odsyła nam do przeglądarki wynik danego wyszukiwania. Tylko ten sposób umożliwia niemal natychmiastowe otrzymanie wyniku wyszukiwania po wpisaniu zapytania.
Co zrobić, aby wyszukiwarka pełnotekstowa zauważała naszą stronę
Jeżeli nie znajdujemy się w spisie stron wyszukiwarki (a najprawdopodobniej tak jest, jeżeli nasza strona ma niską liczbę odwiedzin), to istnieje możliwość ręcznej rejestracji. Nie jest to najbardziej efektywne rozwiązanie, gdyż w większości przypadków preferowane są (zajmują lepsze pozycje) te strony internetowe, które wyszukiwarka znalazła sama w naturalny sposób, tzn. na które przekierowały ją inne strony. Należy więc postarać się umieścić na innych stronach linki do naszej własnej.
Robot wyszukujący zapamiętuje na których stronach już był, a jego program określa kiedy ponownie powróci na stronę, aby wprowadzić do indeksu ewentualne zmiany. Funkcjonowanie robota jest w pełni automatyczne i nie da się na nie w żaden sposób wpłynąć.
W jaki sposób wyszukiwarki pełnotekstowe szeregują wyniki
Nikt, oprócz samych programistów, nie zna dokładnych zasad (algorytmów), według których są kierowane wyniki wyszukiwania pełnotekstowego. Co więcej, każda z technologii pełnotekstowych wykorzystuje odmienne algorytmy do szeregowania wyników.
Wiadomo jednak, że wyszukiwarki oceniają adekwatność strony internetowej do zapytania, które użytkownik wpisał, według dwóch następujących kryteriów:
- Czynniki on-page – częstotliwość występowania szukanego słowa kluczowego lub połączenia słownego (frazy) w tekście strony internetowej i wewnątrz standardowego kodu HTML.
- Czynniki off-page – liczba linków kierujących na daną stronę internetową z innych stron.
Aby strony internetowe osiągnęły oczekiwane rezultaty, ważne jest uzyskanie jak najlepszych ocen według tych kryteriów. Strony internetowe można modyfikować w taki sposób, aby ich ocena poprawiła się, a przez to wyświetlały się na czołowych miejscach w wynikach wyszukiwania słów kluczowych. To jest sedno optymalizacji w wyszukiwarkach czy też SEO (Search Engine Optimization).
Polskie i światowe systemy pełnotekstowe
Do najbardziej znaczących i największych zagranicznych technologii wyszukiwania pełnotekstowego należą Google.com,Yahoo! i Bing.com a do polskich Google oraz Netsprint. Interia oraz Onet korzystają z silnika Google a WP z technologii Netsprint.
W jaki sposób działają katalogi?
Katalog to inaczej spis stron internetowych poukładany według sekcji tematycznych.
Zapis stron do katalogu można przeprowadzić ręcznie na odpowiedniej stronie rejestracyjnej. Pracownicy katalogu sprawdzają link oraz oceniają trafność wybranej kategorii w stosunku do treści zawartej na stronie, a także zgodność z przepisami obowiązującymi w katalogu.
Podczas rejestracji linku w katalogu przeważnie należy: zarezerwować URL (adres) strony, tytuł linku, który będzie służyć w katalogu jednocześnie jako link do strony, następnie uzupełniający opis strony oraz wybrać odpowiednią kategorię do rejestracji.
Większość katalogów nie zezwala na używanie w zapisie superlatyw, słów wulgarnych lub obraźliwych itp.
Słowa kluczowe w katalogach
Możliwości poprawienia pozycji w katalogach są ograniczone. Wpłynąć na nią może jedynie zaklasyfikowanie do właściwej (adekwatnej) kategorii, a następnie zamieszczenie słów kluczowych w tytule linku oraz opisie. Link wyświetli się tym użytkownikom, którzy szukają danych słów kluczowych.
W przypadku najlepszych linków edytorzy przeważnie pozostawiają w tytule tylko nazwę firmy lub adresy stron internetowych. Uprzywilejowane są więc te projekty, które zawierają słowo kluczowe w swojej nazwie lub w URL (np. pralki.pl itp.).
Polskie i światowe katalogi
Do najczęściej używanych katalogów linków w Polsce należą katalogi trzech największych polskich portali – http://katalog.onet.pl/, http://katalog.wp.pl/ i http://katalog.interia.pl/. Wszystkie katalogi oferują obecnie szybsze płatne dodanie. We wszystkich przypadkach jednak katalogi jedynie uzupełniają wyszukiwanie pełnotekstowe. Do ważnych światowych katalogów należą np. yahoo.com (http://dir.yahoo.com/ - koszt 299$ za rok) lub otwarty projekt DMOZ.org (http://dmoz.org/), tworzony przez ochotników z całego świata.





