Jak działają wyszukiwarki internetowe?
Jak często zdarza Ci się taka sytuacja: przypominasz sobie coś i chcesz to od razu sprawdzić. Siadasz przed komputerem lub bierzesz do ręki smartfon, otwierasz przeglądarkę, wpisujesz szukaną frazę, klikasz enter i… dzieje się magia! Pojawia się strona z linkami, dzięki której zaspokoisz swój głód informacji. Ciężko sobie wyobrazić, jak dawniej ludzie żyli w świecie bez Internetu. A Ty teraz masz wszelką wiedzą na wyciągnięcie ręki. Jak działają wyszukiwarki internetowe, które dostarczają Ci informacji w ciągu kilku sekund?
Jedynki i zera tworzą nić porozumienia
Wyszukiwarka internetowa przeszła wiele faz rozwoju. Od czasów, kiedy zwracała nie te wyniki, które oczekiwałeś (skąd miała wiedzieć, że wpisując „myszka”, ma znaleźć sprzęt komputerowy, a nie informacje o małym gryzoniu?) po czekanie kilkanaście sekund, aż w końcu na ekranie pojawią się rezultaty.
Jeszcze dekadę temu Internetem rządził tekst, teraz coraz chętniej korzystasz z obrazów i filmów video. Możesz wyszukiwać za pomocą obrazów, a nie słów. Ba, teraz to nawet nie potrzebujesz klikać w linki — wyszukiwarka zaprezentuje wynik bez wchodzenia na stronę (tzw. zero-click).
Co umożliwia kontakt i wzajemne zrozumienie pomiędzy Tobą a wyszukiwarką? System binarny, czyli korzystasz ze znaków, tekstu, obrazów, nawet mowy, które zamieniają się na cyfry: jedynki i zera. A to już język, który znają i wykorzystują systemy komputerowe.
Kolejny krok to wyszukiwarka, która jest oknem na świat. Możesz wybrać spośród wielu dostępnych w Internecie: Google, Bing, Yahoo czy specyficzne dla niektórych regionów jak Baidu w Chinach lub Yandex w Rosji. Każda jednak zbiera, klasyfikuje i prezentuje wyniki, by odpowiadały Twoim wymaganiom. Ty wpisujesz hasło, ona udziela odpowiedzi. Tylko skąd wyszukiwarka tyle wie o Internecie i w tak szybkim czasie prezentuje wyniki?
Pajączek i spółka
To, co otrzymasz zwrotnie jako wynik zapytania, to jedynie finał całego procesu. Zanim klikniesz enter po wpisaniu szukanej frazy, zadziała cała masa różnych sekwencji i obliczeń, które złożą się na efekt.
A wszystko dzięki pracy pajączka (ang. spider). Nazwa doskonale obrazuje pracę, którą wykonuje — chodzi po stronach i zostawia ślad, taką „nić pajęczą”. Jego zadanie polega na czytaniu tekstu, z pominięciem kodu HTML. Zostawia znaczniki, dzięki którym łatwiej będzie zorientować się w treści strony. Pomaga zrozumieć strukturę i tematykę stron WWW.
Pajączek umieszcza informacje o odwiedzonych stronach WWW w bazach danych. Tam są indeksowane i odtąd brane pod uwagę przy wyszukiwaniach. Jeżeli pojawi się pasujące zapytanie, wyszukiwarka znajdzie i pokaże odpowiednie strony WWW.
Co jakiś czas indeksy są aktualizowane, bo pajączki cały czas chodzą sobie po świecie Internetu i przeglądają treści. Każdego dnia powstaje 252 tys. nowych stron w Internecie, nie grzeszą zatem lenistwem i nie grozi im bezrobocie.
W zasadzie większość procesu wyszukiwania dzieje się poza Tobą i to zanim naciśniesz jakikolwiek klawisz na klawiaturze. Jednak ta wcześniej wykonana praca daje Ci gwarancję, że pasujące odpowiedzi uzyskasz szybko i że będą one rzetelne.
Na łasce i niełasce wyszukiwarek
Wyszukiwarki porządkują chaos Internetu. Przynajmniej w takim stopniu, w jakim to jest możliwe. Człowiek zrobiłby to zapewne lepiej, ale przecież nie jest w stanie ogarnąć tylu stron i tematów. I do tego w tak krótkim czasie.
Jest jednak w tym wszystkim pułapka. Jeżeli zdajesz się na wyszukiwarki, to one nie są bezstronne, bo przedstawiają wyniki najlepsze dla Ciebie. Po to, byś był zadowolony i przy kolejnej okazji znowu skorzystał z ich pomocy. Ktoś siedzący obok Ciebie dla tego samego zapytania może otrzymać inne strony WWW i informacje. Dlaczego tak się dzieje?
Wyszukiwarki chcą Ci się przypodobać. W tym celu zbierają dane o Twoich preferencjach, tworzą pewien profil danych, które będą dla Ciebie najtrafniejsze. Uczą się na podstawie wcześniejszych wyszukiwań i tak powstaje pewien algorytm.
Dopiero na tej podstawie proponują wyniki i mogą pominąć te, które będą uważały za nie do końca Tobie odpowiadające. Zauważ, jak rzadko trafiasz w Internecie na treści wywołujące Twój sprzeciw. Czy zatem wyszukiwarki cenzurują?
Przebij tę bańkę!
To nie jest cenzura, ale dopasowywanie informacji do Twoich preferencji. Fachowe określenie tego zjawiska to „bańka filtrująca” lub „bańka informacyjna”. Polega na otaczaniu się treściami, które są zgodne z Twoimi poglądami i zainteresowaniami. Zjawisko to opisał Eli Pariser w książce „The Filter Bubble: What the Internet Is Hiding from You” (2011). Niestety, wiedza o istnieniu tego zjawiska jest znikoma.
Sam fakt, że wiesz o bańce, nie wystarcza, że automatycznie wydostajesz się z niej. Możesz jednak spróbować kilku sposobów, by ograniczyć to zjawisko:
- przeglądać uznane serwisy informacyjne jak Associated Press czy Reuters, które przedstawiają świat w sposób bezstronny i pozbawiony opinii,
- korzystać z wyszukiwarek, które w znacznie mniejszym stopniu opiera się o spersonalizowane wyniki jak np. DuckDuckGo,
- śledzić wystąpienia na TEDx, poruszające niszowe tematy,
- wyjść poza Internet i np. spotkać się z osobami, które się różnią od Ciebie i nie są z kręgu Twoich znajomych, mają inne przekonania religijne, różnią się pochodzeniem czy wartościami kulturowymi.
Ważna jest świadomość, że Twoje dane o przeglądanych stronach, Twoje zapytania i kliknięcia to tak naprawdę towar, który sprzedajesz w zamian za „darmowe” treści.
Dlatego zrób czasem coś inaczej niż zwykle. Odkryj tematy, które znajdowały się na marginesie Twoich zainteresowań. Przejrzyj posty osób, które mają odmienne poglądy niż Twoje, nie blokuj ich, a raczej staraj się poznać ich punkt widzenia. Poczytaj wpisy z zagranicznych portali i blogów. Bo jak słusznie zauważa Eli Pariser:
stale skupiając uwagę na obrzeżach Twoich możliwości rozumienia, zwiększasz sens świata
Skoro już wiesz, jak działają wyszukiwarki internetowe, to spróbuj odkryć nieznane treści Internetu!
PS. Wnikliwy artykuł na temat bańki filtrującej napisał Paweł Tkaczyk na swoim blogu. Polecam!