Motor de căutare – Web-ul în 100 de paşi

Motor de căutare

În primele zile ale web-ului, Tim Berners-Lee a realizat o listă de site-uri web pe serverul CERN. Asta funcţiona bine la începutul anului 1992, când existau doar 26 de site-uri. Până la sfârșitul 1994, aveam deja peste 10.000. Lumea necesita un motor de căutare. Aşadar, astăzi vom vorbi despre istoria lor, vom vedea care a fost primul motor de căutare, cine l-a inventat şi care este în prezent cel mai utilizat motor de căutare.

Motor de căutare

Ce înseamnă motor de căutare?

Un motor de căutare este un program software de preluare a informațiilor care descoperă, parcurge, transformă și stochează date pentru a le prezenta ca răspuns la întrebările utilizatorilor. Pe scurt, intri pe un astfel de program (ex. Google), introduci cuvintele cheie – reţetă de brioşe, de exemplu – iar motorul de căutare îţi găseşte rezultate pentru căutarea ta.

Un motor de căutare este format în mod normal din patru componente: interfața de căutare, crawler, indexer și baza de date. Crawler-ul traversează o colecție de documente, deconstruiește textul documentului și atribuie surogate pentru a fi stocate în indexul motorului de căutare. Motoarele de căutare online stochează, de asemenea, imagini, date de legătură și metadate pentru document.

Memex sau ce a fost înaintea primului motor de căutare

Deşi am mai vorbit despre Memex aici, hai să recapitulăm puţin. Asta ne va ajuta să înţelegem mai bine povestea motoarelor de căutare.

Conceptele de hypertext și de extensie a memoriei își au originea într-un articol publicat în The Atlantic Monthly  în iulie 1945 intitulat As We May Think. În acest articol, Vannevar a îndemnat oamenii de știință să colaboreze pentru a contribui la construirea unui corp de cunoștințe pentru întreaga omenire. El a propus apoi ideea unui sistem de stocare și recuperare a memoriei asociative, practic nelimitat, rapid, fiabil și extensibil. El a numit acest dispozitiv memex.

Vannevar Bush a considerat noțiunea de „indexare asociativă” drept contribuția sa conceptuală cheie. După cum a explicat el, aceasta era „o dispoziție prin care orice element poate fi determinat să selecteze imediat și automat un altul. Aceasta este caracteristica esențială a memex-ului. Procesul de legare a două elemente împreună este cel mai important lucru.”

Toate documentele utilizate în memex ar fi sub formă de copii pe microfilm achiziționate ca atare. Iar în cazul documentelor personale, ar fi transformate în microfilm de către aparatul însuși. Memex ar folosi noi tehnici de regăsire bazate pe un nou tip de indexare asociativă a cărei idee de bază este o dispoziție prin care orice element poate fi determinat să selecteze imediat și automat un altul. Se creează astfel „trasee” personale prin documente legate între ele. Apar așadar noi forme complet de enciclopedie.

Istorie

Primul motor de căutare a fost dezvoltat înainte de Web. „Archie” (prescurtarea de la „arhivă”) căuta site-uri FTP pe internet. Abia în 1995 a apărut un motor care a accesat cu crawlere, a indexat și a clasat site-urile web. Până în 1997, AltaVista era cea mai populară pagină de pe Web. Aceasta gestiona peste 20 de milioane de interogări pe zi.

O serie de alte motoare de căutare au urmat modelul AltaVista. Excite, Infoseek, Lycos și Magellan returnaau toate rezultate bazate pe cuvinte cheie. Înă până în 1998 existau milioane de site-uri web, iar căutarea era îngreunată.

Câțiva studenți din Standford, Sergey Brin și Larry Page, au văzut o oportunitate. Modelul Yahoo! a fost nesustenabil și bazarea pe cuvinte cheie nu a fost suficient de precisă. Dar cum altfel ar putea fi măsurate rezultatele? Brin și Page s-au inspirat din lumea academică. Valoarea unei lucrări academice este judecată după aprobarea lucrării sau de câte ori se face referire la lucrare.

Cum a apărut Google?

Pe hârtie, cele menționate apar ca note de subsol. Pe Web, ele apar ca link-uri. Cei doi studenți au venit cu algoritmul PageRank, clasificând rezultatele în funcție de numărul de linkuri primite, mai degrabă decât de numărul de cuvinte cheie. Un site beta, rulat din garajul unui prieten, a început instantaneu să aducă rezultate mai bune decât motoarele de căutare comerciale. Viitorul Web-ului sosise. Se numea Google.

Realizarea unui motor de căutare mai inteligent este în desfășurare, cu Google în top. Mai întâi a fost căutarea semantică, bazată pe comportamentul anterior. Apoi a fost căutarea socială, bazată pe ceea ce caută prietenii tăi. Acum, cu Google Glass, există căutare augmentată, unde Google poate vedea și auzi, precum și citi.

Motorul de căutare Baidu se menține în China, în timp ce Yandex este în top în Rusia. Google rămâne încă motorul de căutare ales pentru nouă din zece persoane din întreaga lume. Indiferent de viitorul căutării, poţi fi sigur că Google și algoritmul său PageRanks vor rămâne relevante.

Categorii de motoare de căutare

Motor de căutare web

Motoarele de căutare concepute în mod expres pentru căutarea în pagini web, documente și imagini au fost dezvoltate pentru a facilita căutarea într-o mare masă de resurse nestructurate. Acestea sunt proiectate să urmeze un proces în mai multe etape: parcurgerea stocului infinit de pagini și documente, indexarea cuvintelor de tip „buzzword” într-un fel de formă semistructurată și, în cele din urmă, rezolvarea intrărilor/interogărilor utilizatorului pentru a returna rezultate în mare parte relevante și link-uri către acele documente sau pagini din inventar.

Crawl

În cazul unei căutări exclusiv textuale, primul pas în clasificarea paginilor web este găsirea unui „element de index” care ar putea fi legat în mod expres de „termenul de căutare”. În trecut, motoarele de căutare începeau cu o listă mică de URL-uri ca așa-numită listă de bază. Apoi preluau conținutul și analizau legăturile de pe acele pagini pentru a găsi informații relevante, care ulterior furnizau noi legături. Procesul era extrem de ciclic și continua până când se găseau suficiente pagini pentru a fi utilizate de utilizator.

În prezent, se folosește o metodă de căutare continuă. Metoda crawl este o extensie a metodei menționate mai sus. Însă sistemul nu se oprește niciodată din căutat.

Cele mai multe motoare de căutare folosesc algoritmi de programare sofisticați pentru a „decide” când să reviziteze o anumită pagină. Acești algoritmi variază de la un interval de vizitare constant, cu o prioritate mai mare pentru paginile care se schimbă mai frecvent, până la un interval de vizitare adaptiv, bazat pe mai multe criterii, cum ar fi frecvența modificărilor, popularitatea și calitatea generală a site-ului. Viteza serverului web pe care rulează pagina, precum și constrângerile legate de resurse, cum ar fi cantitatea de hardware sau lățimea de bandă, sunt de asemenea luate în considerare.

Viitorul motoarelor de căutare

Este probabil ca motoarele de căutare să utilizeze noi tehnologii pentru a îmbunătăți acuratețea, relevanța și calitatea răspunsurilor oferite. Se vor utiliza tehnologii avansate, cum ar fi inteligența artificială, pentru a îmbunătăți experiența utilizatorilor în viitor. De exemplu, un utilizator ar putea, într-o zi, să poată încărca o fotografie a unui computer pe Google, să întrebe „Este acesta un calculator bun pentru jocuri?” și să primească un răspuns atent și nuanțat.

Este probabil ca Google să continue să păstreze majoritatea pieței. Având în vedere acest lucru, companiile SEO se pot aștepta ca Google să continue să își actualizeze periodic algoritmul principal. Google face acest lucru pentru a împiedica aceste companii să optimizeze conținutul pentru un anumit algoritm.

În viitor ar putea apărea mai multe motoare de nișă pentru a oferi specificitatea și confidențialitatea pe care mulți utilizatori percep că Google nu le are. Utilizatorii ar putea să se orienteze către instrumente de căutare care oferă o confidențialitate sporită sau o calitate mai bună prin indexarea doar a unei părți a internetului.

Unii experți consideră, de asemenea, că utilizarea motoarelor de căutare este în declin. Asta pentru că în viitor mai multe căutări de informații vor avea loc pe alte aplicații și site-uri de socializare, cum ar fi Facebook, TikTok și LinkedIn.

Acesta a fost şi articolul de astăzi. Dacă ţi-a plăcut, nu uita să arunci un ochi pe blog-ul nostru, pentru mai multe articole, mai ales pe categoria Web-ul în 100 de paşi! Mai mult, ne găseşti şi pe TikTok, şi pe Instagram. Pe data viitoare!

Distribuie:

Articole recente

Ai nevoie de ajutor cu website-ul tău?

Completează formularul de mai jos și te vom contacta curând.

Descarcă Ghidul Gratuit! 👀

Află de ce pierzi peste jumătate din clienți. Descarcă acum ghidul despre Importanța Design-ului pe Mobil, complet gratuit.