REFERAT: Motoare de căutare

de Paduraru Andreea

Un motor de căutare este un apelabil program căutător, care accesează Internetul în mod automat și frecvent și care stochează titlul, cuvinte cheie și, parțial, chiar conținutul paginilor web într-o baza de date. În momentul în care un utilizator apelează la un motor de căutare pentru a găsi o informație, o anumită frază sau un cuvânt, motorul de căutare se va uita în această bază de date și, în funcție de anumite criterii de prioritate, va crea și afișa o listă de rezultate (engleză:hit list). Problema nu este de loc trivială, deoarece:

  există deja peste 100 milioane de situri web, sumând în total miliarde de pagini web, distribuite pe tot globul

conținutul acestori pagini nu este static, ci chiar extrem de dinamic (se schimbă frecvent)

răspunsul la o comandă de căutare trebuie să vină repede, în general în mai puțin de o jumătate de secundă, chiar atunci când lista de rezultate conține, să zicem, zeci de mii de pagini web potrivite la criteriile de căutare folosite.

Cele mai utilizate motoare de căutare în iulie 2011 sunt: Motor de cautare Cota de piata, Google 82,7%, Yahoo 6,5%, Baidu 4,7%, Bing 3,7%, Ask 0,5%, Aol 0,4%, Excite 0,0%.

Istoria motoarelor de cautare :

Yahoo – Yet Another Hierarchical Officious Oracle: A fost creat în 1994 (din nou) în campusul Universității Stanford, California de doi studenți (David Filo and Jerry Yang), inițial pentru a putea ține evidența link-urilor WWW cu informații folosite pentru elaborarea lucrării de doctorat. A fost lansat la început sub denumirea de “Jerry and David’s Guide to the World Wide Web” însă a fost redenumit ulterior YAHOO acronim pentru (Yet Another Hierarchical Officious Oracle). Vestea s-a răspândit pe www, astfel încât, în toamna lui 1994 site-ul a fost accesat într-o singură zi de 100.000 de vizitatori. În 1995 s-a fondat Yahoo! Inc. care a ajuns astăzi să fie accesat lunar de peste 350 milioane de utilizatori, fiind al doilea motor de căutare după Google.

Altavista – A view from above: La pătrunderea internetului pe scară largă în România, undeva în anul 1996, cel mai utilizat motor de căutare era Altavista. Lansat pe 15 Decembrie 1995, de către cercetătorii de la Digital Equipment Corporation’s Western Research Laboratory din Palo Alto, California, a furnizat din prima clipă o bază de date indexabilă ce conținea peste 16 milioane de documente. La sfârșitul zilei de 15 Decembrie 1995, peste 300.000 de utilizatori vizitaseră pagina Altavista. După primul an de funcționare Altavista servea peste 19 milioane de cereri de căutare zilnic. Pe parcursul timpului Altavista a patentat foarte multe idei privind căutarea pe INTERNET. În 2003 Altavista a fost achiziționată de Ouverture pentru 140 de milioane de dolari. La sfârșitul lui 2003, Yahoo a cumpărat Ouverture, astfel încât Altavista a sfârșit prin a avea “motorizare” Yahoo.

 Hotbot: Lansat în Mai 1996 de către Wired Magazine, HotBot a devenit în scurt timp un motor de căutare apreciat care avea în spate bazele de date Inktomi, LookSmart și din 1999 Open Directory. Lycos a achiziționat HotBoot în 1998 și pentru patru ani a aplicat tehnici greșite de marketing și de promovare care au dus compania aproape de faliment. Din 2002 a fost relansat, iar în prezent oferă informații pe baza bazelor de date deținute de Google și Ask Jeeves (Teoma) – “motorizare” Google.

Google: Domeniul google.com a fost înregistrat pe 14 Septembrie 1997 de Larry Page și Sergey Brin, doi studenți, atenție tot la Universitatea Stanford,California. Aceștia au avut ideea în 1996 în cadrul unui proiect, să indexeze paginile de Internet nu după numărul de apariții al termenului de căutare în conținutul lor, ci după numărul de legături spre acea pagină provenite de pe alte pagini WWW. Acest lucru, stă de fapt la baza algoritmului PageRank – algoritmul de căutare al Google. Pe baza acestui algoritm, fiecare pagină web poate avea un anumit rang cuprins între 0 (minim) și 10 (maxim). Cu cât rangul este mai mare, cu atât aceasta apare mai repede la o căutare pe WWW. Google Corporation a fost fondată în 1998 și în decurs de 13 ani a ajuns cel mai cunoscut motor de căutare de pe WWW.

Bing: Proprietate a gigantului Microsoft, Bing a fost lansat de către CEO Microsoft, Steve Ballmer pe 28 Mai 2009. Bing a fost mai întâi Live Search după care a fost redenumit MSN Search pentru ca apoi sa devină Windows Live Search. MSN Search a fost lansat în 1998 și a depins până în 1999 de baza de date Inktomi. Din 1999 a avut “motorizare” Altavista. Începând din 2006, MSN Search a devenit Windows Live Search cu “motorizare” Microsoft. În 2009 Yahoo și Bing au încheiat un acord pe 10 ani prin care Yahoo urmează să își schimbe motorizarea astfel încât acesta să devină Microsoft. În schimbul acestui acord, Yahoo obține 88 % din toată publicitatea pentru primii 5 ani.La momentul actual, dupa cum am prezentat mai sus, toate căutările pe WWW sunt motorizate de Google, Yahoo si Microsoft, primele doua tehnologii fiind apărute la Standford University – California.

Excite: A fost creat în 1993 de cinci studenți (Graham Spencer, Joe Kraus, Ben Lutch, Mark Van Haren, Ryan McIntyre și Martin Reinfried) la Universitatea Stanford,California în cadrul unui proiect de curs cu denumirea Architext Software. Devenit Excite, acesta a falimentat în 2001. În prezent 3 dintre fondatori sunt angajați Google, 2 sunt întreprinzători particulari iar ultimul este specializat în jocuri pe calculator.

 Motoarele de cautare se impart in trei categorii :

1.Motoarele care au propia lor baza de date (de ex. Google si AllTheWeb - FAST)

2.Motoarele care folosesc bazele de date ale unor alte motoare (de ex. MSN foloseste serviciile LookSmart si Inktomi)

3.Motoarele care folosesc atit propria baza de date cit si pe cele ale altor motoare (de ex. Yahoo care foloseste baza de date proprie dar si pe cea a motorelor Google, Inktomi (pe care l-a cumparat) si Overture (pe care l-a cumparat).

 Exista si o categorie aparte de situri care nu pot fi numite motoare de cautare in adevaratul sens al cuvintului dar care isi pot dovedi si ele utilitatea. Acestea sunt asa-numitele motoare integratoare (“clustering engines” sau "metasearch engines") si sint reprezentate intre altele de ProFusion, Vivisimo si Dogpile. Daca introducem in caseta de text de pe aceste situri un cuvint sau o sintagma va fi declansata cautarea cu ajutorul a cel putin 5 motoare (de ex. Google, Overture, MSN, AllTheWeb, Altavista, etc.) iar lista obtinuta va fi sortata de motorul integrator si apoi prezentata noua. Acest tip de motoare da rezultate foarte bune si chiar este recomandata folosirea lor.

SURSA:www.wikipedia.com