Projekt „Nový hledač“

Vysvětlení mého algoritmu hledání

 

Postup:

1.

Stahuji informace o všech komponentách WWW stránek (texty, obrázky, videa...).

2.

Z tohoto komplexu vytvořím matematickou konstrukcí jisté množiny =  JINÉ OBJEKTY.

3.

Tyto JINÉ OBJEKTY hodnotím KVANTITATIVNĚ i KVALITATIVNĚ.

4.

Z tohoto hodnocení odvozuji pořadí WWW stránek (odkazů - linků) pro hledání.

 

Poznámky:

 

Pod pojmem klasický algoritmus hledání se skrývá přibližně toto:

1. Kolikrát se dané klíčové slovo vyskytuje na WWW stránce.

2. Velikost WWW stránky.

3. Počet odkazů z WWW stránky a na WWW stránku.

...

Těch kriterií (bodů) má algoritmus Google cca 108 (podle některých zmínek až 200).

V každém bodě se vyskytuje pojem "WWW stránka", kterou tento  algoritmus hodnotí.
Mimoto se jedná pouze o rozvedení následujících 7mi kriterií: velikost stránky, počet výskytů daného klíčového slova na stránce, linky ze stránky a na stránku, WWW adresa (zda je to doména, pokud ne tak její úroveň, koncovka domény, IP adresa, věhlas - Wikipedia apod., klíčová slova v adrese), stáří stránky a domény, frekvence změn stránky, počet prokliků na stránku z hledače.

 

Pod mým pojmem JINÉ OBJEKTY se skrývá termín na pomezí počítačů a  Internetu,který je používán cca 20 let, s pevně definovaným obsahem.

 

Co jsem udělal:

Uvážil jsem klasický algoritmus hledání. Uvážil jsem termín JINÉ  OBJEKTY. Propojil jsem to dohromady.

Jinak řečeno, do klasického algoritmu hledání jsem místo hodnocení  "WWW stránek" dosadil hodnocení "jiných objektů".

Ještě jinak řečeno, podíval jsem se na hledání z jiného úhlu  pohledu,než to dělají existující hledače (Google, Yahoo, Bing...).

Teďka to vypadá jednoduše, ale trvalo mi 3 roky, než jsem na to přišel.

 

Můžete si to představit tak, že do textového editoru (Word apod.)  natáhnete textový popis klasického algoritmu hledání, a pak zvolíte  funkci NAHRAĎ WWW stránka / jiný objekt.

 

V mém algoritmu hledání je cca 30 kriterií, aby se daly relativně  rozumně optimalizovat váhy těchto kriterií.

 

Tady mam ješte malé, ale důležité dovysvětlení:

 

Při odpovědi hledače na daný dotaz mají být úplně nahoře relevantní  odpovědi na ten dotaz, tedy VELKÉ a KVALITNÍ stránky, které dotazu  odpovídají.

 

Teprve za nimi mohou být méně obecné stránky, ovšem pořád na dané téma.

 

Např. pro klíčové slovo "Mikulov" mají být vpředu obsáhlé a dobré  KOMPLEXNÍ stránky o tom městě a okolí, které obsahují: památky,  přírodu, služby, atrakce, pořádané akce ve městě - novinky, informace,  fotky, audio, videa, články, blogy, diskuze...

 

Teprve pokud se takové stránky vyčerpají, mohou následovat méně obecné  stránky,

např. o kompletním ubytování v Mikulove, všech restauracích apod.

 

Teprve pokud se i tyto stránky vyčerpají, mají následovat informace o  jednotlivostech - Zámek Mikulov, Kozí Hrádek,Hotel Bonsai, Restaurace  Pod radnicí, Vinný sklep U mušketýra atd.

 

Tohle je klíčové a doufám, že také srozumitelné.

 

Na tom je postaven můj algoritmus hledáni, právě takově pořadí, jaké  jsem popsal, by měl dávat.