Projekt „Nový hledač“

Jak jsem na to přišel aneb Historie mého vynálezu

Před cca 10 lety jsem se vrátil (hlavně ze zdravotních důvodů) z Kanady, s určitou nevelkou částkou v dolarech, a hledal jsem v České republice nový business pro mne. Jedna z věcí, která mne napadly, bylo spojení Internetu a turistiky na Jižní Moravě (Lednice a okolí). Internet jsem již tehdy dělal asi 10 let, po Jižní Moravě jsem se toulal asi 25 let. Padlo tedy rozhodnutí, že budu dělat Weby o Jižní Moravě a souvisejících tématech (víno, kocovina, lidová hudba apod.), firemní akce apod.

Na začátku jsem se samozřejmě rozhlížel, jak to na Internetu v těchto oblastech vypadá, jak si stojí konkurence, jaký je prostor se prosadit. Tedy jsem potřeboval hodně hledat na Internetu podle různých klíčových slov. A tehdy jsem zjistil, že to s kvalitou hledání na Internetu není zdaleka tak dobré, jak by to mělo být, a to včetně Google. Udělal jsem si malý soukromý odhad a zjistil jsem, že cca 30 procent WWW odkazů je v Google špatně umístěných. Tento odhad jsem později doplnil rozsáhlou statistikou na 100 klíčových slovech a tento odhad potvrdila po 4 letech také studie City Group.

Poté mne napadlo, že by se dalo hledání na Internetu zlepšit, vymyslet něco nového a lepšího, než používají stávající hledače (Google, Bing…). Konkrétně jsem si položil otázku, jak změnit, zlepšit stávající algoritmy hledání (tzv. klasický algoritmus). Nejprve jsem si prostudoval popis klasického algoritmu hledání (cca 108 kriterií), ale nic mne nenapadlo. Poté jsem postupně vytvořil 21 WWW serverů a vytipoval si cca 100 klíčových slov, obecných i konkrétních (cestování, turistika, víno, hudba, ženy, koně, vtipy, Lednice, Lednicko-valtický areál…). Pořadí podle těchto klíčových slov jsem sledoval na 6ti hledačích (Google, Yahoo, Live Search, Seznam, Centrum, Atlas). Nesledoval jsem jen moje WWW servery, ale celkem cca 1000 WWW stránek (výhodou u mých WWW serverů bylo to, že jsem mohl měnit jejich vlastnosti). Sledoval jsem změny pořadí na hledačích v souvislosti se změnami WWW stránek a snažil se přijít na to, čím to je, že je v hledačích velký počet stránek špatně umístěn. Celkový počet sledovaných WWW odkazů byl cca (klíčová slova krát WWW odkazy na první nalezené stránce krát počet hledačů) 100 x 10 x 6 = 6 tisíc. Po 3 roky jsem na nic nepřišel…

Až v okamžiku, kdy jsem to už vzdával, mne napadlo podívat se na hledání z jiného úhlu pohledu. Nejprve jsem zkusil absolutně preferovat jen 1 kriterium hledání, tedy velikost stránky. Ale to jsem vzápětí odmítl, neboť to bych preferoval jen velké WWW stránky, tedy kvantitu před kvalitou. Naštěstí jsem tu myšlenku úplně nezavrhl a po cca 2 dnech mne napadlo, udělat z tohoto jednoho kriteria princip hledání a doplnit hodnocení kvantity také hodnocením kvality. To jsem vymyslel za další cca 2 dny. A další 2 dny mi trvalo vymyslet, jak tento nový princip hledání zařadit do základních kriterií hledání. Tak jsem nový princip hledání (tedy použití množin) vymyslel v 6ti dnech, po cca 3 letech neúspěšného přemýšlení.

 

Další rok mi trvalo vypracovat toto: algoritmus hledání, tedy jak konstruovat množiny z WWW stránek a jiných objektů, další kriteria hledání včetně počátečních vah kriterií, algoritmus minihledače pro praktické ověření, metodu porovnání výsledků hledání různých hledačů, dokumentace a strategie projektu.

Další rok jsem hledal investory.


Další rok jsem realizoval prototyp.

Nyní se snažím můj algoritmus prodat.


Projektu jsem dosud věnoval s přestávkami cca 10 roků práce, z toho v prvních 3 letech half time, při realizaci prototypu 1 rok full time.