Projekt „Nový Hledač“
Názor Dušana Janovského, šéfa fulltextu na Seznamu

Těžko hodnotit něco, o čem toho není moc známo. Mám přirozenou úctu k lidem, kteří se snaží něco dělat místo toho, aby jenom remcali, takže si pana Hejla vážím. Jako investora by mě rozhodně nepřesvědčil. Je ale možné, že na něco opravdu přišel.

 

Český web zná případy, kdy jeden jediný člověk zásadně přestavěl situaci na poli vyhledávačů. Třeba Michal Illich, Martin Mareš, Ivo Lukačovič. Takže nemožné to není, ovšem tím, jak je trh dnes nasycený, se pravděpodobnost úspěchu snižuje.

 

Také jsou známy případy, kdy jeden nebo pár geniálních nápadů změnilo globální situaci ve vyhledávačích. První verze Google prohledávala titulky a řadila podle PageRanku , což už samo o sobě byla bomba. Je skutečně možné, že pan Hejl přišel na něco nového. Je vlastně pravděpodobnější, že s průlomovým nápadem přijde někdo mimo současné týmy vyhledávačů, už jenom protože mimo týmy vyhledávačů je mnohem více chytrých lidí uvnitř těchto týmů.

 

Pravděpodobnost, že se panu Hejlovi podaří vytvořit komerčně úspěšný vyhledávač, je mizivá. Ale cesta, kterou zvolil, je v zásadě správná: chce z prvotní investice naprogramovat prototyp a ten testovat. Tam je ovšem pravděpodobnost úspěchu vysoká, jenom není moc jasné, co bude potom. Ono není těžké napsat prototypy, které hledají extrémně dobře, protože prototypy zpravidla neřeší výkon. Mohou si například dovolit hledat na víc průchodů, mohu mít vysoké latence, random přístup na disk apod. Když se ale potom prototyp přepisuje do produkce, tak začíná ta pravá sranda. A nad úrovní cca 120 miliónů dokumentů začíná s běžnými přístupy peklo. Když se kope studna, první metr je snadný. Vykopat devadesátý metr je šílená dřina.

 

Jasně, že je možné hodnotit jiné věci než stránky. Třeba sajty, odstavce, dotazy, tematické třídy, streamy dotazů, clickstreamy, slova, věty, n-gramy atd. Ovšem poskytovat odpovědi bez prokliku na cílové *stránky* je nepochopení role dnešního vyhledávače -- totiž dostat uživatele co nejrychleji pryč.