Názorné vysvětlení rozdílu mezi Google a mnou - Kuličky a míče
Videorozhovor o Novém hledači na zive_cz

projekt_2.jpg
Motto 1: Již 15 let se v hledání na Internetu skoro nic nezměnilo."

Motto 2: Existující hledače hodnotí WWW stránky. Já hodnotím něco jiného."
Update: 28 programů, cca 70000 hrubých a 30000 čistých řádků zdrojáku, 1.5 milionu znaků.
Portál Nový Hlodač (zatím jen ukázky): typy WWW stránek - návštěvnost

Ukázky: domovská stránka - výsledek hledání - další výsledky hledání -
pracovní prostředí - programy - program - robots - unsorting - zrychlování
Technologie: dotazy - dokumenty - WWW odkazy
Soutěž o podíl na zisku z projektu Nový hledač
Média, PR – články, rozhovory, ankety, diskuze
Vášnivé diskuse o Novém hlodači Petra Hejla
Hlodač má konkurenci: MC Hammer také vyvíjí lepší vyhledávač
Něco pro pobavení: MiniHledačBooks - Translator
Trocha reminiscence:
http://www.ceskatelevize.cz/porady/10266615369-den-d-ii-rada/309292320520018-den-d/video/102364

flag_usa_big.jpg


Dobrý den,

toto je projekt o lepším hledání na Internetu, tedy o pořadí nalezených WWW stránek. Již dříve jsem vymyslel nový princip a algoritmus hledání. Nyní pracuji na prototypu (minihledači), který bude dohotoven 31.1.2012.

První verze minihledače je funkční. Je psána kompletně v C#. Funguje ve Windows i na Linuxu. Obsahuje 28 programů,  cca 70000 řádků zdrojového kódu.. O
všem části programů jsou analogické, pouze s menšími obměnami. Odhad počtu neduplikovaných řádků je 30 tisíc. Už mám v kupě i druhou (zrychlenou) verzi. Minihledač spustím 1.11.2011.

Mám pohromadě celou potřebnou investici 1 milion Kč. Na účtu mám zaplaceny investice ve výši 820 tisíc Kč, zbytek se řeší barterem na hardware za procenta na projektu. Děkuji ještě jednou všem 23 investorům (včetně pana hardwaráře) za důvěru.

Na hardware je podepsána smlouva a základní konfigurace je postavena. Minihledač zaindexuje jednorázově pokud možno všechny české stránky plus vybraná anglická klíčová slova ze světového Internetu. Vývoj bude mít dvě poloviny: programování a optimalizace. Programování bude mít tři části: stahování, zpracování, odpovídání. Každá část se bude skládat z analýzy, naprogramování a realizace. Optimalizace bude optimalizace vah kriterií pro hledání.

Moje zvolená konfigurace je: operační systém Linux-Ubuntu, webový server Apache, file system ZFS, programovací jazyky C++ a C# plus .NET (to druhé pro stahovač), databáze vlastní (alternativou je Hadoop). Minihledač programuji sám, s využitím externích konzultací (ohledně operačního systému, detailů stahování, programovacích jazyků, databáze a ohledně instalování některých prostředků na Ubuntu).

Podrobnější informace o projektu jsou níže v dokumentaci a WWW odkazech.

Na projektu „Nový hledač" jsem zatím pracoval 4.5 roku. Základ spočívá v tom, že jsem vymyslel princip a algoritmus hledání na Internetu, který je odlišný od stávajících hledačů (Google, Bing…). Při stanovení pořadí hodnotí stávající hledače WWW stránky, zatímco já hodnotím JINÉ OBJEKTY = tematicky spojené množiny komponent Internetu (WWW stránky, dokumenty, skripty, obrázky, audio, video…). Můj rozlišovací prostor je daleko širší, moje JINÉ OBJEKTY jsou větší než WWW stránky a vzájemně se od sebe liší mnohem více, než WWW stránky. Proto je moje pořadí lepší.

Primárním cílem projektu je ověřit můj algoritmus hledání na prototypu a následně prodat tento algoritmus vhodnému zájemci, nejlépe hledači Bing od Microsoftu (návštěvnost Binga zůstává již rok velmi slabá, takže Microsoft bude muset časem sáhnout k jinému algoritmu). Alternativním cílem, pokud by se můj algoritmus nepodařilo prodat, je realizace nového českého hledače (je zde mezera na trhu, neboť hledání na Seznamu je mizerné, Google se u nás prosazuje velmi pomalu a jiný reálný hledač v ČR prakticky neexistuje). Po získání reputace a návštěvnosti bude toto řešení opět nabídnuto Microsoftu nebo jiné vhodné společnosti.

Pro potenciální investory: již nyní můžete posílat nabídky na investici do Nového českého nebo slovenského hledače.

Zdraví
Ing. Petr Hejl, CSc., Ondrouškova 15, 63500 Brno, tel.: 608 374 535, email:
phejl@lednice.org


Dokumentace, WWW odkazy:


Souhrn - Business plán


Souhrny: technologiebusiness


Klíč - Nepodvádím


Historie (jak jsem na to přišel)


Vysvětlení principu hledání


Grafické vysvětlení principu hledání


Vysvětlení algoritmu hledání


Analogie


Pořadí


Anti SEO spamming


Rozdíl v kvalitě


Příklady:
"cars","Morava", "Mikulov"


Konfigurace hardware


Konfigurace databáze


Rozpočet


Smlouva 1 milion Kč


Smlouva 100 tisíc Kč


Smlouva 10 tisíc Kč


Výklad ke smlouvě


Alternativa „Nový český hledač"


Alternativa - rozpočet


Korespondence s Microsoftem


Názor šéfa fulltextu na Seznamu


Křišťálová Lupa


Foto 1 - Foto 2 - Foto 3 - Foto 4 - Video


Start-up servery -
WWW odkazy


O mně (stručné CV) - Osobní stránky


Vtipy - Nový hlodač - Exo - GGravity


Google


Yahoo


Bing


Seznam

 

 

kristalova_lupa_petr_hejl.jpg kristalova_lupa_petr_hejl_2.jpg
Zdroj fotografií: lupa.cz. Fotografie byly zveřejněny s laskavým svolením společnosti Internet Info, s.r.o.

cimbalova_hudba_2.jpg 
A tady jsou další lidové písničky k poslechu i ke zpěvu.

nahrobni_kamen_of_google.jpg
© Petr Hejl (s výjimkou fotografií z Křišťálové Lupy, fotografie cimbálky a náhrobního kamene of Google).