Základní operátory
Systém podporuje základní logické operátory AND, OR, NOT (alternativní zápis operátorů: &&,|| a !). Defaultním operátorem je AND. Hledání digitální televize je tedy ekvivalentem digitální AND televize. Slovní spojení můžete vyhledat s pomocí uvozovek. Pokud tedy zadáte „Rychlé mobilní připojení“, dostanete jen ty dokumenty, kde se tato slova vyskytují těsně za sebou. Výrazy můžete seskupovat i pomocí závorek pro určení priority operátorů – (mobilní OR rychlé) AND připojení. Pozor, logické operátory musí být zapisovány velkými písmeny, jinak je systém bude považovat za hledaná slova.
Systém nehledí na velikost písmen – zadání Český telecom je to samé jako český telecom. Rovněž je možné rozlišit, zda chcete hledat s diakritikou či bez ní pomocí přepínače na stránce pokročilého hledání.
Pokročilé operátory
+slovo
Znamená, že slovo musí být ve výsledku obsaženo. Použitím ceny +domény tedy říkáte: vrať mi články, kde budou ceny, ale musí tam být zároveň zmíněny domény.
-slovo
Znamená, že slovo nesmí být ve výsledku obsaženo. Dotaz vysílání -televize značí, že hledáte informace o vysílání, ale zároveň nechcete texty, kde se zmiňuje televize.
Žolíci
Znaky * a ? fungují jako zástupní žolíci. Hvězdička zastupuje libovolný počet znaků – vyhledáva* najde texty se slovy vyhledávač, vyhledávače i vyhledávačů, TCP*IP najde TCP/IP i překlepové TCPIP. Otazník zastupuje právě jeden znak – disku?e najde texty se slovem diskuze i diskuse.
Vyhledávání v nadpisech a perexu
Pomocí konstrukce title:"" můžete hledat pouze v nadpisech článků, např. title:„adsl modem“ vrátí pouze texty, kde je spojení adsl modem v nadpisu. Hledání perex:„webdesign“ pak vrátí jen texty, kde se v perexu píše o webdesignu. Můžete hledat i pouze v těle článku – text:„připojení“.
Zvýšený důraz na slovo
Pomocí modifikátoru ^ můžete zvýšit váhu hledaného slova, např. dotazem rychlost9 připojení říkáte, že vás zajímají dokumety o rychlosti připojení a důraz kladete na slovo rychlost. Výpis výsledku pak bude seřazen jinak než při použití dotazu rychlost připojení. Defaultní hodnota důrazu na slovo je 1, jakékoliv číslo větší než 1 říká, že na slovo kladete větší důraz než na ostatní slova (čím je číslo vyšší, tím vyšší důraz na slovo kladete).
Fuzzy vyledávání
Pomocí modifikátoru ~ můžete aktivovat fuzzy vyhledávání, tj. hledání podobných slov – padák~ najde i panák či padáky. Stupeň podobnosti můžete určit na stupnici 0 až 1 (default je 0.5) – padák~0.3 znamená, že chcete i vzdáleně podobná slova, naopak padák~0.9 znamená, že chcete pouze velmi podobná slova.
Proximity vyhledávání
Položením dotazu „spolehlivý webhoster“~4 vyhledáte dokumenty, kde jsou mezi slovy „spolehlivý“ a „webhoster“ maximálně čtyři další slova.
Specifické znaky
Pro hledání znaků + – & | ! ( ) { } [ ] ^ " ~ * ? : \ před ně musíte přidat obrácené lomítko.
Stop-words
Některá slova systém neindexuje, protože se vyskytují v (téměř) každém článku a jejich vyhledání nemá na výsledek prakticky žádný vliv. Tato slova se označují jako stop-words a jsou to zejména spojky, předložky apod.
Nyní se již můžete vrátit na stránku vyhledávání a nabyté informace vyzkoušet v praxi.
Vyhledávání je realizováno za pomoci knihovny Lucene.