Kde hledat… Obvyklé i méně obvyklé vyhledávací stroje

Nejvyužívanějšími vyhledávači současnosti jsou nesporně Google (drží okolo 90 % trhu), následuje Bing a pak lokální služby jako čínské Baidu či český Seznam. Tyto vyhledávací stroje jsou velice dobré v tom, že jsou všestranné a umožňují uspokojit základní vyhledávací potřeby. Pokud chcete vědět, kolik hrála Sparta se Slávií nebo kdy byla založena Karlova univerzita, jde o nástroje, které vám poskytnou relevantní a rychlé informace (čínské Baidu nyní ponechme stranou s ohledem na politicko-etické aspekty jeho provozu). Přesto tyto vyhledávače mají dva limity, se kterými je třeba se nějak vypořádat. Kvůli tomu, že jsou obecné, je náročné v nich hledat jemnocitné nebo speciální informace – i přes dobře zvolenou strategii vyhledávání jde o proces, který může vypadat jako hledání v kupce sena. A současně – některé věci nelze najít, protože jejich potřeba je natolik okrajová (nebo způsob zveřejnění tak neobvyklý), že nedává smysl jimi „zatěžovat“ všechny uživatele.

Bez popisku

Na tomto místě bychom se rádi – selektivně – podívali na některé vyhledávače, které jsou (v tom či onom ohledu) neobvyklé a mohou rozšířit repertoár nástrojů, kterými uživatel může dospět k relevantním informacím.

Pokud hledáme alternativy ke klasickým vyhledávačům, tak jistě stojí za pozornost DuckDuckGo, který využívá vyhledávání od Google, pečlivě však chrání soukromí hledajícího, takže výsledky jsou méně personalizované a nelze je užít pro cílení reklamy. Ecosia slibuje, že 80 % svých příjmů věnuje na ekologické projekty, takže projekt v současné době zaplatí vysázení více než 150 milionů stromů. Ocean Hero slibuje za každých pět vyhledávacích dotazů jednu recyklovanou láhev odstraněnou z oceánu, ale jeho využití není úplně nejjednodušší.

Nástroje pro každého…

Pokud hledáte hudbu, tak do SoundHound stačí zabroukat nebo zazpívat kousek melodie a nabídne nabídku možných odpovědí, podle toho, jak jste hudebně nadaní. Podobně orientovaným nástrojem je mobilní vyhledávač Shazam, umožňující rozpoznat píseň, která právě hraje v rádiu, na ulici nebo třeba jako podkres na YouTube. Pokud potřebujete vyhledávat zvuky obecně, které byste rádi dále využili, pak by vaší pozornosti neměly uniknout repozitáře, jako jsou Freesound, Freesoundeffects, Findsounds či Soundrangers.

U kulturních artefaktů je nutné zmínit Europeanu s více než 57 milióny digitálních objektů, z nichž velká část je volně k užití. Tato služba se stará o Evropské kulturní dědictví tak, že ho digitalizuje a zpřístupňuje spolu s dalšími funkcemi široké veřejnosti. Její americkou variantou je archive.org. Na něm je vůbec nejzajímavější WaybackMachine, tedy webový stroj času – potřebujete zjistit, jak vypadala nějaká webová stránka v historii? Pak právě toto je to správné místo. Mimo to na něm ale nalezneme například archiv počítačových her, fotografií, knihovnu, videa a mnoho dalšího. Jde skutečně o komplexní digitální archiv. Více produktově orientovanou službou, ale s velice pěkným rozhraním a mnoha funkcemi je Google Arts and Culture, kde najdete digitalizovaná umělecká díla (s velice pěkným a originálním vyhledáváním) a celé galerie, které je možné pomocí StreetView projít.

Bez popisku

Pokud jde o koncepci samotného vyhledávání, tak nelze nezmínit WolframAlpha, který místo odkazů na další zdroje jako běžný vyhledávač vrací samotné konkrétní informace a data, dokáže nad nimi provádět analýzu, lze v něm pracovat s funkcionálním programováním nebo výpočty. Základní myšlenkou tohoto nástroje je, že všechny informace musí být dostupné hned v jeho prostředí.

Pokud potřebuje člověk nalézt fotky, které poslouží jako ilustrace třeba k webům nebo do prezentací, může využít Unsplash, Pixabay, PikWizard, Gratisography, Pexels či StockSnap.io. Ikonky je pak možné najít třeba na Flaticon, IconArchive a icons8. Na samotné vyhledávání obrázků lze využít Google (umí filtrovat snímky i podle licencí), ale také další nástroje. TinEye Reverse Image Search umožní vyhledávat místa, na kterých se vyskytl určitý obrázek v minulosti, což se skvěle hodí pro odhalování různých manipulací a podvodů se snímky. Pro vyhledávání obrázků pod otevřenou licencí lze využít Openverse, případně lze využít také vyhledávače, jak jsou Bing Image Search nebo Yahoo Image Search.

Z méně obvyklých informačních zdrojů můžeme doporučit Katastr nemovitostí, který umožňuje zjistit, komu patří který pozemek nebo nemovitost. Český statistický úřad pak agreguje statistická data za Českou republiku, evropský kontext může dodat Eurostat.

Pokud vyhledáváte kurzy, neměli byste minout Classcentral, což je pravděpodobně největší vyhledávač online kurzů vůbec, ale dobrá vyhledávání nabízejí také jednotlivé platformy, u kterých máme dopředu dané preference, proč volíme právě ji.

Bez popisku

…intelektuála

Bez popisku

Existuje řada nástrojů, které slouží k vyhledávání, ale mají více akademické či intelektuální zázemí. První kategorií mohou být například vyhledavače knih. The World Digital Library spravuje kongresová knihovna a UNESCO a najdeme zde relativně nové knihy i digitální verze tisíce let starých částí písemné kultury. Open Library je součástí Archivu a funguje jako knihovna – knihy, které nejsou volně dostupné, mají omezený počet stran, který si lze za den přečíst. Velice dobře zde funguje fulltextové vyhledávání. UDL knihovnu využije člověk tehdy, když hledá knihy v hindštině, čínštině nebo arabštině. Služba, kterou zná pravděpodobně skoro každý, je Google Books, jehož výhoda je dobré vyhledávání a obrovská databáze knih, zásadními problémy pak omezené náhledy nebo velice nepohodlné čtení. V našem výčtu nemůže chybět ani knihovna moderních digitálních dokumentů Scribd nebo již ukončený projekt digitalizace evropské klíčové literatury Gutenberg.

Z českých zdrojů je třeba začít portálem Knihovny.cz. Ten sdružuje velkou část českých knihovních katalogů, v nichž dokáže vyhledávat. Lze tak snadno zjistit, která knihovna v našem okolí disponuje rukopisem, který aktuálně potřebujeme. Kramerius5 nabízí více než 9 miliónů digitalizovaných stran především starších tisků. Nejstarší dokumenty pak najdete v Manuscriptoriu.

Česká digitální knihovna je vyhledávač, ze kterého se dostanete nejen ke všem českým digitalizovaným publikacím (teoreticky), ale na jedno kliknutí si můžete procházet také rukopisy, staré mapy nebo různá periodika. Část je dostupná online, část jen v knihovnách. Pro vyhledávání beletrie v digitální podobně pak poslouží MKP.

Užitečné pro práci na univerzitě jsou vyhledávače tzv. šedé literatury, tedy publikací, které nějak vycházejí, ale v žádném obchodě nebo národní knihovně je nenajdete. K těmto účelům slouží NUŠL – Národní uložiště šedé literatury. Do stejné kategorie spadají také vyhledávače diplomových prací Thesis.

Bez popisku

Základem vědecké práce jsou samozřejmě vyhledávače akademických publikací. Masarykova univerzita k tomuto účelu nabízí Portál elektronických informačních zdrojů MU, který je v češtině asi nejpečlivějším, největším a nejlépe zpracovaným seznamem elektronických informačních zdrojů. Na téže univerzitě lze využít také tzv. Discovery služby od Ebsco, což je vyhledávač ve všech zdrojích, které má univerzita nakoupené.

Z hlediska akademického vyhledávání jsou nejdůležitějšími místy pro vyhledávání Web of Science a Scopus, o kterých bude podrobněji řeč v další kapitole, stejně jako o Google Scholar. Asi nejznámějšími alternativami k němu jsou SemanticScholar, který se snaží vytvářet soubory spolu souvisejících prací na základě referencí ve vyhledaném dokumentu. Connected papers se snaží ukázat také vazby mezi dokumenty, ale činí tak na základě vizualizací, což umožňuje modifikovat vyhledávací strategie. Jako vyhledávač lze využít i Researchgate, Academia.edu či Crossref.

Odborné databáze – WoS a Scopus

Pro vědeckou práci existují dvě prestižní vědecké databáze, které by měl umět ovládat každý akademik – Web of Science a Scopus. Obě pracují na velice podobném principu. Vědecká vydavatelství na celém světě usilují o to, aby jejich časopisy, knihy či sborníky byly v těchto databázích indexovány. Neumožňují tedy přímo přístup k jednotlivým textům, ale pouze říkají, jaké výsledky jsou – podle jejich kritérií – pro daný vyhledávací dotaz relevantní. Dokumenty zařazené do databáze mají obecně vyšší prestiž, jsou více citované a stát za ně vědeckým institucím vyplácí peníze. Pro jejich plné využití je nutné využít institucionální (nebo jiné) přihlášení do databází, a pokud chce člověk také stahovat rovnou nalezené texty, vyplatí se pracovat s VPN.

Pokud například chceme vytvářet přehledovou studii nebo systematický přehled literatury do nějakého textu (typicky do diplomové práce, vědeckého článku), pak nebudeme daný fenomén hledat na Google, ale právě na jedné z těchto databází.

Bez popisku

Vyhledávání je založené na principu přísné kategorizace, takže kromě vyhledávacího dotazu (například „artificial AND intelligence“, který se může nacházet v polích název, abstrakt a klíčová slova) můžeme provádět různá zpřesňování. Třeba chtít jen články vydané za poslední dva roky (co se v dané oblasti zkoumá), omezení na vědecké články v časopisech (jsou většinou nejpřínosnější), anglicky psané texty (jiný jazyk neumíme) a třeba na společenské vědy (nezajímá nás programování, ale společenské dopady) a geografickou oblast (třeba nás bude zajímat indický diskurs). Tímto způsobem jsme snížili počet nalezených textů na 336 z původních více než 439 tisíc výsledků.

Touto cestou si tedy můžeme vymezit velice přesnou a jasnou oblast, ve které nás zajímá, co se v daném tématu bádá. Takové filtrování by bylo například v Google nebo v Google Scholar extrémně obtížné. Výsledky je možné řadit podle relevance nebo podle citovanosti, což se může také v určitých situacích hodit.

Tyto databáze tak před nás staví dvě výzkumné výhody – disponují souborem dokumentů, které jsou (v průměru – problémem je jistě predátorství) vysoce nadprůměrné, relevantní a současně je možné je dobře omezit. Věda se většinou zaměřuje na detail. Pokud uvažujeme vyhledávací strategii, zde téměř vždy volíme postup ořezávání výsledků. V ideálním případě máme na výstupu tolik textů, které dokážeme přečíst a zpracovat.

Velice užitečné jsou ještě dvě funkce, o kterých bychom se rádi zmínili:

Analýza výsledků: obě databáze umožňují provádět analýzu výsledků, takže lze díky jednomu kliknutí například vidět, v jakých zemích se danému problému věnují, v jakých se objevuje tématech a jak se mění jeho obliba v čase. To všechno jsou důležitá data do začátku, pokud hledáme, jakým způsobem k problematice vůbec přistoupit. Tato analýza současně umožňuje identifikovat nejdůležitější autory, na které je možné se zaměřit.
Export výsledků: export výsledků může být dobrý na dvě věci. Buď můžeme exportovat bibliografické záznamy, které překlopíme do citačního manageru, což nám může velice usnadnit práci, nebo lze exportovat například abstrakty (případně reference, klíčová slova atp.) stovek dokumentů a nad nimi provádět nějakou formu lexikální analýzy.

Bez popisku

Tyto dvě databáze se podílejí na hodnocení časopisů a určování jejich kvality. Myšlenka je taková, že čím je časopis více citovaný, tím vyšší je jeho hodnocení a společenská relevance. Časopisy se podle tohoto systému řadí u Scopus do kvartilů (Q1 je nejlepší čtvrtina časopisů v dané vědní oblasti, Q4 nejhorší čtvrtina) a je jim přiřazováno Cite Score říkající, kolik citací indexovaných ve Scopus během poslech čtyř let získal průměrný článek v časopise. Přehled časopisů a jejich kvartily zobrazuje velice pěkně SciMago.

Jiný systém volí Web of Science, který je obecně považovaný za prestižnější. Ten rozděluje časopisy na ty, které mají přiřazený impakt faktor (průměrnou citovanost článku v konkrétním časopise během posledních pěti let), a na ty, které jsou zařazené jen v Emerging Sources Citation Index, takže nemají přiřazený IF. Ty, které jej mají přiřazený, jsou pak opět děleny do kvartilů jako v případě Scopus. Společnost ale postupně přechází na metriku Journal Citation Indicator (JCI), která hodnotí už všechny časopisy a současně se snaží o normování podle oboru. Přehled časopisů ve WoS je také k dispozici.

Významné jsou však mnohé další databáze, jako jsou EBSCO, SpringerLink, ProQuest, Taylor&Francis, Science Direct. Důležité jsou pro vás také vaše oborové databáze, jako je např. pro anglisty a amerikanisty Literature Online, která obsahuje texty z anglické a americké literatury, či pro pedagogy ERIC.

Bez popisku