Závěrečný projekt

V tomto e-learningovém kurzu jsem prošli celým procesem analýzy dat: naučili jsme se používat datový mindset, hledat zdroje relevantních dat, stahovat je a importovat, čistit je, transformovat je a odpovídat s jejich pomocí na své otázky. V závěru jsme si stručně ukázali i jak výstupy našich analýz efektivně komunikovat vizuální cestou - pomocí grafů. Nyní nastal čas si všechno vyzkoušet. Zůstaneme u stejných dat (SČKN) a vaším úkolem bude analyzovat data a vizualizovat výsledky.

1. Kdo vydává nejdražší dětské knihy?

Vaším prvním úkolem je importovat data do Excelu a pomocí kontingenční tabulky zjistit, kdo vydává průměrně nejdražší dětské knihy. Závěrečný úkol je samostatný a funguje následovně: nejprve si zkuste celým procesem projít sami. Pokud se zaseknete, nevzdávejte to a zkoušejte to jinak a znovu. Až potom si můžete své řešení porovnat se záznamem, na kterém stejný úkol řeší náš lektor Tomáš.

Pro správné řešení první části úkolu budete potřebovat jeden nástroj, který jsme si zatím neukazovali - pomůže vám vyfiltrovat v kontingenční tabulce jen ty vydavatele, kteří vydali alespoň jednu knihu v tematické skupině (TS) Literatura pro děti a mládež. Než se podíváte na nápovědu níže - zkuste nejprve hledat sami a googlit. To je totiž velká část práce datového analytika: ví, co s daty potřebuje udělat, a hledá, jak toto co nejefektivněji docílit...

Nápověda: filtrování tematických skupin

Způsob, jak do kontingenční tabulky přidat filtr podle dalšího sloupce, se jmenuje Vložit průřez a najdeme ho v horním panelu, na kartě Analýza kontingenční tabulky. V něm vybereme sloupec TS a pak z nabízených Tematických skupin jen tu s literaturou pro děti a mládež. Pokud se to nepovedlo, nezoufejte, ve videu níže celý postup uvidíte.

Bez popisku

Záchytný soubor: CSV a XLSX pro závěrečný úkol

sckn_tistene-knihy-2020-k-vizualizaci.csv
CSV soubor připravený k vizualizaci v modulu 7.
.csv 2 MB
sckn_tistene-knihy-2020-k-vizualizaci.xlsx
Ten stejný CSV soubor již naimportovaný do MS Excel k přímé práci.
.xlsx 1 MB

Bez popisku

Řešení: Kdo vydává nejdražší dětské knihy?

Společně s lektorem Tomášem zkusíme splnit zadaný úkol. Vytvoříme si kontingenční tabulku se sloupci Nakladatel a Cena a pak ji "prořízneme" Tematickou skupinou. Nemusí to být samozřejmě jediná správná cesta splnění úkolu...

2. Jak to zvizualizovat?

Tak tabulku s analýzou průměrných cen máme, teď už nás čeká jen druhá a poslední část úkolu: data vizualizovat pomocí grafu. Je na vás, jaký graf vyberete a jak si s vizualizací poradíte - to důležité sdělení je ale ukázat, kdo patří mezi průměrně nejdražší nakladatele dětských knih podle dat SČKN. Nezapomeňte také v závěru do grafu dodat informaci o zdroji dat a o limitech, které tato data mají, resp. úpravách, která jste s nimi provedli. Poté si můžete své řešení porovnat se záznamem, na kterém stejný úkol řeší náš lektor Tomáš.

Záchytný soubor: průměrné ceny dětských knih podle vydavatelů (XLSX)

sckn_tistene-knihy-2020_tabulka-prumer-cena.xlsx
Tabulka v Excelu obsahující průměrné ceny dětských knih podle vydavatelů. Připravena k další vizualizaci.
.xlsx 20 kB

Bez popisku

Řešení: Jak to zvizualizovat?

Tomáš se vydal cestou sloupcového, resp. pruhového grafu. V datech se rozhodl provést pár změn - odstranil nakladatele, kteří neuvádějí cenu, a rozhodl se také zařadit jen ty, kteří se na dětské knihy a literaturu pro mládež zaměřují cíleněji, tj. mají více než určitý počet vydaných knih v této tematické skupině. Tomášovo řešení není nutně jediné správné, můžete ho ale porovnat s tím svým: postupovali jste podobně?

Shrnuto a podtrženo...

Jsme v úplném závěru kurzu datové gramotnosti. Děkujeme, že jste to s námi zvládli až do konce a doufáme, že byl pro vás tento kurz přínosný. Nejvíc ale doufáme, že z něj odcházíte s datovým mindsetem a že nové dovednosti uplatníte ve své každodenní praxi. Pokud máte jakékoliv dotazy nebo připomínky k obsahu kurzu, našli jste v něm chybu nebo jste se na nějakém místě beznadějně ztratili, pište na marek@kisk.cz. Díky!

⯇ Osnova kurzu

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info