O knize

Kniha Big Data a NoSQL databáze má tři hlavní cíle: vysvětlit pojem Big Data, představit svět NoSQL databází a objasnit jeho souvislost s Big Data. Rozhodli jsme se ji napsat, protože zatím žádná ucelená publikace na dané téma v češtině neexistovala.

Knihu jsme rozdělili do tří částí. V první části vysvětlujeme fenomén Big Data a principy distribuovaného zpracování dat. Ve druhé představujeme několik typů databázových systémů označovaných jako NoSQL databáze. Poslední část knihy přináší přehled dalších nových typů databázových systémů, popisuje pokročilejší aspekty distribuovaného zpracování dat a nabízí přehled dalších souvisejících technologií.

Na první pohled různorodý autorský kolektiv spojuje právě dlouhodobý zájem o oblast zpracování dat. Irena Holubová a David Novák působí v akademickém prostředí. Big Data a související technologie vysvětlují v širších souvislostech. Přinášejí srovnání s tradičními technologiemi a ukazují, jak fenomén Big Data ovlivnil přístup ke zpracování dat a vývoj databázových systémů. Jiří Kosek se ve své praxi i v této knize věnuje zpracování strukturovaných dat, formátům pro jejich ukládání a možnostem dotazování. Karel Minařík sleduje vývoj NoSQL databází od jejich počátku a aktivně se ho účastní. Knihu obohatil zejména o cenné postřehy z praxe.

Do knihy se promítají dlouholeté zkušenosti autorů z výuky kurzů zaměřených na zpracování dat, Big Data a NoSQL databáze. Látka byla Irenou Holubovou zpracována pro jednosemestrální kurz v informatické sekci MFF UK, který vznikl v roce 2012 a dnes je povinně volitelnou součástí magisterské výuky. Obdobný kurz vytvořil David Novák v roce 2014 na FI MU v Brně. V roce 2016 bude kurz v upravené podobě Irenou Holubovou vyučován i na FEL ČVUT. Studentům uvedených i obdobných kurzů bude kniha sloužit jako studijní opora.

O autorech

Doc. RNDr. Irena Holubová, Ph.D. se habilitovala v roce 2014 v oboru informatika na MFF UK v Praze, kde v současné době působí jako docent na Katedře softwarového inženýrství. Současně externě působí na Katedře počítačů FEL ČVUT. Je autorkou více než 80 původních článků, které byly publikovány na mezinárodních konferencích a v impaktovaných časopisech, z oblasti analýz reálných dat a operací, odvozování XML schémat, XML benchmarkingu, generování testovacích dat a efektivní propagace změn v komplexních systémech týkajících se převážně semi-strukturovaných dat. Čtyři z nich získaly významná mezinárodní ocenění. Je spoluautorkou knihy Technologie XML vydané v roce 2008 v nakladatelství Grada, která v tomtéž roce získala Cenu děkana MFF UK za nejlepší monografii. V rámci svého pedagogického působení (spolu)vytvářela na MFF UK a FEL ČVUT předmět Technologie XML a Pokročilé aspekty a nové trendy v XML. V nedávné době vytvořila nový předmět Big Data management a NoSQL databáze. Na tyto oblasti také zaměřuje vedené bakalářské, diplomové a dizertační práce. Více informací je možné nalézt na stránce http://www.ksi.mff.cuni.cz/~holubova/.

Ing. Jiří Kosek již více než 15 let poskytuje školení a konzultace v oblasti webových a XML technologií. Celá generace tvůrců webu vyrostla na jeho knížkách o HTML a PHP a je i autorem řady článků vydaných jak v ČR, tak v zahraničí. Na půdě Vysoké školy ekonomické v Praze vytvořil a učí předměty zaměřené na webové technologie a XML. Ve svém volném čase spolupořádá a programově zajišťuje konferenci XML Prague. Jirka se podílí na tvorbě a údržbě důležitých standardů v několika organizacích – zejména W3C, OASIS a ISO a přispívá do několika open source projektů. Více se o jeho aktivitách můžete dozvědět na jeho stránkách http://www.kosek.cz/ a http://xmlguru.cz/.

Mgr. Karel Minařík je webový designér a vývojář. Vystudoval filosofii na FF UK. Věnuje se programovacímu jazyku Ruby, využití nerelačních databází a vizualizaci dat. V současnosti pracuje pro společnost Elastic. Žije v Praze. Více informací naleznete na webových stránkách http://karmi.cz.

RNDr. David Novák, Ph.D. získal doktorát z informatiky v roce 2008 na Fakultě informatiky MU v Brně, kde nyní pracuje jako vědecký pracovník. Ve svém výzkumu se věnuje zejména technikám pro podobnostní vyhledávání, vyhledávání v multimédialních datech a distribuovaným datovým strukturám. Pracoval na více než deseti národních a evropských výzkumných projektech a je autorem třiceti publikací na mezinárodních odborných fórech. V roce 2014 zavedl na FI MU předmět o NoSQL databázích. V roce 2015 získal Fulbrightovo stipendium na semestrální pobyt na University of Massachusetts Amherst v USA. Více informací naleznete na jeho stránce http://disa.fi.muni.cz/david-novak/.

Příklady z knihy

Příklady z knihy jsou k dispozici zde.

Objevené chyby

  • Strana 98, obrázek 6.2, tabulka vlevo dole má mít klíč "userID", nikoliv "sessionID".