Bakalářské práce

Obecné informace

Obhájené práce

Editor rodokmenů

  • Cílem práce je implementovat webovou aplikaci, která umožní uživatelsky přívětivé vytváření rodokmenů s možností doplňování základních informací o uživateli, včetně obrázků, odkazů apod., přehledné vizualizace výsledku a jeho tisku a sdílení informací s dalšími uživateli. Další funkcionalitou systému bude možnost dohledání shody rodokmenů a jejich vzájemného provazování. Celá aplikace bude v ideálním případě založena na vhodné NoSQL grafové databázi (např. Neo4j), což by mělo ověřit hypotézu o efektivní práci s uloženými grafy. Tato hypotéza bude experimentálně ověřena na netriviálně velkých datech.
  • Výchozí literatura:
    • Holubová, I. - Kosek, J. - Minařík, K. - Novák, D.: Big Data a NoSQL databáze. Grada, Praha, Česká republika, říjen 2015. ISBN 978-80-247-5466-6.
    • Neo4j
    • MyHeritage
    • Ancestry
    • Gramps
  • Řešitel: Andrea Turčanová
  • Stav: obhájena v červnu 2017 (známka: velmi dobře)
  • Oponent: Pavel Hryzlík
  • Text práce: [pdf]

Editor XML dat s podporou odvozování XML schémat

  • Cílem práce je implementace editoru určeného speciálně pro vytváření a úpravu XML dat. V první fázi je třeba provést analýzu a zhodnocení nástrojů, které jsou pro tento účel využívány v současné době i nástrojů podobných. Jádrem práce je pak návrh a implementace vlastního editoru, který by měl z této analýzy vycházet a zohledňovat zjištěné nevýhody.
    Výsledný program by měl zahrnovat:
    • textový editor s podporou highlightingu a kontextových menu s přehledem možných prvků na dané úrovni,
    • vizualizaci a editaci XML dat v podobě stromu,
    • kontrolu správné strukturovanosti a validity XML dokumentů,
    • odvozování XML schémat pro zadané XML dokumenty,
    • standardní funkce editorů (ukládání, načítání, tisk, vyhledávání, nahrazování, statistiky, ...).
    Program by měl být dále schopen téměř plně podporovat specifikace jazyků XML, DTD a XML Schema a efektivně zpracovávat i rozumně velké dokumenty. Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
  • Výchozí literatura:
  • Řešitel: Michal Němec
  • Stav: obhájena v červnu 2016 (známka: výborně)
  • Oponent: Martin Svoboda
  • Text práce: [pdf]

Optimization of Processing of Data Files in System DIRAC

  • The aim of the thesis is to study and extend processing of data files stored in the distributed system DIRAC and in particular their related metadata. The author will analyze the current functionality and extend it with more sophisticated work with data files and their metadata, such as creating, deleting, and updating of data sets, and basic querying over metadata. The functionality will be discussed with the consultants of the thesis.
    In the second phase of the work, the author will identify parts of the current metadata storage which are suitable for storing in a NoSQL database. On the basis of an analysis of existing NoSQL systems the author will select appropriate system(s), propose suitable storage strategy/strategies, and experimentally evaluate their features using real-world data. The results will also be compared with the features of the current storage strategy based on a relational database.
  • Výchozí literatura:
    • Tsaregorodtsev, A.: DIRAC Distributed Computing Services, 2014 J. Phys.: Conf. Ser. 513 (2014)
    • Tsaregorodtsev, A. - Poss, S.: DIRAC File Replica and Metadata Catalog. Journal of Physics: Conference Series. 2012, 396(3)
    • Sadalage, P.J. – Fowler, M.: NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence
    • Redmond, E. – Wilson, J.R.: Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement
  • Řešitel: Martin Adam
  • Stav: obhájena v únoru 2016 (známka: výborně)
  • Oponent: Martin Svoboda
  • Text práce: [pdf]

Rozšírení systému XML Check

  • Cílem práce je modifikace a rozšíření systému XML Check, který byl implementován v rámci bakalářské práce J. Konopáska a je intenzivně využíván v rámci předmětu Technologie XML na MFF UK i FEL ČVUT. Úkolem autora je seznámit se podrobně se systémem i požadavky jeho uživatelů, zanalyzovat dosavadní připomínky k systému a provést odpovídající úpravy. Modifikace a rozšíření by pak měly zahrnovat:
    • Opravy klíčových chyb a nedostatků, které byly identifikovány cvičícími i studenty v posledních letech používání systému.
    • Rozšíření systému o kontrolu podobnosti odevzdaných domácích úkolů.
    Druhý bod rozšíření bude zahrnovat také samotnou analýzu podobnosti úkolů odevzdaných v posledních letech.
  • Výchozí literatura:
    • Konopásek, J.: Systém pro správu úkolů a testů.
    • Palusga, T.: Systém pro kontrolu domácích úkolů a plagiátorství.
    • Mlýnkova, I. - Nečaský, M. - Pokorný, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML - Principy a aplikace v praxi. Vydalo nakladatelství Grada, Praha, Česká republika, září 2008. ISBN 978-80-247-2725-7.
    • World Wide Web Consortium - W3C
    • Mlynkova, I. - Pokorny, J.: Exploitation of Similarity and Pattern Matching in XML Technologies. Technical report 2006/13. Charles University, Prague, Czech Republic, November 2006, 30 pages.
  • Řešitel: Petr Hudeček
  • Stav: obhájena v červnu 2015 (známka: výborně)
  • Oponent: Marek Polák
  • Text práce: [pdf]

Nástroj pro vizualizaci XQuery dotazů

  • Cílem práce je implementace SW pro podporu výuky jazyka XQuery. Program bude schopen vizualizovat vstupní data (tj. množinu XML dokumentů), zadávat a vyhodnocovat XQuery dotazy a vizualizovat jejich výstup. Hlavní důraz bude kladen na uživatelskou přívětivost programu a názornost vyhodnocování dotazů.
    Výsledný program by měl zahrnovat:
    • Podporu vhodné netriviální podmnožiny jazyka XQuery.
    • Vizualizaci vstupních a výstupních dat v textové i grafické podobě, včetně vhodného highlightingu různých typů uzlů.
    • Vizualizaci pokládaných dotazů v textové i grafické podobě.
    • Vyznačení částí XML dokumentů, které jsou v dotazu vybrány a jejich transformace do výstupu.
    • Podporu velkých XML dokumentů.
    • Klasické funkce vizualizačních nástrojů jako je ukládání do grafických formátů (BMP, PNG, ...), tisk, uživatelské nastavení parametrů vizualizace jednotlivých prvků apod.
    Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
  • Výchozí literatura:
    • Mlynkova, I. - Necasky, M. - Pokorny, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML - Principy a aplikace v praxi. Grada Publishing, Prague, Czech Republic, zari 2008. ISBN 978-80-247-2725-7.
    • XQuery 1.0: An XML Query Language. W3C Recommendation 23 January 2007.
    • XML Query Use Cases. W3C Working Group Note 23 March 2007.
    • Jihad Boulos, Marcel Karam, Zeina Koteiche and Hala Ollaic. XQueryViz: An XQuery Visualization Tool. EDBT 2006. Lecture Notes in Computer Science, 2006, Volume 3896/2006.
  • Řešitel: Tatsiana Maksimenka
  • Stav: obhájena v září 2012 (známka: dobře)
  • Oponent: Jakub Klimek
  • Text práce: [pdf]

The Support of XML Technologies in Oracle DB, IBM DB2 and Microsoft SQL Server

  • The aim of the work is to implement a tool that enables analyses and experimental comparison of the three most common XML-enabled databases - Oracle DB, IBM DB2 and Microsoft SQL Server, in particular their support of XML technologies.
    First, the author will provide the description of XML support in the three systems and their theoretical comparison. The core of the work will be a tool that enables to test the extent and efficiency of XML technologies supported in the systems using own user-provided data, such as well-know benchmarks, gather the results, compare them and visualize in a user-friendly form. An important part of the work, except for the user and programmer documentation, will be an example of an experimental comparison of the systems using the implemented tool.
  • Výchozí literatura:
  • Řešitel: Elina Hazaran
  • Stav: obhájena v červnu 2012 (známka: velmi dobře)
  • Oponent: Jakub Lokoč
  • Text práce: [pdf]

Systém pro kontrolu domácích úkolů a plagiátorství

  • Cílem práce je implementace informačního systému, který bude primárně určen pro potřeby přednášky "Technologie XML", ale bude implementován tak, aby mohl být bez větších zásahů využit i pro přednášky jiné. Systém bude především umožňovat kontrolu a evidenci plnění domácích úkolů.
    Výsledný program by měl zahrnovat:
    • Rozhraní pro správu úloh a cvičebních skupin, evidenci studentů, odevzdávání a kontrolu správnosti DÚ, evidenci bodového hodnocení, rozesílání e-mailů apod.
    • Implementaci veškerých kontrolních funkcí stávajícího programu Checker s možností dalšího rozšíření.
    • Kontrolu plagiátorství, tj. detekci podobnosti odevzdaných DÚ.
    Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
  • Výchozí literatura:
    • W3C Technical Reports and Publications
    • Mlynkova, I. - Necasky, M. - Pokorny, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML - Principy a aplikace v praxi. Grada Publishing, Prague, Czech Republic, zari 2008. ISBN 978-80-247-2725-7.
    • Technologie XML
    • CodEx
    • Mlynkova, I. - Pokorny, J.: Exploitation of Similarity and Pattern Matching in XML Technologies. Technical report 2006/13. Charles University, Prague, Czech Republic, November 2006, 30 pages.
  • Řešitel: Tadeáš Palusga
  • Stav: obhájena v červnu 2012 (známka: velmi dobře)
  • Oponent: David Hoksza
  • Text práce: [pdf]

Systém pro správu úkolů a testů

  • Cílem práce je implementace informačního systému, který bude primárně určen pro potřeby přednášky "Technologie XML", ale bude implementován tak, aby mohl být bez větších zásahů využit i pro přednášky jiné. Systém bude především umožňovat kontrolu a evidenci plnění domácích úkolů a generování zkušebních testů.
    Výsledný program by měl zahrnovat:
    • Rozhraní pro správu úloh a cvičebních skupin, evidenci studentů, odevzdávání a kontrolu správnosti DÚ, evidenci bodového hodnocení, rozesílání e-mailů apod.
    • Implementaci veškerých kontrolních funkcí stávajícího programu Checker s možností dalšího rozšíření.
    • Rozhraní pro specifikaci/opravu/mazání testových otázek, generování testů s požadovanými parametry, specifikaci "stárnutí" otázek apod.
    • Možnost doplnění testů o přílohy (obrázky, XML soubory apod.) a jejich vhodné začlenění do výstupu pro tisk.
    Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
  • Výchozí literatura:
  • Řešitel: Jan Konopásek
  • Stav: obhájena v lednu 2012 (známka: výborně)
  • Oponent: David Hauzar
  • Text práce: [pdf]

Generátor testovacích XML dat

  • Cílem práce je implementace systému umožňujícího generovat testovací XML data na základě parametrů zadaných uživatelem a pomocí nich testovat vybrané aplikace. Funkčnost a použitelnost systému bude demonstrována srovnáním výkonnosti alespoň tří vybraných aplikací na různých typech vygenerovaných dat.
    Součásti výsledného SW bude:
    • Uživatelsky příjemné rozhraní pro specifikaci parametrů dat s možností ukládání zvolených nastavení
    • Dostatečně rozsáhlá množina parametrů (např. počet vygenerovaných dokumentů, atributů, elementů, hloubka dokumentu, fan-out, procento zastoupení smíšeného obsahu, způsob specifikace obsahu elementů/atributů apod.)
    • Možnost generování rozsáhlých XML dokumentů
    • Možnost vytvoření XML schématu vygenerovaných dat (v jazyce DTD/XML Schema)
    • Zajištění automatického spouštění testovaných aplikací na různých typech dat (např. datech s rostoucí hloubkou, zastoupením smíšeného obsahu apod.), se zvoleným počtem opakování testu apod.
    • Zobrazení naměřených výsledků v uživatelsky příjemné podobě (v tabulkách/grafech)
  • Výchozí literatura:
  • Řešitel: Jakub Michalko
  • Stav: obhájena v červnu 2011 (známka: výborně)
  • Oponent: Martin Svoboda
  • Text práce: [pdf]

XML Data Visualization

  • The aim of the work is implementation of a SW that will enable to visualize XML data (i.e. XML documents and their schemas expressed in DTD or XML Schema) in the form of graphs. The program will be able to parse the data and to display them in a user-friendly manner. A user will be enabled to modify the layout (i.e. change position, colour, shape, size etc.) of selected parts of the data (i.e. elements, attributes, values, data types, operators etc.) as well as add/delete new user-specified items. The selection should be done using XML-related tools, such as XPath language.
    The SW will include:
    • Editor that enables to parse, display and modify the data.
    • Filter that enables to select XML items to be highlighted
    • Functions that will enable to add/delete data items (and check validity of the modifications)
    • Classical editor functions such as printing, storing, exporting to graphical formats (BMP, GIF, PDF etc.), presetting the default visualization etc.
    • Processing of very large XML data
  • Výchozí literatura:
    • W3C Technical Reports and Publications
    • Mlynkova, I. - Necasky, M. - Pokorny, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML - Principy a aplikace v praxi. Grada Publishing, Prague, Czech Republic, zari 2008. ISBN 978-80-247-2725-7.
  • Řešitel: Roman Betík
  • Stav: obhájena v červnu 2010 (známka: výborně)
  • Oponent: Tomáš Knap
  • Text práce: [pdf]

Nástroj pro analýzu XML dat

  • Cílem práce je implementace nástroje umožňujícího provádět analýzy daných XML dokumentů, DTD a schémat v jazyce XML Schema s důrazem na snadnou rozšiřitelnost a maximální možnou parametrizovatelnost. V první fázi je třeba provést analýzu a zhodnocení existujících prací s podobným zaměřením. Jádrem práce je pak návrh a implementace vlastního nástroje, který by měl z této analýzy vycházet a zohledňovat zjištěné nedostatky.
    Výsledný program by měl zahrnovat:
    • netriviální, maximálně parametrizovatelnou sadu statistik, které lze nad XML daty provádět (např. počet, průměr, medián apod. zvolených konstruktů, hloubka / šířka dokumentu, max. přípustná cesta, max. přípustný cyklus DTD / schématu, rekurze, fan-in / fan-out, nedeterminismus, ...),
    • přehledné grafické zobrazení vstupních XML dokumentů, DTD a XML schémat,
    • tabulkové a grafové zobrazení výsledků,
    • možnost srovnání výsledků odpovídajících si statistik pro XML dokumenty a jejich schémata,
    • ukládání výsledků a možnost následného doplnění o nové dokumenty.
    Program by měl být dále schopen téměř plně podporovat specifikace jazyků XML, DTD a XML Schema a efektivně zpracovávat i velké dokumenty. Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
  • Výchozí literatura:
    • Mlýnková, I. - Pokorný, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML. Skripta. Karlova Univerzita, Praha, Czech Republic, září 2006.
    • World Wide Web Consortium - W3C
    • Mlynkova, I. - Toman, K. - Pokorný, J.: Statistical Analysis of Real XML Data Collections. Technical report 2006/5. Charles University, Prague, Czech Republic, June 2006.
  • Řešitel: Jiří Vinárek
  • Stav: obhájena v září 2009 (známka: výborně)
  • Oponent: Martin Nečaský
  • Text práce: [pdf]

Implementace a experimentální srovnání vybraných metod pro správu XML dat

  • Cílem práce je implementace vybraných (netriviálních) metod pro efektivní správu a dotazování XML dat a jejich experimentální srovnání na reálných kolekcích XML dokumentů. Předpokládá se, že implementace bude založena na využití některého z existujících open source databázových systémů (např. systému Derby) a bude využívat i libovolné další existující nástroje (jako např. DOM/SAX parsery, XML validátory apod.).
    Množina implementovaných metod by měla zahrnovat metody systému XISS a alespoň dvě další obdobné metody (jako např. metodu TwigStack, XPath Accelerator apod.). Implementace všech by měly být schopné zpracovat netriviální XML data, zejména pak velké XML dokumenty nebo naopak rozsáhlé kolekce menších XML dokumentů.
    Nad výslednými implementacemi bude provedeno experimentální srovnání na reálných kolekcích XML dokumentů (viz. např. XML Data Repository, NIAGARA Experimental Data, Jon Bosak – XML examples apod.), popř. kolekcích XML dokumentů ve standardních XML formátech (jako např. XHTML, SVG apod.).
    Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
  • Výchozí literatura:
  • Řešitel: Petr Davídek
  • Stav: obhájena v září 2008 (známka: velmi dobře)
  • Oponent: Martin Nečaský
  • Text práce: [pdf]

Editor XML dat

  • Cílem práce je implementace editoru určeného speciálně pro vytváření a úpravu XML dokumentů, DTD a schémat v jazyce XML Schema. V první fázi je třeba provést analýzu a zhodnocení nástrojů, které jsou pro tento účel využívány v současné době i nástrojů podobných. Jádrem práce je pak návrh a implementace vlastního editoru, který by měl z této analýzy vycházet a zohledňovat zjištěné nevýhody.
    Výsledný program by měl zahrnovat:
    • textový editor s podporou highlightingu a kontextových menu s přehledem možných prvků na dané úrovni (pro DTD a XML schémata jsou dány normou, pro XML dokumenty příslušným schématem),
    • generický editor schopný vytvářet editační okna a jejich prvky dle daného DTD / XML schématu,
    • kontrolu správné strukturovanosti a validity XML dokumentů,
    • standardní funkce editorů (ukládání, načítání, tisk, vyhledávání, nahrazování, statistiky, ...).
    Program by měl být dále schopen téměř plně podporovat specifikace jazyků XML, DTD a XML Schema a efektivně zpracovávat i velké dokumenty. Nedílnou součástí práce bude programátorská a uživatelská dokumentace.
  • Výchozí literatura:
    • Mlýnková, I. - Pokorný, J. - Richta, K. - Toman, K. - Toman, V.: Technologie XML. Skripta. Karlova Univerzita, Praha, Czech Republic, září 2006.
    • World Wide Web Consortium - W3C
    • PSPad - freeware editor
    • <oXygen/> XML Editor
  • Řešitel: Jakub Valčík
  • Stav: obhájena v září 2007 (známka: velmi dobře)
  • Oponent: Kamil Toman
  • Text práce: [pdf]

Editor ER diagramů s podporou transformace do relačního modelu a SQL

  • Cílem práce je implementace editoru ER diagramů, který by měl sloužit pro účely výuky na MFF UK v rámci přednášky Databázové systémy (DBI025). V první fázi je třeba provést analýzu a zhodnocení nástrojů, které jsou pro tento účel využívány v současné době i nástrojů podobných. Jádrem práce je pak návrh a implementace vlastního editoru, který by měl z této analýzy vycházet a zohledňovat zjištěné nevýhody.
    Výsledný program by měl zahrnovat:
    • editor ER diagramů zahrnující prvky probírané v rámci zmíněné přednášky
    • kontrolu korektnosti vytvořeného ER diagramu
    • transformaci ER diagramu do relací / SQL skriptů
    • zohlednění různých verzí SQL v různých databázových systémech
    • standardní funkce editorů (ukládání / načítání diagramů, tisk, ...)
    Nedílnou součástí práce bude programátorská a uživatelská dokumentace a netriviální sada ukázkových příkladů.
  • Výchozí literatura:
    • Říha A.: Podklady k přednášce Databázové systémy (DBI025), LS 2004/2005
    • Pokorný J., Halaška, I.: Databázové systémy. Skripta, 2. přepracované vydání, Vydavatelství ČVUT, 2003
    • Batini C., Ceri S., Navathe S. B.: Conceptual Database Design: An Entity-Relationship Approach. The Benjamin/Cummings Publ. Comp., Redwood City, CA, 1992
    • Dia - diagram creation program
    • CASE Studio 2 CZ
  • Řešitel: Peter Gorbár
  • Stav: obhájena v červnu 2007 (známka: výborně)
  • Oponent: Tomáš Skopal
  • Text práce: [pdf]