NSWI108: Seminar from Web Semantization, 26th October 2015
Ladislav Peška, S309, peska@ksi.mff.cuni.cz
- Sparql query language, practical examples by Jörg Unbehauen, Darya Tarasowa link
Approx. slides 1-50.
- Tool for visualization of entity relationship
- DBPedia
English and Czech language edditions
There are also other Linked Open Data datasets, the list can be found here.
- How to search/browse DBPedia
Several practical examples and simple SPARQL queries.
- searching rdf:types
- searching entities of the given type
- describe entities and comparing with wiki pages
- simple graph patterns
- filtering
- optional, order by, agregations
- Construction of SPARQL queries
- What did Ivan Olbracht wrote? //basic graph patterns
- What did the author of R.U.R. wrote, when and what genre? //more complex graph patterns, optional
- Where does the Sci-FI authors mostly come from? //group by, order by
- What large towns (above 20000 inhabitants) are in South bohemian region? //filter (numerical)
- What are the professions of "Zeman"? (What are the proffesion of persons, whose surname is "Zeman") //filter (regex)
- Which actors stared at comertionally most successful movies (the movies they staring have the highest profits) //basic arithmetrics, order by, group by, variable retyping, BIND
-...
Cvika ze Semantizace webu NSWI108 10.11. 2014 - program
- Sparql prakticky - slidy od Jörg Unbehauen, Darya Tarasowa link
Neprojdeme všechno, ale jen základní syntax jazyka, zaměříme se na rozdíly oproti SQL a pasti do kterých můžete spadnout. Při psaní dotazů se pak slidy můžou hodit jako "lightweighted" příručka.
- DBPedia
DBPedia je vpodstatě strojově čitelná verze Wikipedie (její části), která uchovává data v RDF formátu a lze se nad nimi dotazovat v jazyce SPARQL.
Existuje několik různých jazykových mutací DBPedie, ale pro nás bude nejzajímavější Anglická a Česká verze
Krom DBPedie existuje řada dalších Linked Open Datasetů, které můžete využívat (ne všechny mají přístup přes SPARQL). Seznam naleznete zde.
- Jak procházet/prohledávat DBPedii
Pár praktických ukázek jak se v DBPedii orientovat + základní SPARQL dotazy.
- vyhledávání rdf:types
- vyhledání entit daného typu
- describe entity a porovnání s about page a wiki page
- jednoduché grafové vzory
- filtrování záznamů
- optional, order by, agregace
Tip na vizualizaci vztahů mezi entitami
- Samostatná práce - konstrukce SPARQL dotazů
- Co napsal Ivan Olbracht? //základní vzory v grafech
- Co napsal autor R.U.R. kdy a jakého žánru? //složitější vzory v grafech, optional
- Odkud pochází nejčastěji autoři Sci-FI? //group by, order by
- Která větší města (nad např. 20000 obyvatel) jsou v Jihočeském kraji? //filter (numerical)
- Jaké jsou profese "Zemanů"? (co dělají lidé, jejichž příjmení je "Zeman") //filter (regex)
- Kteří herci natáčejí komerčně nejúspěšnější filmy (filmy ve kterých jsou obsazeni vydělávají nejvíc peněz) //základní aritmetika, order by, group by, přetypování proměnných, BIND
Další dotazy
Hledání podobnosti:
- Co mají podobného (a rozdílného) Loch Ness a Lago di Garda (a Lipno)?
- Futurama a Simpsonovi?
- Batman begins a The Invisible?
Statistiky:
- která vydavatelství mají nejvíce titulů za dané období
- které země zrodily nejvíce Nobelistů
- který spisovatel píše nejúspěšnější předlohy k filmům?
- Který český politik/spisovatel/herec/... se narodil ve Vašem městě?
- Nejúspěšnější nízkorozpočtové filmy
... (co zajímá Vás a jak na to přijít?)
Vzorové řešení (bude k dispozici po cvičení)