Cvika ze Semantizace webu NSWI108 5.1. 2015
- Řekneme si něco málo o tom co jsou doporučovací systémy, proč a kde se používají a co mají společného se semantickým webem, viz slidy
- V rychlosti představím soutěž, která proběhla na konferenci ESWC 2014 na téma spojení světů doporučovacích systémů a semantizace webu, viz link
- Ve zbylém čase si zkusíme vlastní krátkou verzi soutěže (data): doporučování pro jednoho uživatele s použitím RelFinder.
Cvika ze Semantizace webu NSWI108 10.11. 2014 - program
Ladislav Peška, S309, peska@ksi.mff.cuni.cz
- Sparql prakticky - slidy od Jörg Unbehauen, Darya Tarasowa link
Neprojdeme všechno, ale jen základní syntax jazyka, zaměříme se na rozdíly oproti SQL a pasti do kterých můžete spadnout. Při psaní dotazů se pak slidy můžou hodit jako "lightweighted" příručka.
- DBPedia
DBPedia je vpodstatě strojově čitelná verze Wikipedie (její části), která uchovává data v RDF formátu a lze se nad nimi dotazovat v jazyce SPARQL.
Existuje několik různých jazykových mutací DBPedie, ale pro nás bude nejzajímavější Anglická a Česká verze
Krom DBPedie existuje řada dalších Linked Open Datasetů, které můžete využívat (ne všechny mají přístup přes SPARQL). Seznam naleznete zde.
- Jak procházet/prohledávat DBPedii
Pár praktických ukázek jak se v DBPedii orientovat + základní SPARQL dotazy.
- vyhledávání rdf:types
- vyhledání entit daného typu
- describe entity a porovnání s about page a wiki page
- jednoduché grafové vzory
- filtrování záznamů
- optional, order by, agregace
Tip na vizualizaci vztahů mezi entitami
- Samostatná práce - konstrukce SPARQL dotazů
- Co napsal Ivan Olbracht? //základní vzory v grafech
- Co napsal autor R.U.R. kdy a jakého žánru? //složitější vzory v grafech, optional
- Odkud pochází nejčastěji autoři Sci-FI? //group by, order by
- Která větší města (nad např. 20000 obyvatel) jsou v Jihočeském kraji? //filter (numerical)
- Jaké jsou profese "Zemanů"? (co dělají lidé, jejichž příjmení je "Zeman") //filter (regex)
- Kteří herci natáčejí komerčně nejúspěšnější filmy (filmy ve kterých jsou obsazeni vydělávají nejvíc peněz) //základní aritmetika, order by, group by, přetypování proměnných, BIND
Další dotazy
Hledání podobnosti:
- Co mají podobného (a rozdílného) Loch Ness a Lago di Garda (a Lipno)?
- Futurama a Simpsonovi?
- Batman begins a The Invisible?
Statistiky:
- která vydavatelství mají nejvíce titulů za dané období
- které země zrodily nejvíce Nobelistů
- který spisovatel píše nejúspěšnější předlohy k filmům?
- Který český politik/spisovatel/herec/... se narodil ve Vašem městě?
- Nejúspěšnější nízkorozpočtové filmy
... (co zajímá Vás a jak na to přijít?)
Vzorové řešení (bude k dispozici po cvičení)