Projekt Dokumentové úložiště Cílem je vytvořit efektivně pracující úložiště dokumentů (AKA souborů) s podporou pro správu revizí. Uživatelé mohou na dokument, případně jeho konkrétní revize, umisťovat značky. Značkou se rozumí obyčejný textový řetězec. Každý uživatel je přiřazen do uživatelské skupiny. Nad značkami platí unix-like systém práv rw-rw-rw- (je kontrolováno právo číst, resp. měnit, značky s ohledem na identitu vlastníka značky, skupinu anebo ostatní). Narozdíl od SVN/CVS tento projekt předpokládá trvalý (a nahodilý) přísun aktualizací dokumentů, podporuje uživatelská práva na úrovni značek, a dovoluje i jednoduché boolské formule nad “TAGy” pro vybavování dokumentů. Naproti tomu nepodporuje branch/merge. Součástí projektu bude i Wayback Machine (a la archive.org) pro úložiště s Webovými dokumenty. Uživatel si tak bude schopen vymezit časové období, ve kterém chce vidět “ten Internet”. Vybavování dokumentů na základě * znalosti identifikátoru konkrétního dokumentu a požadovaného čísla revize * boolské formule nad značkami a vymezení období (dojde k vysypání všech revizí z daného období, pokud splňují danou boolskou formuli) * boolské formule nad značkami pro vybavení “aktuální” revize Přidávání dokumentů probíhá z několika zdrojů (typicky N webových crawlerů). Netriviální na tomto procesu se schopnost zvládnout velkou zátěž a postavit tak ekvivalent Stanfordského WebBase, ale s optimalizací pro SAN. Cílové nasazení je ve stylu client/server s úložištěm velikosti 10TB-10PB. Boolské formule budou obohaceny o operátor, který umožní vymezit nejenom konkrétní značku, ale i všechny značky začínající konkrétním prefixem. Úložiště bude podporovat administrativní funkce jako BACKUP a FSCK. Součástí bude i webové rozhraní pro správu účtů.