之前在研究相關的 RDF Store 時,讀到 Christian Becker 所作的一篇測試報告。他利用 DBpedia 的資料,塞進幾個不同的 RDF stores 中作效能測試。測試的資料庫包含 OpenLink Virtuoso Open-Source Edition、SDB Beta 1 與 OpenRDF Sesame 2.0。
根據他的測試報告,OpenLink Virtuoso 的效能之傑出,而且只稍微做了設定調整,讓我不經想拿來測試一番。
DBpedia 的資料來源取於 Wikipedia,概念是從 Wikipedia 的文章中萃取出結構性的資訊 (structured information),並開放下載使用。因此你可取得上百萬件 Wikipedia 中描述的人、事、物的後設資料。
Christian 測試的資料庫包含 DBpedia 的 infobox templates, geo-coordinates 與 Wikipedia 外部連結。資料總數超過一萬六千筆。依據 Christian Becke 的數據,Virtuoso 載入一千五百萬 triples 大約只需兩小時而已,速度與其他的資料庫比起來快上幾倍。而查詢的速度,除了只對 Subject 進行的查詢比其他的方案慢之外,稍微複雜的 SPARQL 速度都遠比其他的方案快多了。
OpenLink Software 的 Virtuoso Universal Server 是一個相當複雜 (但有趣) 的軟體,他的核心基本是資料庫與中介軟體,混合提供各種功能,包含 ORDBMS, SQL (RDBMS), XML, RDF, Web Server 與檔案伺服器。單一的軟體包含了各種功能,配合底層使用的 OpenLink Data Spaces,你可以介接大量不同的第三方資料庫,再提供網頁或 Web Services 以便界接其他的軟體。甚至你可以將其他資料庫或檔案,轉成 RDF,因此可以當作 Federated database system 來用。
適用領域包含企業的知識庫系統、或者是 Semantic Web。功能如此強大的資料庫,操作也不特別容易,專案提供了完整文件,引出來要超過兩千頁啊啊。