之前在研究相關的 RDF Store 時,讀到 Christian Becker 所作的一篇測試報告。他利用 DBpedia 的資料,塞進幾個不同的 RDF stores 中作效能測試。測試的資料庫包含 OpenLink Virtuoso Open-Source EditionSDB Beta 1OpenRDF Sesame 2.0

根據他的測試報告,OpenLink Virtuoso 的效能之傑出,而且只稍微做了設定調整,讓我不經想拿來測試一番。

DBpedia 的資料來源取於 Wikipedia,概念是從 Wikipedia 的文章中萃取出結構性的資訊 (structured information),並開放下載使用。因此你可取得上百萬件 Wikipedia 中描述的人、事、物的後設資料。

Christian 測試的資料庫包含 DBpedia 的 infobox templates, geo-coordinates 與 Wikipedia 外部連結。資料總數超過一萬六千筆。依據 Christian Becke 的數據,Virtuoso 載入一千五百萬 triples 大約只需兩小時而已,速度與其他的資料庫比起來快上幾倍。而查詢的速度,除了只對 Subject 進行的查詢比其他的方案慢之外,稍微複雜的 SPARQL 速度都遠比其他的方案快多了。

OpenLink SoftwareVirtuoso Universal Server 是一個相當複雜 (但有趣) 的軟體,他的核心基本是資料庫與中介軟體,混合提供各種功能,包含 ORDBMS, SQL (RDBMS), XML, RDF, Web Server 與檔案伺服器。單一的軟體包含了各種功能,配合底層使用的 OpenLink Data Spaces,你可以介接大量不同的第三方資料庫,再提供網頁或 Web Services 以便界接其他的軟體。甚至你可以將其他資料庫或檔案,轉成 RDF,因此可以當作 Federated database system 來用。

適用領域包含企業的知識庫系統、或者是 Semantic Web。功能如此強大的資料庫,操作也不特別容易,專案提供了完整文件,引出來要超過兩千頁啊啊。