我从这个链接下载了完整的RDF Freebase转储文件’freebase-rdf-2012-12-09-00-00.gz'(7.5GB)
此数据转储使用此处定义的Turtle RDF语法(http://wiki.freebase.com/wiki/Data_dumps)
如何将此文件加载到Virtuoso(06.04.3132)?
我试着用这个命令
SQL> DB.DBA.TTLP_MT (file_to_string_output ('freebase-rdf-2012-12-09-00-00.gz'), '', 'http://freebase.com');
但它在短时间内完成.以下请求仅从源文件返回2行(三元组),并且日志中没有例外.
SELECT ?a ?b ?c from <http://freebase.com> where {?a ?b ?c}
http://rdf.freebase.com/ns/american_football.football_historical_roster_position.number
http://rdf.freebase.com/ns/type.object.name Number
http://rdf.freebase.com/ns/american_football.football_historical_roster_position.number
http://rdf.freebase.com/ns/type.object.type http://rdf.freebase.com/ns/type.property.
2 Rows. -- 78 msec.
顺便说一句,加载这么大的文件(8 GB RAM或24 GB RAM)需要多长时间?
可以将此转储文件加载到TDB(通过tdbloader),Sesame OpenRDF(通过加载)或OWLIM SE存储库而不进行修改吗?
在合理的时间内加载后,我会从SELECT SPARQL查询(不是非常复杂)得到响应吗?
谢谢!
最佳答案 我收到了[freebase-discuss]邮件列表的回复:
应通过修复脚本解压缩,拆分和运行此Freebase转储.更多细节在这里
http://people.apache.org/~andy/Freebase20121223