我尝试通过SQL查询访问WikiMedia数据库,通过搜索其page_title(来自’page’表)来获取文章页面的内容.(‘old_text’,来自’text’表).
不幸的是,我看到page_id(来自页面表)和old_id(来自’text’表)之间没有映射.
那么,如何使用给定的页面标题从带有SQL查询的文章中获取文本? 最佳答案 为了补充svick的答案,这是一个实际的SQL查询示例:
SELECT old_text, old_flags
FROM page
JOIN revision ON rev_id = page_latest
JOIN text ON old_id = rev_text_id
WHERE page_title = 'Main_Page' AND page_namespace = 0;
(请注意,您还需要old_flags字段才能理解old_text的内容.至少,您应该检查flags字段是否包含您希望它具有的值.)