“IP树”导入37万条IP数据库,并运行更新、刷新链接
来自Jamesqi
--James Qi 2009年8月10日 (一) 11:02 (CST)
IP树网站设立已经很有一段时间了,一直在导入初始的IP数据,刚开始对导入数据的格式进行了反复测试、修改,并运用动态页面列表的新特性,最后确定下来格式,然后用importDump.php导入37万条初始数据很慢很慢,算了一下大约需要1个多月,后来改为多个小文件同时导入,算是几天后导入完成,查看系统统计37万条全部导入了,但分类只认了大约24万条数据,还有10多万没有正确归类,又同时运行多个runJobs.php,完成后同时运行多个refreshLinks.php,不过还是有问题,估计都是因为数据库冲突报错引起的,最后只好单独运行一个refreshLinks.php,这样也差不多前后还是用了1个多月的时间,才算是把37万条数据都搞妥当。
这也算是我们以前在MediaWiki中导入数据量最多的一次,每一页的原始数据只有一行,但扩展包含的多个模板后还是比较大、比较复杂的。数据全部导入以后,又修改模板以便增加谷歌地图调用和Whois查询链接,这样一轮更新下来估计又是要按月来计算时间,看来是需要事先尽量考虑周全,以后少调整这种大量数据包含的模板。
数据导入完成后,还需要在功能上进行完善,让这个IP地址查询网站真正做到与众不同,这个工作将持续进行。
标签:IP树、IP、MediaWiki。 |
相关内容:
|