网友留言纠正邮编库中的错误
来自Jamesqi
--James Qi 2010年4月30日 (五) 10:19 (CST)
邮编库网站2月份、3月份导入了大量数据,3月份又搭建了多语言版本框架,4月份前一阵子花时间把浏览结构进行了修改,将省份页面变为单页,只看到地市一级列表(例如:湖北看到下属17个地市名称),地市一级页面中看到区县一级的导入详细邮编页面(标题为省市区的全称)(例如:武汉看到下属13个区县名称),这样用户看起来更方便,并可以容易地深入到更详细的地址和邮编,这个工作需要人工来进行,花了好些时间。
顺便从后来内部搜索记录来看到有不少带有“某地名邮编”、“某地名邮政编码”这样的关键词,而这些页面我们曾经用deleteBatch.php来批量删除了,以免被搜索引擎误认为是作弊,看来是多虑了,为了普通用户方便,还是恢复为好,于是试着用maintenance目录下的undelete.php来进行恢复,这个程序只能每次删除一个标题页面,于是做了一个简单的undelete.sh来批处理,注意第一行的删除标题需要是英文的,如果是中文的会报错。
完工后没有几天就发现有网友留言,指出了两个详细地区页面中的错误(例如:福建省福州市长乐市),我仔细一看,原来是这些页面中的邮政编码全部错位了,有2500多个区县全称页面都犯了同样的错误,都不知道当初是如何做的,怎么没有检查出来。现在如果人工来检查处理的话,至少需要好几十个小时来纠正。后来还是在UltraEdit中用宏命令来自动批量处理的,里面有30000多个错位邮编需要更改、2500多个缺失的邮编需要查询补充,整整自动运行了几天几夜才算全部处理完,今天来全部重新导入。
这批错误的数据差不多存在快2个月了,多亏了有网友帮忙指出才得以纠正!
标签:邮编库。 |
相关内容:
|