网友留言纠正邮编库中的错误

来自Jamesqi
跳转至: 导航搜索

--James Qi 2010年4月30日 (五) 10:19 (CST)

  邮编库网站2月份、3月份导入了大量数据,3月份又搭建了多语言版本框架,4月份前一阵子花时间把浏览结构进行了修改,将省份页面变为单页,只看到地市一级列表(例如:湖北看到下属17个地市名称),地市一级页面中看到区县一级的导入详细邮编页面(标题为省市区的全称)(例如:武汉看到下属13个区县名称),这样用户看起来更方便,并可以容易地深入到更详细的地址和邮编,这个工作需要人工来进行,花了好些时间。

  顺便从后来内部搜索记录来看到有不少带有“某地名邮编”、“某地名邮政编码”这样的关键词,而这些页面我们曾经用deleteBatch.php来批量删除了,以免被搜索引擎误认为是作弊,看来是多虑了,为了普通用户方便,还是恢复为好,于是试着用maintenance目录下的undelete.php来进行恢复,这个程序只能每次删除一个标题页面,于是做了一个简单的undelete.sh来批处理,注意第一行的删除标题需要是英文的,如果是中文的会报错。

  完工后没有几天就发现有网友留言,指出了两个详细地区页面中的错误(例如:福建省福州市长乐市),我仔细一看,原来是这些页面中的邮政编码全部错位了,有2500多个区县全称页面都犯了同样的错误,都不知道当初是如何做的,怎么没有检查出来。现在如果人工来检查处理的话,至少需要好几十个小时来纠正。后来还是在UltraEdit中用宏命令来自动批量处理的,里面有30000多个错位邮编需要更改、2500多个缺失的邮编需要查询补充,整整自动运行了几天几夜才算全部处理完,今天来全部重新导入。

  这批错误的数据差不多存在快2个月了,多亏了有网友帮忙指出才得以纠正!

标签:邮编库
相关内容:
  1. 2010-04-02 00:38:01 用MediaWiki搭建多语言网站群框架
  2. 2010-03-02 10:03:58 邮编库的邮政编码数据处理程序
  3. 2010-02-21 00:12:53 邮编库的数据扩充到百万条数量级
  4. 2009-04-17 11:34:53 电话查询、邮编查询网站提供搜索代码嵌入
  5. 2009-02-28 17:57:42 注册几个新的域名
  6. 2008-11-26 23:21:14 世界各国详细邮政编码
  7. 2008-10-31 00:05:45 邮编区号老网站还可以继续优化升级

关于“网友留言纠正邮编库中的错误”的留言:

目前暂无留言

新增相关留言