MediaWiki导入XML数据中需要转义的字符

来自Jamesqi
跳转至: 导航搜索

--James Qi 2010年4月3日 (六) 22:45 (CST)

  导入XML数据到MediaWiki中的工作我们很早前(2006年)就做过了,也积累了好些经验,不过老是容易忘记,再次处理数据时又需要找资料,这次记录下来。

  需要注意的几个地方:

  • xml文件字符集应该是utf-8,文件为unix格式,不要用asc-ii或者gb2312等字符集,也不要用dos格式文件;
  • 尽量避免出现wiki中的链接和模板字符,可以更换成全角符号:
    • [ (可以出现在正文,不能出现在标题) 替换为 [
    • ] (可以出现在正文,不能出现在标题) 替换为 ]
    • { (可以出现在正文,不能出现在标题) 替换为 {
    • } (可以出现在正文,不能出现在标题) 替换为 }
    • | (可以出现在正文,不能出现在标题) 替换为 |
  • 需要做转义的字符,有5个XML中定义的标准:
    • 和符号 & (可以出现在正文,也可出现在标题) 转义为 &
    • 小于号 < (可以出现在正文,不能出现在标题) 转义为 &lt;
    • 大于号 > (可以出现在正文,不能出现在标题) 转义为 &gt;
    • 双引号 " (可以出现在正文,也可出现在标题) 转义为 &quot;(MeidaWiki中这一个导出进行了转义,导入可不用先转义)
    • 单引号 ' (可以出现在正文,也可出现在标题) 转义为 '(MeidaWiki中这一个导出没有转义,导入也不用先转义)
  • 从access或者execl等数据导出文本文件时,分隔符用制表符,以避免与其它字符混淆,便于后期处理。

  前段时间准备做一些名录数据的导入操作,但其它事情太忙,后面再逐步安排。

标签:MediaWikiXML转义字符
相关内容:
  1. 2010-11-10 22:20:28 MediaWiki-1.15升级到1.16.0步骤
  2. 2010-11-04 22:52:58 开启MediaWiki的搜索建议(Search Suggest)功能
  3. 2010-11-03 11:26:02 MediaWiki-1.15.0升级到1.16.0中出现的问题
  4. 2010-11-02 23:52:05 MediaWiki-1.15准备升级到1.16
  5. 2010-10-22 22:29:00 想写一本关于MediaWiki的书,有人需要吗?
  6. 2010-09-20 11:33:29 直接操作MediaWiki的MySQL数据库
  7. 2010-09-04 00:20:09 修改模板对付MediaWiki及扩展程序的Bug
  8. 2010-08-31 00:47:49 分割大容量MediaWiki数据库
  9. 2010-07-08 23:08:13 用HTML和站间链接减小MediaWiki数据库记录
  10. 2010-06-12 12:27:01 将数据导入MediaWiki进行到底
  11. 2010-05-20 22:01:46 导入大量名录数据到MediaWiki网站的例子
  12. 2010-05-05 15:06:09 不懂PHP编程也可以修改MediaWiki程序
  13. 2010-04-02 00:38:01 用MediaWiki搭建多语言网站群框架
  14. 2010-04-01 16:05:48 在美国VPS上升级MediaWiki

关于“MediaWiki导入XML数据中需要转义的字符”的留言:

目前暂无留言

新增相关留言