XML学习总结(1)——XML入门

2023-05-16

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

一、XML语法学习

  学习XML语法的目的就是编写XML

  一个XML文件分为如下几部分内容:

  • 文档声明 
  • 元素
  • 属性
  • 注释  
  • CDATA区 、特殊字符 
  • 处理指令(processing instruction) 

1.1、xml语法——文档声明

  在编写XML文档时,需要先使用文档声明,声明XML文档的类型。

  最简单的声明语法: <?xml version="1.0" ?> 

  例如:

1 <?xml version="1.0"?>
2 <softCompany>
3     <company>MicroSoft</company>
4     <company>google</company>
5     <company>Apple</company>
6 </softCompany>

  浏览器解析结果如下:

  

  用encoding属性说明文档的字符编码:<?xml version="1.0" encoding="GB2312" ?>

  当XML文件中有中文时,必须使用encoding属性指明文档的字符编码,例如:encoding="GB2312"或者encoding="utf-8",并且在保存文件时,也要以相应的文件编码来保存,否则在使用浏览器解析XML文件时,就会出现解析错误的情况。

  例如:

1 <?xml version="1.0"?>
2 <softCompany>
3     <company>MicroSoft</company>
4     <company>google</company>
5     <company>Apple</company>
6     <company>百度</company>
7 </softCompany>

  这个XML文件中没有使用encoding属性来指明文档的字符编码,但文档里面有“百度”这样的中文字符,在使用IE浏览器解析该XML文件时,IE就不知道该使用什么编码去解析该文件,就无法解析了,出现的错误如下图(-1)所示:

  

                    图-1

   要想正确解析该XML文档,就可以使用encoding属性指明该文档的字符编码。

  例如:

1 <?xml version="1.0" encoding="GB2312"?>
2 <softCompany>
3     <company>MicroSoft</company>
4     <company>google</company>
5     <company>Apple</company>
6     <company>百度</company>
7 </softCompany>

  此时再次使用IE浏览器来解析该XML文件,就可以正常解析出里面的中文字符了,如下图(-2)所示:

  

                图-2

1.2、编写XML文件常遇到的一个问题

  XML文件一般使用国际化通用的编码“utf-8”,所以平时看到的XML文件的头部都会有这样的代码:

1 <?xml version="1.0" encoding="utf-8"?>

  如果我们使用“记事本”或者“EditPlus”等文本编辑工具编写XML文件时,例如使用“EditPlus”编写如下的XML文件:

 1 <?xml version="1.0" encoding="utf-8"?>
 2 <CharacterEncoding>
 3     <中国>
 4         <encoding>GB2312</encoding>
 5         <encoding>GBK</encoding>
 6     </中国>
 7     <日本>
 8         <encoding>JIS</encoding>
 9     </日本>
10 </CharacterEncoding>

  当我们在保存文件时,文件的编码默认是以“ANSI”来保存的,如下图(-3)所示:

  

                        图-3

  我们编写XML文件时,使用encoding="utf-8"来指明了文档的字符编码,但是在保存的时候却使用了“ANSI”编码来保存文件,由于我们在XML文件中使用encoding="utf-8"来指明了文档的字符编码,所以当浏览器解析该XML文件时,就是使用“utf-8”编码来解析,解析结果如下图(-4)所示:

   

                        图-4

  可以看到,浏览器解析失败了,这是为什么呢?我们明明指定了文档的字符编码是“UTF-8”了呀,为什么里面的中文解析不出来呢?这里不得不说说ANSI编码到底代表的是神马意思了。

  不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表GB2312 编码,在日文操作系统下,ANSI 编码代表JIS 编码 不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段ANSI 编码的文本中。

  下面分析一下为什么IE浏览器X无法解析ML文件的原因:如下图(图-5)所示:

  

                        图-5

  所以千万要记住,使用“记事本”或者“EditPlus”等文本编辑工具编写XML文件时一定要以XML文件的encoding属性指明的编码来保存文件,这样才能保证浏览器解析XML文件时可以正常解析。

  上述的问题将CharacterEncoding.xml文件再以“UTF-8”编码保存一次就可以正常解析出CharacterEncoding.xml

  

                        图-6

  浏览器的解析结果如下图(-7)所示:

  

                        图-7

  在使用一些比较智能的IDE编写XML文件时,IDE在保存XML文件时,会自动以encoding属性指明的编码来保存文件,例如在MyEclipse中编写XML文件时,就可以根据encoding属性指明的字符编码,指明为encoding="GB2312"时,保存XML文件时就自动将文件保存成GB2312编码 (如图-8),指明为encoding="UTF-8"时,就自动保存为UTF-8 (如图-9)

  

                                  图-8

  

                                  图-9

  用standalone属性说明文档是否独立:

1 <?xml version="1.0" encoding="GB2312"  standalone="yes" ?>

 1.3、xml语法——元素

  XML元素指XML文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式,例如:

  • 包含标签体:<a>www.cnblogs.com/</a>
  • 不含标签体的:<a></a>, 简写为:<a/>

  一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套,绝对不允许交叉嵌套 ,例如:

    错误的写法:<a>welcome to <b>www.cnblogs.com/</a></b>

  格式良好的XML文档必须有且仅有一个根标签,其它标签都是这个根标签的子孙标签。

  对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理。例如:下面两段内容的意义是不一样的。

  第一段:

1 <网址>http://www.cnblogs.com/</网址>

  第二段:

1 <网址>
2      http://www.cnblogs.com/
3 </网址>

  由于在XML中,空格和换行都作为原始内容被处理,所以,在编写XML文件时,使用换行和缩进等方式来让原文件中的内容清晰可读的“良好”书写习惯可能要被迫改变。

  一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:

  1. 区分大小写,例如,<P>和<p>是两个不同的标记。
  2. 不能以数字或"_" (下划线)开头。
  3. 不能以xml(或XML、或Xml 等)开头。
  4. 不能包含空格。
  5. 名称中间不能包含冒号(:)

1.4、XML语法——属性

  一个标签可以有多个属性,每个属性都有它自己的名称和取值,例如: <input name=“text”> ,属性值一定要用双引号(")或单引号(')引起来,定义属性必须遵循与标签相同的命名规范 。

  多学一招:在XML技术中,标签属性所代表的信息,也可以被改成用子元素的形式来描述,例如:

1 <input>
2   <name>text</name>
3 </input>

1.5、XML语法——注释

  Xml文件中的注释采用: <!--注释--> 格式。

  注意:

  • XML声明之前不能有注释
  • 注释不能嵌套,例如:
<!--大段注释

……

<!--局部注释-->

……

-->  

1.6、XML语法——CDATA区

  在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理,遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出

  语法:<![CDATA[ 内容 ]]>

  例如:

 1 <?xml version="1.0" encoding="utf-8"?>
 2 <soft>
 3 <![CDATA[
 4     <a className="gacl.xdp">
 5         <a1>gacl</a1>
 6         <a2>xdp</a2>
 7     </a>
 8 ]]>
 9     <b>
10         <b1>孤傲苍狼</b1>
11         <b2>徐达沛</b2>
12     </b>
13 </soft>

  该XML文件使用IE浏览器解析引擎解析执行后,结果如下图(-10)所示:

  

                        图-10

  对于一些单个字符,若想显示其原始样式,也可以使用转义的形式予以处理。

  

              转义字符表

  例如:

1 <?xml version="1.0" encoding="utf-8"?>
2 <soft>
3     <b>
4         &lt;b1&gt;孤傲苍狼&lt;/b1&gt;
5         <b2>徐达沛</b2>
6     </b>
7 </soft>

  解析器解析的结果如下图(-11)所示:

  

          图-11

1.7、XML语法-处理指令

  处理指令,简称PI (processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。例如,在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用css文件显示xml文档内容,标签名为中文时,css不起作用。

  <?xml-stylesheet type="text/css" href="css文件名.css"?>

  例如:

1 <?xml version="1.0" encoding="utf-8"?>
2 <!--在XML文档中可以使用xml-stylesheet指令,通知XML解析引擎,应用country.css文件显示xml文档内容-->
3 <?xml-stylesheet type="text/css" href="country.css"?>
4 <Country>
5     <c1>中国</c1>
6     <c2>美国</c2>
7     <c3>日本</c3>
8     <c4>韩国</c4>
9 </Country>

  Country.css样式文件代码如下:

 1 c1{
 2     font-size:200px;
 3     color:red;
 4 }
 5 c2{
 6     font-size:150px;
 7     color:green;
 8 }
 9 c3{
10     font-size:100px;
11     color:#ccc;
12 }
13 c4{
14     font-size:130px;
15     color:blue;
16 }

  在浏览器中解析该XML文件的结果如下图(-12)所示:

  

                          图-12

  处理指令必须以"<?"作为开头,以"?>"作为结尾,XML声明语句(<?xml version="1.0" encoding="utf-8"?>)就是最常见的一种处理指令。

  到此,关于XML语法方面的讲解就全部讲完了。

转载于:https://my.oschina.net/zhanghaiyang/blog/606714

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

XML学习总结(1)——XML入门 的相关文章

  • Spark-scala-API

    1 sc version 2 集群对象 xff1a SparkContext xff1b 获得Spark集群的SparkContext对象 xff0c 是构造Spark应用的第一步 xff01 SparkContext对象代表 整个 Spa
  • ClearCanvas DICOM 开发系列 一

    概述 C 开源的DICOM server 支持影像处理 影像归档 影像管理 影像传输和影像浏览功能 开源代码可学习地方很多 官方网站 http www clearcanvas ca building ImageViewer 的代码 1 打开
  • spark dataFrame withColumn

    说明 xff1a withColumn用于在原有DF新增一列 1 初始化sqlContext val sqlContext 61 new org apache spark sql SQLContext sc 2 导入sqlContext隐式
  • 我凭什么为美国人买单?(转)

    香港一个朋友的妈妈是我见到过最忠诚的股迷 xff0c 老太太做了一辈子的护士 xff0c 八九年退休后成了专业股迷 xff0c 只要开市风雨不误去银行大厅炒股机前上班 老太太炒股同别人不同 xff0c 她只炒一只股 xff0c 那就是香港股
  • postgresql 清空数据表数据

    在 mysql中 xff0c 只需要执行 xff1a TRUNCATE table name 即可 xff0c 数据会情况 xff0c 而且自增id也会变回0 xff1b 但在 postgresql 则稍有不同 xff0c 因为 postg
  • 适合初学者小白的10本Python书籍,你值得收藏

    我会经常分享一本书 你看完如果对你有帮助 xff0c 值得你购买 xff0c 请到官网购买正版书籍 声明 xff1a 我不是卖书的 xff0c 我搞得是Python技术 xff0c 文章最后免费为你准备了一些Python资料 Python是
  • Rust开发操作系统系列:从零制作x86_64位系统

    Rust开发操作系统系列 xff1a 从零制作x86 64位系统 在发表这个文章之前 xff0c 我曾发布过另一篇文章 xff1a Rust开发操作系统系列 xff1a 全新Hello World系统 那篇文章我发布在云栖社区以及我自己的博
  • 莫名其妙报module 'urllib' has no attribute 'request'的解决方法

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 以前在pycharm下运行好好的程序 xff0c 今天就加了两个log xff0c 莫名其妙报错说urllib下找不到request 报错 xff1a module 39
  • 【NativeScript Vue 2019--中文字幕】精通原生手机UI之路

    在NativeScript原生手机app开发里 xff0c 其中的UI界面就跟我们常用的html 或blade模板 或vue的普通template不一样了 xff0c 其中就有很多值得警惕的了 xff0c 有的方式是好的 xff0c 可以提
  • SpringBoot整合阿里云OSS文件上传、下载、查看、删除

    该项目源码地址 xff1a https github com ggb2312 JavaNotes tree master springboot integration examples xff08 其中包含SpringBoot和其他常用技术
  • sql server 对储存过程和函数的加密解密

    加密使用关键字 xff1a ENCRYPTION CREATE procedure dbo sp EytTest 64 para varchar 50 WITH ENCRYPTION as begin select 64 para end
  • 设计模式之(十三)备忘机制Memento

    Memento备望录模式定义 memento是一个保存另外一个对象内部状态拷贝的对象 这样以后就可以将该对象恢复到原先保存的状态 Memento模式相对也比较好理解 我们看下列代码 public class Originator publi
  • 从点击Button到弹出一个MessageBox, 背后发生了什么

    思考一个最简单的程序行为 xff1a 我们的Dialog上有一个Button xff0c 当用户用鼠标点击这个Button时 xff0c 我们弹出一个MessageBox 这个看似简单的行为 xff0c 谁能说清楚它是如何运行起来的 xff
  • Windows 7 封装篇(一)【母盘定制】[手动制作]定制合适的系统母盘

    Windows 7 封装篇 xff08 一 xff09 母盘定制 手动制作 定制合适的系统母盘 http www win10u com article html 10 html Windows 7 封装篇 xff08 一 xff09 母盘定
  • #ifdef __cplusplus 倒底是什么意思?

    时常在cpp的代码之中看到这样的代码 ifdef cplusplus extern 34 C 34 endif 一段代码 ifdef cplusplus endif 这样的代码到底是什么意思呢 xff1f 首先 xff0c cplusplu
  • ping过程详细解读

    0 前言 在讲解ping过程之前 xff0c 我们需要了解以下概念 1 何为ping PING Packet Internet Groper xff0c 因特网包探索器 xff0c 用于测试网络连通性的程序 Ping发送一个ICMP Int
  • 使用源码安装MariaDB

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 系统 xff1a CentOS 6 5 x86 64 为什么源码安装 xff1f 自定义编译参数 xff0c 编译器优化 xff0c 自定义安装位置 源码安装系统需求 xf
  • VS2015配置Linux开发远程调试

    VS2015配置Linux开发远程调试 简介 vs2015支持跨平台开发 软件环境 VS2015 update3 Visual C 43 43 for Linux Development VC Linux exe 安装步骤 安装VS2015
  • 将linux文件中的tab更换为空格的三种方法

    将linux文件中的tab更换为空格的三种方法 1 xff0c 用sed命令 sed s t g filename gt filename1 2 用tr命令 cat filename tr 34 t 34 34 34 gt filename
  • React生命周期-踩坑记_10

    React生命周期 生命周期概览 生命周期的状态 组件的生命周期可分成三个状态 xff1a Mounting xff1a 已插入真实 DOMUpdating xff1a 正在被重新渲Unmounting xff1a 已移出真实 DOMcom

随机推荐

  • 转录组入门(5): 序列比对

    欢迎来GitHub上fork xff0c 一起进步 xff1a https github com xuzhougeng 比对软件很多 xff0c 首先大家去收集一下 xff0c 因为我们是带大家入门 xff0c 请统一用hisat2 xff
  • amavisd 规则备忘

    邮件服务器在做内容过滤 xff0c 结果误杀好多邮件 xff0c 有一些常用规则再现 xff0c 记录一下 20150113 初版 amavisd 版本为2 6 4 https wiki apache org spamassassin Ru
  • TensorFlow Lite 支持移动 GPU,速度推测提升4-6倍

    最近 xff0c 开源机器学习框架 TensorFlow Lite 更新 xff0c 新版更新支持了 GPU 支持 GPU 原因 虽然移动设备的处理能力和功率都有限 虽然 TensorFlow Lite 提供了不少的加速途径 xff0c 比
  • Linux开机启动顺序简述

    Linux的开机启动顺序 第一步 xff1a 当然是加电了 第二步 xff1a 加载BIOS设置 xff0c 选择启动盘 这是因为因为BIOS中包含了CPU的相关信息 设备启动顺序信息 硬盘信息 内存信息 时钟信息 PnP特性等等 在此之后
  • IdentityServer4 实现 OpenID Connect 和 OAuth 2.0

    关于 OAuth 2 0 的相关内容 xff0c 点击查看 xff1a ASP NET WebApi OWIN 实现 OAuth 2 0 OpenID 是一个去中心化的网上身份认证系统 对于支持 OpenID 的网站 xff0c 用户不需要
  • 使用MakeSureDirectoryPathExists 创建多级目录

    The MakeSureDirectoryPathExists function creates all the directories in the specified DirPath beginning with the root BO
  • gnome桌面显示计算机,使用 GNOME 桌面

    Fedora 12 默认使用 GNOME 作为窗口管理器 Window Manager xff0c GNOME 的目标是基于自由软件 xff0c 为 Unix 或者类 Unix 操作系统构造一个功能完善 操作简单以及界面友好的桌面环境 xf
  • jQuery匹配各种条件的选择器用法

    hidden 匹配所有的不可见元素 xff0c input 元素的 type 属性为 34 hidden 34 的话也会被匹配到 Matches all elements that are hidden or input elements
  • 加ing形式的单词有哪些_利用英语原版教材轻松记单词快乐学语法

    英语中 xff0c 不定冠词有a和an两种形式 区别在an多了一个辅音字母n xff0c 其作用是在元音之间起分隔作用 强烈建议家长和小朋友一起重点学习英语中的五个元音并牢记相应的音标 很多朋友发音不好 xff0c 重要原因是元音不到位 x
  • linux 批量登录脚本,批量登陆linux主机脚本

    test sh bin bash dir 61 home test while read line do host 61 96 echo line awk print 1 96 passwd 61 96 echo line awk prin
  • Lottie - 轻松实现复杂的动画效果

    1 Lottie 介绍 Lottie 是 Airbnb 开源的一套跨平台的完整的动画效果解决方案 xff0c 设计师可以使用 Adobe After Effects 设计出漂亮的动画之后 xff0c 使用 Lottic 提供的 Bodymo
  • 【迁移】—Entity Framework实例详解

    好久没有在博客园更新博客了 xff0c 如今都换了新公司 前段时间写了关于EF迁移的文档 xff0c 今天拿出来作为这个系列的一篇吧 一 Entity Framework 迁移命令 xff08 get help EntityFramewor
  • 源码阅读技巧篇

    转载请注明原创出处 xff0c 谢谢 xff01 说在前面 本人水平有限 xff0c 下面的一些都是本人的思考与理解 xff0c 如果有那里不对 xff0c 希望各位大佬积极指出 xff0c 欢迎在留言区进行评论交流 探讨 主题 为什么要读
  • 文件服务器 之 VSFTPD的高手篇

    此文章细致的讲解了VSFTP的配置 环境 xff1a linux as 3 0 43 vsftpd 1 2 0 4的系统架构 xff0c 是在独立服务器下的哦 xff01 1 xff0e 配置本地组访问的FTP 首先创建用户组 test和F
  • [Windows Azure] Manage the Availability of Virtual Machines

    Manage the Availability of Virtual Machines You can ensure the availability of your application by using multiple Window
  • Myeclipse优化配置

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 作为企业级开发最流行的工具 xff0c 用Myeclipse开发java web程序无疑是最合适的 xff0c java web前端采用jsp来显示 xff0c myecl
  • AdjustTokenPrivileges(进程权限)

    AdjustTokenPrivileges 进程权限 原文地址 http hi baidu com xuqipi blog item 07f43363b3d690630d33fa90 html GetCurrentProcessID 得到当
  • Maven学习总结(八)——使用Maven构建多模块项目

    2019独角兽企业重金招聘Python工程师标准 gt gt gt Maven学习总结 八 使用Maven构建多模块项目 在平时的Javaweb项目开发中为了便于后期的维护 xff0c 我们一般会进行分层开发 xff0c 最常见的就是分为d
  • Echache整合Spring缓存实例讲解

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 摘要 xff1a 本文主要介绍了EhCache xff0c 并通过整合Spring给出了一个使用实例 一 EhCache 介绍 EhCache 是一个纯Java的进程内缓存
  • XML学习总结(1)——XML入门

    2019独角兽企业重金招聘Python工程师标准 gt gt gt 一 XML语法学习 学习XML 语法的目的就是编写 XML 一个XML文件分为如下几部分内容 xff1a 文档声明 元素属性注释 CDATA区 特殊字符 处理指令 xff0