XML语言

2023-11-15

XML:

XML是可扩展的标记语言
标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的
xml学习网站https://www.w3school.com.cn/x.asp

作用:

用于进行存储数据和传输数据
数据交换:不同的计算机语言之间,不同的操作系统之间进行数据交换。
主要作为软件的配置文件

优点:

可读性好
可维护性高

标签的规则:

标签由一对尖括号和合法标识符组成,标签必须成对出现

    <!--标签由一对尖括号和合法标识符组成-->
    <students>

        <!--标签必须成对出现,前边的是开始标签,后边的是结束标签-->
        <student></student>

        <!--特殊的标签可以不成对,但是必须有结束标记-->
        <address/>

        <!--标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来-->
        <student id="1"></student>

        <!--<标签需要正确的嵌套,这是正确的:-->
        <student id="1">
            <name>张三</name>
        </student>
        
        <!--这是错误的:-->
        <student id="1">
            <name>张三
        </student>
        </name>
        
     </students>
语法规则:
  1. XML文件的后缀名为:xml
  2. 文档声明必须是第一行第一列
  3. <?xml version=“1.0” encoding=“UTF-8” standalone=“yes”?>
  • version:该属性是必须存在的,这里是版本的意思,必须是1.0
  • encoding:该属性不是必须的,告诉使用者打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)
  • standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no(yes表示是独立的不依赖)
  1. 必须存在一个根标签,有且只能有一个
  2. XML文件中可以定义注释信息
  3. XML文件中可以存在以下特殊字符
&lt;     <     小于 
&gt;     >     大于 
&amp;    &     和号 
&apos;   '     单引号 
&quot;   "     引号
Document常用方法:
方法名 功能说明
Element getRootElement() 通过文档对象得到根元素
String getName() 获取元素名
List<Element> elements() 获取所有子元素
List<Element> elements(String name) 获取知名名字的多个子元素
获取文本内容:

通过元素对象得到文本字符串得到文本元素的前提:先得到元素对象
空格、换行、制表符:也是属于文本的一部分,所以在解析xml文件的时候,格式化XML文件要注意。

元素中得到文本有关的方法

Element**元素中的方法 说明
String getText() 得到元素中文本
String elementTextTrim(元素名) 得到子元素中文本,去掉先后空格
String elementText(元素名) 得到子元素中文本
Attribute常用方法:
方法名 功能说明
String getName() 得到属性的名字
String getValue() 得到属性的值

得到属性值的两种方式

  1. 先得到Attribute对象,再通过Attribute对象得到属性的值
  2. 通过方法attributeValue()直接得到属性值
解析xml:

DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。 会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值(说白了就跟洋葱一样,一层一层的获取,先获取根标签,再获取子标签,再获取对应的值)

在这里插入图片描述
常见的解析工具:

JAXP: SUN公司提供的一套XML的解析的API
JDOM: 开源组织提供了一套XML的解析的API-jdom
DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java
pull: 主要应用在Android手机端解析XML

解析的准备工作:

  1. 下载dom4j:https://dom4j.github.io/

  2. 将提下载好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar

  3. 在idea中当前模块下新建一个libs文件夹,将dom4j-1.6.1.jar包复制到文件夹中

  4. 选中jar包 -> 右键 -> 选择add as library即可
    在这里插入图片描述

xml文件:

<?xml version="1.0" encoding="UTF-8" ?>
<!--存储多个学生对象的信息-->
<students>
    <student id="1">
        <name>韩信</name>
        <age>99</age>
    </student>

    <student id="2">
        <name>李白</name>
        <age>98</age>
    </student>
</students>

学生类:

public class Student {
    private String id;
    private String name;
    private int age;

    public Student() {
    }

    public Student(String id, String name, int age) {
        this.id = id;
        this.name = name;
        this.age = age;
    }

    public String getId() {
        return id;
    }

    public void setId(String id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "id='" + id + '\'' +
                ", name='" + name + '\'' +
                ", age=" + age +
                '}';
    }
}

解析类:

public class XmlTest {
    public static void main(String[] args) throws FileNotFoundException, DocumentException {
        // 获取解析器对象
        SAXReader saxReader = new SAXReader();
        // 利用解析器把xml文件加载到内存中,并返回一个文档对象
        Document document = saxReader.read(new FileInputStream("src/xml/demo.xml"));
        // 获取到根标签
        Element rootElement = document.getRootElement();
        // 获取子标签
        List<Element> elements = rootElement.elements("student");

        ArrayList<Student> list = new ArrayList<>();
        // 遍历集合
        for (Element element : elements) {
            // 获取id的内容
            Attribute id = element.attribute("id");
            String idValue = id.getValue();
            // 获取name的内容
            // element:获取指定的子标签
            Element name = element.element("name");
            String nameText = name.getText();
            // 获取age的内容
            Element age = element.element("age");
            String ageText = age.getText();
            // 添加学生到集合
            Student student = new Student(idValue, nameText, Integer.parseInt(ageText));
            list.add(student);
        }
        // 遍历集合
        for (Student student : list) {
            System.out.println(student);
        }
    }
}
DTD约束:

什么是约束:

用来限定xml文件中可使用的标签以及属性

编写DTD约束步骤

  1. 创建一个文件,这个文件的后缀名为.dtd
  2. 看xml文件中使用了哪些元素 <!ELEMENT> 可以定义元素
  3. 判断元素是简单元素还是复杂元素
  • 简单元素:没有子元素。
  • 复杂元素:有子元素的元素;
DTD语法规则:

定义元素规则:

在这里插入图片描述
定义属性规则:

定义一个属性的格式为:<!ATTLIST 元素名称 属性名称 属性的类型 属性的约束> 属性的类型: CDATA类型:普通的字符串

属性的约束:

#REQUIRED: 属性必须要写
#IMPLIED: 属性不是必需的
#FIXED value:属性值是固定的

引入DTD约束:

dtd约束文件

<!ELEMENT persons (person+)>
        <!ELEMENT person (name,age)>

        <!--#PCDATA:表示值是字符串-->
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        <!ATTLIST person id CDATA #REQUIRED>
        <!ATTLIST person id CDATA #IMPLIED>
        <!ATTLIST person id CDATA #FIXED value "a">

引入本地dtd:

<!DOCTYPE 根元素名称 SYSTEM ‘DTD文件的路径’>

<?xml version="1.0" encoding="UTF-8" ?>
<!--引入本地dtd-->
<!DOCTYPE persons  SYSTEM 'demo.dtd'>
<persons>
    <person id="01">
        <name>韩信</name>
        <age>99</age>
    </person>
    <person id="02">
        <name>李白</name>
        <age>98</age>
    </person>
</persons>

在xml文件内部引入:

<!DOCTYPE 根元素名称 [ dtd文件内容 ]>

<?xml version="1.0" encoding="UTF-8" ?>
<!--内部-->
<!DOCTYPE persons  [
        <!ELEMENT persons (person+)>
        <!ELEMENT person (name,age)>
        <!--#PCDATA:表示值是字符串-->
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        <!ATTLIST person id CDATA #REQUIRED>
        ]>
<persons>
    <person id="01">
        <name>韩信</name>
        <age>99</age>
    </person>
    <person id="02">
        <name>李白</name>
        <age>98</age>
    </person>
</persons>

引入网络dtd:
<!DOCTYPE 根元素的名称 PUBLIC “DTD文件名称” “DTD文档的URL”>

<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" 
"http://mybatis.org/dtd/mybatis-3-mapper.dtd">
schema约束:

schema和dtd的区别

  1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
  2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)
  3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型
  4. schema 语法更加的复杂
  5. schema文件用来约束一个xml文件,同时也被别的文件约束着

编写schema约束步骤:

  1. 创建一个文件,这个文件的后缀名为.xsd。
  2. 定义文档声明
  3. schema文件的根标签为:
  4. 定义属性: xmlns=http://www.w3.org/2001/XMLSchema
  5. 定义属性 : targetNamespace =唯一的url地址,指定当前这个schema文件的名称空间。
  6. 定义属性 :elementFormDefault=”qualifified“,表示当前schema文件是一个质量良好的文件。
  7. 通过element定义元素
  8. 判断当前元素是简单元素还是复杂元素

xml文件

<?xml version="1.0" encoding="UTF-8" ?>

<persons
        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xmlns="http:www.itzhuzhu.com"
        xsi:schemaLocation="http:www.itzhuzhu.com persons.xsd"
>
    <person id="001">
        <name>张三</name>
        <age>23</age>
    </person>
</persons>

xsd约束文件

<?xml version="1.0" encoding="UTF-8" ?>
<schema xmlns="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http:www.itzhuzhu.com"
        elementFormDefault="qualified"
>
    <!--定义persons复杂元素-->
    <element name="persons">
        <complexType>
            <sequence>
                <!--定义person复杂元素-->
                <element name="person">
                    <complexType>
                        <sequence>
                            <!--定义name和age简单元素-->
                            <element name="name" type="string"></element>
                            <element name="age" type="string"></element>
                        </sequence>
                        <!--定义属性,required( 必须的)/optional( 可选的)-->
                        <attribute name="id" type="string" use="required"></attribute>
                    </complexType>
                </element>
            </sequence>
        </complexType>
    </element>
</schema>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

XML语言 的相关文章

  • Xslt 到 xsl-fo 转换

    我想将 xslt 转换为 xsl fo 但我不太确定我能做到这一点 我尝试将 XML 列表转换为 xsl fo 列表 谁能告诉我在哪里可以找到我在谷歌上搜索了很长时间没有很多这样的例子 我的XML是这样的 p TEXT p ul li It
  • 使用 JAXB 编组 LocalDate

    我正在构建一系列链接类 我希望能够将其实例编组到 XML 以便我可以将它们保存到文件中并稍后再次读取它们 目前我使用以下代码作为测试用例 import javax xml bind annotation import javax xml b
  • 用于冒号分隔标签的 XML 解析器? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • C# MonoGame 有帮助吗? (Content.Load("入侵者");)

    我正在 MonoGame 中使用 Open GL 制作太空入侵者游戏 并且尝试加载已添加到内容文件夹中的纹理 这是一个名为 Invader 的 PNG 文件 我使用的代码是 invader Content Load
  • 如何使用scrapy抓取xml url

    你好 我正在使用 scrapy 来抓取 xml url 假设下面是我的 Spider py 代码 class TestSpider BaseSpider name test allowed domains www example com s
  • 什么时候应该使用 XML 而不是 SQL? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 在工具栏下显示内容

    您好 我试图简单地将我的内容放在工具栏下方 但是当我运行我的应用程序时 某些内容本应位于工具栏下方 却隐藏在工具栏后面 我已经阅读了有关使用框架布局来尝试将其分离的内容 但我有点卡住了 我目前正在使用该软件提供的基本 android stu
  • 使用 MemoryStream 创建 Open XML 电子表格时的 Excel 和“不可读内容”

    使用 Open XML SDK v2 0 创建 Excel 电子表格时 我们的 Excel 输出最初可以成功运行几个月 最近Excel 所有版本 开始抱怨 Excel在 zot xlsx 中发现不可读的内容 是否要恢复此工作簿的内容 我们正
  • & 在 xml 文件中算作一个还是多个字符?

    我正在使用的 XML 模式具有特定的字符串字符长度 所以我可能有一个类似的字符串 Jim Mary 在 C 中是 10 个字符 但是当它写入 xml 时 它会变成 Jim amp Mary 如果 XML 模式规定字符串最多只能有 10 个字
  • 如何使用 Webpack 加载器导入 XML,而不自动转换为 JSON

    Webpack 4 的 xml loader 自动将导入的 XML 文件转换为 JSON 通过什么方式可以导入XMLwithout转换为 JSON XML 数据将使用现有的 应用程序专用的 XML 解析器进行处理 明确地说 我绝对愿意not
  • 以 UTF8 而不是 UTF16 输出 DataTable XML

    我有一个 DataTable 我正在使用 WriteXML 创建一个 XML 文件 尽管我在以 UTF 16 编码导出它时遇到问题 并且似乎没有明显的方法来更改它 我了解 NET 在字符串内部使用 UTF 16 这是正确的吗 然后 我通过
  • 为 XSD 中的元素指定命名空间

    我有一个 XML 需要为其生成 XSD 我的 XML 如下 实例
  • Eclipse 在处理 xml(传入或传出)时挂起。此时CPU+磁盘尖峰

    我每天必须处理许多 XML 这极大地打断了我的工作流程 我尝试降级到 Indigo 但所有附加组件都被删除 打开xml时出现问题 切换到 xml 切换出一个 xml 甚至切换到另一个 xml 到底发生了什么事情让 XML 如此烦人 我可以禁
  • 有人可以推荐一个免费的 xslt 工具吗? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • XSLT - 追加同级

    我正在尝试使用 XSLT 来附加context param作为最后一个兄弟姐妹 没有共同的父元素 因此任务有点困难 我想附加以下元素
  • 如何去除 XSL 中字符的重音符号?

    我一直在寻找 但找不到相当于字符 规范化空间 的 XSL 函数 也就是说 我的内容带有重音 UNICODE 字符 这很好 但是从该内容中 我正在创建一个文件名 但我不想要这些重音 那么 是否有一些我忽略的东西 或者没有正确地谷歌搜索来轻松处
  • 简单的 Xml - 元素的顺序未保留?

    我在我的 Android 应用程序中使用 SimpleXml 2 6 1 尽管文档 http simple sourceforge net download stream doc javadoc index html org simplef
  • REXX 或 JCL 中的 XML 处理

    在 PS 文件中 我有如下 XML 数据 For ex
  • 使用 sed 更新 xml 属性(Windows + cygwin 和 Linux)?

    我需要使用 sed 命令对 xml 文件进行更新 但我在这方面遇到了麻烦 它需要在 Windows 使用 cygwin 和 Linux 上运行 XML 具有以下元素
  • xsd 类型的 JAXB(取消)编组:xsd:base64Binary 和 xsd:hexBinary

    JAXB 映射两者xsd base64Binary and xsd hexBinary类型为byte 鉴于我有一个模式 一个 DOM 元素来表示这些类型 例如

随机推荐