我经常在XML文件中发现这个奇怪的CDATA标签:

<![CDATA[some stuff]]>

我观察到这个CDATA标记总是出现在开头,然后跟着一些东西。

但有时用,有时不用。我假设这是为了标记一些东西是“数据”,将被插入之后。但是什么是数据呢?我用XML标记写的东西不是某种数据吗?


当前回答

注意,只有在直接将文本放入XML文本文件时才需要CDATA结构。

也就是说,只有在手动输入或以编程方式直接构建XML文本时才需要使用CDATA。

使用DOM处理器API或SimpleXML输入的任何文本都将自动转义,以防止违反XML内容规则。

尽管如此,有时使用CDATA可以减少原本由所有实体编码产生的文本大小,例如样式标记中的css或脚本标记中的javascript,其中许多语言构造使用HTML|XML中的字符,如<和>。

其他回答

CDATA代表字符数据,这意味着这些字符串之间的数据包括可以解释为XML标记的数据,但不应该这样做。

CDATA和注释之间的主要区别是:

正如Richard指出的,CDATA仍然是文档的一部分,而注释不是。 在CDATA中不能包含字符串]]> (cend),而在注释中—是无效的。 在注释中不能识别参数实体引用。

这意味着从一个格式良好的文档中给出以下四个XML片段:

<!ENTITY MyParamEntity "Has been expanded">

<!--
Within this comment I can use ]]>
and other reserved characters like <
&, ', and ", but %MyParamEntity; will not be expanded
(if I retrieve the text of this node it will contain
%MyParamEntity; and not "Has been expanded")
and I can't place two dashes next to each other.
-->

<![CDATA[
Within this Character Data block I can
use double dashes as much as I want (along with <, &, ', and ")
*and* %MyParamEntity; will be expanded to the text
"Has been expanded" ... however, I can't use
the CEND sequence. If I need to use CEND I must escape one of the
brackets or the greater-than sign using concatenated CDATA sections.
]]>

<description>An example of escaped CENDs</description>
<!-- This text contains a CEND ]]> -->
<!-- In this first case we put the ]] at the end of the first CDATA block
     and the > in the second CDATA block -->
<data><![CDATA[This text contains a CEND ]]]]><![CDATA[>]]></data>
<!-- In this second case we put a ] at the end of the first CDATA block
     and the ]> in the second CDATA block -->
<alternative><![CDATA[This text contains a CEND ]]]><![CDATA[]>]]></alternative>

其中包含的数据不会被解析为XML,因此不需要是有效的XML,或者可以包含看似XML但实际上不是的元素。

注意,只有在直接将文本放入XML文本文件时才需要CDATA结构。

也就是说,只有在手动输入或以编程方式直接构建XML文本时才需要使用CDATA。

使用DOM处理器API或SimpleXML输入的任何文本都将自动转义,以防止违反XML内容规则。

尽管如此,有时使用CDATA可以减少原本由所有实体编码产生的文本大小,例如样式标记中的css或脚本标记中的javascript,其中许多语言构造使用HTML|XML中的字符,如<和>。

Cdata是您可能希望传递给xml解析器但仍然不解释为xml的数据。

Say for eg :- You have an xml which has encapsulates question/answer object . Such open fields can have any data which does not strictly fall under basic data type or xml defined custom data types. Like --Is this a correct tag for xml comment ? .-- You may have a requirement to pass it as it is without being interpreted by the xml parser as another child element. Here Cdata comes to your rescue . By declaring as Cdata you are telling the parser don't treat the data wrapped as an xml (though it may look like one )

通常用于在XML文档中嵌入自定义数据,如图片或声音数据。