XML属性vs XML元素

在工作中，我们被要求创建XML文件来将数据传递给另一个脱机应用程序，然后该应用程序将创建第二个XML文件来传递回去，以更新我们的一些数据。在这个过程中，我们一直在与另一个应用程序的团队讨论XML文件的结构。

我提出的样本基本上是这样的:

<INVENTORY>
   <ITEM serialNumber="something" location="something" barcode="something">
      <TYPE modelNumber="something" vendor="something"/> 
   </ITEM>
</INVENTORY>

另一个团队说，这不是行业标准，属性应该只用于元数据。他们建议:

<INVENTORY>
   <ITEM>
      <SERIALNUMBER>something</SERIALNUMBER>
      <LOCATION>something</LOCATION>
      <BARCODE>something</BARCODE>
      <TYPE>
         <MODELNUMBER>something</MODELNUMBER>
         <VENDOR>something</VENDOR>
      </TYPE>
   </ITEM>
</INVENTORY>

我建议使用第一个方法的原因是，创建的文件的大小要小得多。在传输过程中，文件中将有大约80000个项目。事实上，他们的建议比我的建议大三倍。我搜索了提到的神秘的“行业标准”，但我能找到的最接近的是XML属性应该只用于元数据，但争论的焦点是什么才是实际的元数据。

在冗长的解释(抱歉)之后，如何确定什么是元数据，以及在设计XML文档的结构时，如何决定何时使用属性或元素?

当前回答

XML元素与XML属性

XML是关于协议的。首先遵循社区或行业中任何现有的XML模式或已建立的约定。

如果你真的需要从头定义你的模式，这里有一些关于元素与属性决策的一般考虑:

<versus>
  <element attribute="Meta content">
    Content
  </element>
  <element attribute="Flat">
    <parent>
      <child>Hierarchical</child>
    </parent>
  </element>
  <element attribute="Unordered">
    <ol>
      <li>Has</li>
      <li>order</li>
    </ol>
  </element>
  <element attribute="Must copy to reuse">
    Can reference to re-use
  </element>
  <element attribute="For software">
    For humans
  </element>
  <element attribute="Extreme use leads to micro-parsing">
    Extreme use leads to document bloat
  </element>
  <element attribute="Unique names">
    Unique or non-unique names
  </element>
  <element attribute="SAX parse: read first">
    SAX parse: read later
  </element>
  <element attribute="DTD: default value">
    DTD: no default value
  </element>
</versus>

2014-04-17 12:56:33

其他回答

如果有疑问，KISS——当您没有明确的理由使用属性时，为什么要混合使用属性和元素呢?如果稍后决定定义一个XSD，那么最终也会更简洁。然后，如果稍后决定从XSD生成类结构，也会更简单。

2008-08-29 01:27:43

这两种方式都有争议，但您的同事认为XML应该用于“标记”或围绕实际数据的元数据，这一点是正确的。对您来说，在用XML建模域时，有时很难确定元数据和数据之间的界限。实际上，我所做的是假装标记中的任何内容都是隐藏的，只有标记之外的数据是可读的。这份文件在这方面有意义吗?

XML是出了名的庞大。对于运输和存储，如果你能负担得起处理能力，强烈建议压缩。XML压缩得很好，有时压缩得非常好，因为它具有重复性。我曾经把大文件压缩到不到原始大小的5%。

支持您立场的另一点是，当其他团队在争论样式时(大多数XML工具处理全属性文档就像处理全#PCDATA文档一样容易)，您在争论实用性。虽然不能完全忽视风格，但技术优点应该更重要。

2008-08-29 01:26:57

这很大程度上是个人偏好的问题。在可能的情况下，我使用元素进行分组，并使用属性进行数据，因为我认为这比替代方法更紧凑。

例如，我更喜欢.....

<?xml version="1.0" encoding="utf-8"?>
<data>
    <people>
         <person name="Rory" surname="Becker" age="30" />
        <person name="Travis" surname="Illig" age="32" />
        <person name="Scott" surname="Hanselman" age="34" />
    </people>
</data>

.．.而不是……

<?xml version="1.0" encoding="utf-8"?>
<data>
    <people>
        <person>
            <name>Rory</name>
            <surname>Becker</surname>
            <age>30</age>
        </person>
        <person>
            <name>Travis</name>
            <surname>Illig</surname>
            <age>32</age>
        </person>
        <person>
            <name>Scott</name>
            <surname>Hanselman</surname>
            <age>34</age>
        </person>
    </people>
</data>

然而，如果我的数据不容易在20-30个字符内表示，或者包含许多引号或其他需要转义的字符，那么我会说，是时候拆分元素了……可能使用CData块。

<?xml version="1.0" encoding="utf-8"?>
<data>
    <people>
        <person name="Rory" surname="Becker" age="30" >
            <comment>A programmer whose interested in all sorts of misc stuff. His Blog can be found at http://rorybecker.blogspot.com and he's on twitter as @RoryBecker</comment>
        </person>
        <person name="Travis" surname="Illig" age="32" >
            <comment>A cool guy for who has helped me out with all sorts of SVn information</comment>
        </person>
        <person name="Scott" surname="Hanselman" age="34" >
            <comment>Scott works for MS and has a great podcast available at http://www.hanselminutes.com </comment>
        </person>
    </people>
</data>

2008-09-30 09:23:18

这是个价值百万美元的问题!

首先，现在不要太担心性能。您会惊讶于优化的XML解析器解析XML的速度有多快。更重要的是，您对未来的设计是什么:随着XML的发展，您将如何保持松耦合和互操作性?

更具体地说，您可以使元素的内容模型更加复杂，但扩展属性则更加困难。

2008-08-29 01:24:43

我总是对这类讨论的结果感到惊讶。对我来说，有一个非常简单的规则来决定数据是否属于属性或内容，即数据是否具有可导航的子结构。

例如，非标记文本总是属于属性。总是这样。

列表属于子结构或内容。随着时间的推移，可能包含嵌入式结构化子内容的文本属于内容。(根据我的经验，在使用XML进行数据存储或交换时，这种带有标记的文本相对较少。)

以这种方式编写的XML模式非常简洁。

每当我看到像<car><make>Ford</make><color>Red</color></car>这样的情况时，我就会想“咦，作者认为make元素中会有子元素吗?”<car make="Ford" color="Red" />可读性明显更好，关于如何处理空白等问题毫无疑问。

考虑到空格处理规则，我相信这是XML设计者的明确意图。

2015-05-15 17:12:14