与正则表达式类似的信息抽取技术:XPACH
XPATH简介
XML Path Language (XPath) Version 1.0
XPath是一种用于寻址XML文档部分的语言,设计用于XSLT和XPointer。
XML Path Language (XPath) 2.0 (Second Edition)
XPath是一种引用XML文档部分的方法。XPath 2.0基于XQuery 1.0和XPath 2.0数据模型(XDM),还引入了模式感知和数据类型。
-
XPath 3.0(从XPath 2.1重新命名以与“3.0”规范家族保持一致)是一种表达式语言,它允许处理符合[XQuery和XPath数据模型(XDM) 3.0]中定义的数据模型的值。自XPath 2.0以来的一些重要新特性是:
- Literal function items, inline functions, dynamic function invocations, and function item coercion
- Clarification of rules associated with sequence type matching
- let expressions
- EQNames (QNames with a namespace URI instead of a namespace prefix)
- Support for union types in casting and function arguments
-
XPath是一种表达式语言,它允许处理符合XQuery和XPath数据模型中定义的数据模型的值。
XPATH特点
xpath 的引入只是使得处理 xml 终于能够接近 json 的处理方式而已,它并不是一种超越,而是说有了 xpath 之后,xml 的易用性站到 json 同一条线上,xml 跟 json 孰优孰劣,严重依赖于你使用它的编程语言,对于动态的弱类型语言来说,xml 没有优势,对于静态的强类型语言来说,xml 优势明显。
参考
https://www.zhihu.com/question/20738607/answer/16015607 作者:pansz