Python结构化标记处理工具

python lib

Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。

  • html --- 超文本标记语言支持
  • html.parser --- 简单的 HTML 和 XHTML 解析器

    • HTML 解析器的示例程序
    • HTMLParser 方法
    • 例子

  • html.entities --- HTML 一般实体的定义
  • XML处理模块

    • XML 漏洞
    • defusedxmldefusedexpat 软件包

  • xml.etree.ElementTree --- ElementTree XML API

    • 教程

      • XML树和元素
      • 解析XML
      • Pull API进行非阻塞解析
      • 寻找有趣的元素
      • 修改XML文件
      • 构建XML文档
      • 使用命名空间解析XML
      • 其他资源

    • XPath支持

      • 示例
      • 支持的XPath语法

    • 参考

      • 函数

    • XInclude 支持

      • 示例

    • 参考

      • 函数
      • 元素对象
      • ElementTree 对象
      • QName 对象
      • TreeBuilder 对象
      • XMLParser对象
      • XMLPullParser对象
      • 异常

  • xml.dom --- 文档对象模型 API

    • 模块内容
    • DOM 中的对象

      • DOMImplementation 对象
      • 节点对象
      • 节点列表对象
      • 文档类型对象
      • 文档对象
      • 元素对象
      • Attr 对象
      • NamedNodeMap 对象
      • 注释对象
      • Text 和 CDATASection 对象
      • ProcessingInstruction 对象
      • 异常

    • 一致性

      • 类型映射
      • 访问器方法

  • xml.dom.minidom --- 最小化的 DOM 实现

    • DOM 对象
    • DOM 示例
    • minidom 和 DOM 标准

  • xml.dom.pulldom --- 支持构建部分 DOM 树

    • DOMEventStream 对象

  • xml.sax --- 支持 SAX2 解析器

    • SAXException 对象

  • xml.sax.handler --- SAX 处理程序的基类

    • ContentHandler 对象
    • DTDHandler 对象
    • EntityResolver 对象
    • ErrorHandler 对象

  • xml.sax.saxutils --- SAX 工具集
  • xml.sax.xmlreader --- 用于 XML 解析器的接口

    • XMLReader 对象
    • IncrementalParser 对象
    • Locator 对象
    • InputSource 对象
    • Attributes 接口
    • AttributesNS 接口

  • xml.parsers.expat --- 使用 Expat 的快速 XML 解析

    • XMLParser对象
    • ExpatError 异常
    • 示例
    • 内容模型描述
    • Expat 错误常量

以上是 Python结构化标记处理工具 的全部内容, 来源链接: utcz.com/z/508298.html

回到顶部