Python3 BeautifulSoup和Pyquery解析库随笔

python

BeautifuSoup和Pyquery解析库方法比较

1.对象初始化:

  • BeautifySoup库:

    1 from bs4 import BeautifulSoup

    2

    3 html = 'html string......'

    4 soup = BeautifulSoup(html, 'lxml')

  • Pyquery库:

    1 from pyquery import PyQuery as pq

    2

    3 # 以字符串初始化

    4 html = 'html string...'

    5 doc = pq(html)

    6 # 以url初始化

    7 doc = pq(url='https://....')

    8 # 以文件初始化

    9 doc = pq(filename='XXX.html')

2. 节点属性获取:

  • BeautifuSoup库:

    1 # 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值

    2 value = li['attr_name']

    3 value = li.attrs['attr_name']

  • Pyquery库:

    1 # 在根据CSS选择器定位到节点(例如li)后,两种方法获取属性值

    2 value = li.attr.attr_name

    3 value = li.attr('attr_name')

3. 文本内容获取:

  • BeautifulSoup库:

    # 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值

    text = li.string

    text = li.get_text()

  • Pyquery库: 

    1 # 在根据CSS选择器定位到节点(例如li)后

    2 text = li.text()

以上是 Python3 BeautifulSoup和Pyquery解析库随笔 的全部内容, 来源链接: utcz.com/z/387120.html

回到顶部