如何使用BeautifulSoup bs4获取HTML标签的内部文本值?
使用BeautifulSoup bs4时,如何从HTML标签内部获取文本?当我运行此行时:
oname = soup.find("title")
我得到这样的title
标签:
<title>page name</title>
现在我只想获取其中的内部文本page name
,不带标签。怎么做?
回答:
使用.text从标记中获取文本。
oname = soup.find("title")oname.text
要不就 soup.title.text
In [4]: from bs4 import BeautifulSoup In [5]: import requests
In [6]: r = requests.get("http://codingdict.com/questions/196612")
In [7]: BeautifulSoup(r.content).title.text
Out[7]: u'html - How to Retrieve information inside a tag with python - Stack Overflow'
要打开文件并使用文本作为名称,请像使用其他任何字符串一样简单地使用它:
with open(oname.text, 'w') as f
以上是 如何使用BeautifulSoup bs4获取HTML标签的内部文本值? 的全部内容, 来源链接: utcz.com/qa/432450.html