python如何下载网页?

python

python下载网页的方法:

直接使用下面的代码即可下载一个网页:

import urllib.request

def getHtml(url):

 html = urllib.request.urlopen(url).read()

 return html

def saveHtml(file_name, file_content):

 # 注意windows文件命名的禁用符,比如 /

 with open(file_name.replace('/', '_') + ".html", "wb") as f:

  # 写文件用bytes而不是str,所以要转码

  f.write(file_content)

aurl = "https://www.py.cn/faq/python/18220.html"

html = getHtml(aurl)

saveHtml("sduview", html)

print("下载成功")

下载文件如下:

程序主要有两个函数,第一个getHtml(url)  功能为打开一个url网络链接,把链接的内容读取出来,存在html变量里;第二个saveHtml(file_name,file_content)  功能为打开一个名为 file_name 的文件,把网页内容写进去。

更多Python知识请关注。

以上是 python如何下载网页? 的全部内容, 来源链接: utcz.com/z/528089.html

回到顶部