pyppeteer如何使用如下的代理?
我在使用代理的时候,按照这样配置
start_parm = { # 启动chrome的路径
"executablePath": r"C:\Users\1\Desktop\spider(1)\spider\spider\chrome-win\chrome.exe",
# 关闭无头浏览器
"headless": False,
"dumpio": True,
"args": [
'--disable-infobars', # 关闭自动化提示框
# '--window-size=1920,1080', # 窗口大小
'--log-level=30', # 日志保存等级, 建议设置越好越好,不然生成的日志占用的空间会很大 30为warning级别
'--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36', # UA
'--no-sandbox', # 关闭沙盒模
'--start-maximized', # 窗口最大化模式
# '--proxy-server=' + f'{proxy_ip[a]["ip"]:{proxy_ip[a]["port"]}}'
f'--proxy-server=xxxxxx:11111',
'userDataDir="D:/UserData"' # 用户文件地址
],
}
然后再await page.authenticate({'username': 'xxx', 'password': 'xxx'})
这样是OK的。
但是,由于我想使用的是隧道代理,代理有多个通道,用requests库是这样的实例代码:
import requestsproxyAddr = ""
authKey = ""
password = ""
proxyUrl = "http://%(user)s:%(password)s:%(channel)s@%(server)s" % {
"user": authKey,
"password": password,
"channel": "channel-1",
"server": proxyAddr,
}
proxies = {
"http": proxyUrl,
"https": proxyUrl,
}
resp = requests.get("https://ip.cn/api/index?ip=&type=0", proxies=proxies)
print(resp.text)
多了一个参数channel,如果直接把proxy-server改成proxyUrl会报错,net::ERR_NO_SUPPORTED_PROXIES
而如果这样
await page.authenticate({'username': 'xxx', 'password': 'xxx', 'channel': 'channel-1'})await page2.authenticate({'username': 'xxx', 'password': 'xxx', 'channel': 'channel-2'})
,看似能连着用,但实际上无法使用1和2两个通道,都是用的隧道代理中默认的channel-1。
请pyppetter问该如何使用同一个代理服务器的多个通道呢?
回答:
import asynciofrom pyppeteer import launch
async def main():
browser1 = await launch(args=['--proxy-server=http://proxyserver:port'])
page1 = await browser1.newPage()
await page1.authenticate({'username': 'user1', 'password': 'pass1'})
await page1.goto('http://example.com')
await page1.screenshot({'path': 'example1.jpg'})
browser2 = await launch(args=['--proxy-server=http://proxyserver:port'])
page2 = await browser2.newPage()
await page2.authenticate({'username': 'user2', 'password': 'pass2'})
await page2.goto('http://example.com')
await page2.screenshot({'path': 'example2.jpg'})
await browser1.close()
await browser2.close()
asyncio.get_event_loop().run_until_complete(main())
把username、password和proxyAddr换为你实际值。
以上是 pyppeteer如何使用如下的代理? 的全部内容, 来源链接: utcz.com/p/938970.html