我们可以以某种方式重命名使用puppeteer下载的文件吗?
我正在通过puppeteer将文件下载到我的目录中。我需要将此文件上传到s3存储桶,因此我需要选择文件名。但是问题是,此文件名的时间戳每次都会更改,因此我无法保留硬编码名称。那么有没有办法解决这个问题,以便每次都获得一个常量名称(即使替换了旧文件),或者如何重命名正在下载的文件?
我想到了使用节点的fs.rename()函数,但这又需要当前的文件名。
我想要一个恒定的文件名来进行硬编码,然后上传到s3存储桶中。
await page._client.send('Page.setDownloadBehavior', {behavior: 'allow', downloadPath: './xml'}); // This sets the directory await page.keyboard.press('Tab');
await page.keyboard.press('Enter'); // This downloads an XML file.
回答:
您有两种选择:
- 监视请求/响应以记录文件名并通过Node.js重命名
- 使用Chrome DevTools协议修改响应标头
选项1:监控请求/响应
这是最简单的方法。监视所有响应,以防万一您注意到正在下载的响应,请使用名称通过本地重命名fs.rename
。
const path = require('path');// ...
page.on('response', response => {
const url = response.request().url();
const contentType = r.headers()['content-type'];
if (/* URL and/or contentType matches pattern */) {
const fileName = path.basename(r.request().url());
// handle and rename file name (after making sure it's downloaded)
}
});
该代码侦听所有响应并等待特定的模式(例如contentType ===
'application/pdf')。然后,它从请求中获取文件名。根据您的用例,您可能还需要检查Content-
Disposition标题。之后,您必须等待文件下载完毕(例如,文件存在且文件大小不变),然后才能对其进行重命名。
选项2:使用Chrome DevTools协议修改响应标头
我99%确信,这是可能的。您需要截获人偶本身当前不支持的响应。但是,由于Chrome
DevTools协议支持此功能,因此可以使用低级协议来使用它。
想法是拦截响应并将Content-Disposition
标头更改为所需的文件名。
这里是想法:
- 使用
chrome-remote-interface
或CDP会话激活Network.requestIntercepted
- 听
Network.requestIntercepted
事件 - 发送
Network.getResponseBodyForInterception
以接收响应的正文 - 修改正文并添加(或更改)
Content-Disposition
标题以包含文件名 - 致电
Network.continueInterceptedRequest
修改后的回复
然后,应使用修改后的文件名保存文件。在github上查看此注释以获取代码示例。正如我已经解释的那样,只要操纵up不支持修改响应,这是一种相当复杂的方法。
以上是 我们可以以某种方式重命名使用puppeteer下载的文件吗? 的全部内容, 来源链接: utcz.com/qa/399349.html