chromedriver之“”提示处理

背景

最近在使用selenium进行自动文件下载时,突然出现了一个报错:

error

下载进行不下去了。

思路

经过各种谷歌、百度,均告诉我在要增加params,关闭浏览器安全选项,配置如下:

1
2
3
4
5
6
7
chromeOptions = webdriver.ChromeOptions()
prefs = {"profile.default_content_settings.popups": 0,
"download.default_directory": path,
"download.prompt_for_download": False,
# "download.directory_upgrade": 'true',
"safebrowsing.enabled": True}
chromeOptions.add_experimental_option("prefs", prefs)

事实证明,可能以前的版本是可行的,现在的真心不行。

上面配置重点是"safebrowsing.enabled": True。在MacOS的环境下,哪怕不配也是没有问题的,Windows就不行了。

最后在谷歌上找到一篇相关文章,大意是说这个是无解的,可能是windows系统安全的问题,

对于这个解释我还是比较认可的,所以在mac上就不会提示。

Let’s start frankly: you can’t disable this feature. You can merely tweak the download settings in order to avoid it.

https://windowsreport.com/type-of-file-can-harm-computer/

那么问题来了,既然这样,有什么曲线救国的办法呢?

当chromedriver弹出这个提示的时候,其实文件已经下载完成,如下图:

download

我们只需要将文件名修改为正确的名字和后缀即可(比如test.txt),直接无视警告提醒。思路如下:

  • 找到最新下载的文件:通过对下载目录的文件按照创建时间排序,找到最新的
  • 判断是否该文件是否已下载完成:通过判断时间间隔前后该文件是否有大小的变化

结论

根据上面思路,实现的关键代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
def sort_file():
global path
dir_lists = os.listdir(path)
dir_lists.sort(key=lambda fn: os.path.getmtime(os.path.join(path, fn)))
return dir_lists[-1]

def changeName(path, oldname, newname):
old_path = os.path.join(path, oldname)
new_path = os.path.join(path, newname + '.txt')
if os.path.exists(old_path):
if os.path.exists(new_path):
os.remove(new_path)
os.rename(old_path, new_path)
print ('rename done!' + newname)
else:
print ('no file found!')

def download():
...
temp_filename = sort_file()
if u'未确认' in temp_filename:
temp_filesize_old = os.path.getsize(os.path.join(path, temp_filename))
while True:
time.sleep(1)
temp_filesize_new = os.path.getsize(os.path.join(path, temp_filename))
if temp_filesize_old == temp_filesize_new:
changeName(path, temp_filename, ip)
return
else:
temp_filesize_old = temp_filesize_new
else:
print(u'下载失败')

需要注意的是,在文件重命名的时候,先检查下文件是否已经存在,先删除,在创建。

以上。如果有更好的思路,欢迎分享。