python中urlretrieve如何获取远程文件？

本文教程操作环境：windows7系统、Python 3.9.1，DELL G3电脑。

1、函数说明

这个函数不返回一个类似于文件的对象，而返回一个格式为 (filename, headers) 的元组，其中 filename 是本地文件的名称（由 urllib 自动创建），而 headers 包含一些有关远程文件的信息（这里不会介绍 headers，如果想要更深入的了解它，请在有关 urllib 的标准库文档中查找 urlretrieve）。如果要给下载的副本指定文件名，可通过第二个参数来提供。

2、获取步骤

（1）获取 python 官网的主页，并将其存储到文件 C:\python_webpage.html 中。

urlretrieve('http://www.python.org', 'C:\\python_webpage.html')

（2）使用完毕后，你可能想将其删除，以免占用磁盘空间。要清空这样的临时文件，可调用函数 urlcleanup 且不提供任何参数，它将负责替你完成清空工作。

拓展：

urllib 提供了一些用于操作URL的函数：

（1）quote(string[, safe])：返回一个字符串，其中所有的特殊字符（在 URL 中有特殊意义的字符）都已替换为对 URL 友好的版本（如将 ~ 替换为 %7E）。如果要将包含特殊字符的字符串用作 URL，这很有用。参数 safe 是一个字符串（默认为 '/'），包含不应该像这样对其进行编码的字符。

（2）quote_plus(string[, safe])：类似于 quote，但也将空格替换为加号。

（3）unquote(string)：与 quote 相反。

（4）unquote_plus(string)：与 quote_plus 相反。

数据的远程传输，使得文件信息交流变得更为方便。我们经常会听说，用远程的方式传递一些文件，想必大家还没有使用python来进行过这方面的传输。

标签 Python