python中urlretrieve如何获取远程文件?

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

1、函数说明

这个函数不返回一个类似于文件的对象,而返回一个格式为 (filename, headers) 的元组,其中 filename 是本地文件的名称(由 urllib 自动创建),而 headers 包含一些有关远程文件的信息(这里不会介绍 headers,如果想要更深入的了解它,请在有关 urllib 的标准库文档中查找 urlretrieve)。如果要给下载的副本指定文件名,可通过第二个参数来提供。

2、获取步骤

1)获取 python 官网的主页,并将其存储到文件 C:\python_webpage.html 中。

urlretrieve('http://www.python.org', 'C:\\python_webpage.html')

2)使用完毕后,你可能想将其删除,以免占用磁盘空间。要清空这样的临时文件,可调用函数 urlcleanup 且不提供任何参数,它将负责替你完成清空工作。

拓展:

urllib 提供了一些用于操作URL的函数:

(1)quote(string[, safe]):返回一个字符串,其中所有的特殊字符(在 URL 中有特殊意义的字符)都已替换为对 URL 友好的版本(如将 ~ 替换为 %7E)。如果要将包含特殊字符的字符串用作 URL,这很有用。参数 safe 是一个字符串(默认为 '/'),包含不应该像这样对其进行编码的字符。

(2)quote_plus(string[, safe]):类似于 quote,但也将空格替换为加号。

(3)unquote(string):与 quote 相反。

(4)unquote_plus(string):与 quote_plus 相反。

数据的远程传输,使得文件信息交流变得更为方便。我们经常会听说,用远程的方式传递一些文件,想必大家还没有使用python来进行过这方面的传输。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。