文件篇
文件上传和下载是很常见的功能,今天就来梳理一下操作文件过程中常见的概念和 api,加深对文件的理解。
概念
Blob 对象
当用户通过一个input
元素选择文件时,浏览器会创建一个Blob
对象代表该文件的二进制数据。如果要在将文件数据上传到服务器或者存储到本地之前对其进行操作,你可能需要使用 Blob
对象 。
举个例子,你可以使用URL.createObjectURL
方法创建一个URL
代表这个Blob
对象,然后用这个URL
在<img>
或video
元素中展示这个文件。如:
1 | const img = document.createElement('img'); |
File 对象
当用户通过一个input
元素选择文件时,浏览器会创建一个基于Blob
对象的File
对象,并添加文件名name
、大小size
、上次修改日期lastModifiedData
等属性。如果要在将文件上传到服务器之前验证文件的属性,则可能需要使用File
对象。
:::info
也就是说,File 对象是一种 Blob 对象,他包含了文件的附加信息,如 name、size、lastModifiedDate 等属性。开发人员无法直接访问底层的 Blob 对象,而是通过 api 与 File 对象进行交互。
:::
base 64
base64 编码将二进制数据表示为一串 ASCII 字符「我们常说的字符串」。
有些场合并不能传输或者储存二进制流,这时候就需要使用 base64 编码。
比如,一个传输协议是基于 ASCII 文本的,那么他就不能传输二进制流,想要传输该二进制流就得编码。常用的 http 协议的 url 就是纯文本的,不能直接放二进制流。
大多数现代语言的 String 类型,都不能直接存储二进制流,但可以储存 base64 编码的字符串。
举个例子,你可以使用FileReader.readAsDataURL()
方法读取 File 对象的内容并将其转换为 base64 编码的 data:URL 格式的字符串,简称DataURL
。
这个 DataURL 表示所读取的文件内容,可以将其发送到服务器。然后服务器可以将 DataURL 解码回二进制数据
并将其保存为文件。
1 | /** |
简单的文件上传
文件上传的传统形式,是使用type='file'
的input
表单元素
1 | <input type="file" id="file-input" accept=".jpg, .jpeg, .png" multiple /> |
可以添加change
事件监听读取文件对象列表event.target.files
:
1 | const fileInput = document.getElementById('file-input'); |
File 对象:
文件上传前,可以通过File
对象,验证文件大小、类型等信息,决定是否进行下一步,比如验证文件大小。
验证文件大小
1 | <input type="file" id="file-input" /> |
1 | const fileInput = document.getElementById('file-input'); |
1 | 获取 files 的方式: |
显示读取进度(下载文件的场景)
FileReader.onprogresspregress
事件,在读取Blob
时触发。在下载文件并显示进度这个场景下能够派上用场。
1 | <input type="file" id="file-input" /> |
readAsDataURL
能够读取Blob
对象,然后监听FileReader
的progress
事件,通过ProgressEvent.loaded
和ProgressEvent.total
计算读取的进度。
1 | const fileInput = document.getElementById('file-input'); |
显示上传进度
要显示文件的上传进度,可以使用 JavaScript 中的 XMLHttpRequest (XHR) 对象将文件上传到服务器并使用 XMLHttpRequest.upload.onprogress
事件跟踪进度。这是一个例子:
1 | const fileInput = document.getElementById('file-input'); |
上传目录
input
元素的webkitdirectory
属性,表示允许用户选择文件目录,而不是文件。
1 | <input type="file" id="file-input" webkitdirectory /> |
选择目录时,该目录下的文件会全部选中(包括子孙文件)。
拖放上传
设置一个放置文件的目标元素。
1 | <div id="drop-zone">Drop files here</div> |
调用 event.preventDefault()
,这使它能够接收 drop 事件。
1 | const dropZone = document.getElementById('drop-zone'); |
Content-Type(表单的 enctype 属性)
当 method 属性值为 post 时,enctype 就是将表单的内容提交给服务器的数据编码类型。可能的取值有:
- application/x-www-form-urlencoded:未指定属性时的默认值。
- multipart/form-data:当表单包含 type=file input 元素时使用此值。
- text/plain:出现于 HTML5,用于调试。这个值可被
<button>
、<input type="submit">
或<input type="image">
元素上的 formenctype 属性覆盖。
application/x-www-form-urlencoded
这种数据编码类型只支持传输文本数据
1 | POST http://www.example.com HTTP/1.1 |
首先,Content-Type
被指定为 application/x-www-form-urlencoded
;其次,提交的数据按照 key1=val1&key2=val2
的方式进行编码,key
和 val
都进行了 URL 转码。大部分服务端语言都对这种方式有很好的支持。
此类型不适合用于传输大型二进制数据或者包含非 ASCII 字符的数据。平常我们使用这个类型都是把表单数据使用 url 编码后传送给后端,二进制文件当然没办法一起编码进去了。所以 multipart/form-data 就诞生了。
multipart/form-data
为了支持文件上传,表单数据必须使用multipart/form-data
内容类型进行编码。这种编码格式允许二进制数据作为请求主体的一部分发送。
1 | POST http://www.example.com HTTP/1.1 |
Content-Type
被指定为multipart/form-data
,boundary
为----WebKitFormBoundaryrGKCBY7qhFd3TrwA
。boundary
用于分割提交的数据。Content-Disposition
包含文件的基本信息,Content-Type
表示文件内容类型。
第一部分是一个名为text
的表单字段,该字段的内容是字符串title
。第二部分是名为file
的字段,文件名为chrome.png
,文件内容类型为image/png
,内容为PNG ... content of chrome.png ...
,然后以boundary
为结尾。
FormData()
这是一个传统的最简单的 form 表单上传如下:
1 | <form method="POST" enctype="multipart/form-data"> |
FormData 的由来:
当使用 Ajax 上传文件时,如果不指定enctype="multipart/form-data"
,会导致后端在解析 Form 表单的数据格式时与 Ajax 上传的数据格式不一致的问题。为了后端能够使用相同的代码解析这两种提交方式,所以出现了FormData
。
FormData 接口提供了一种表示表单数据的键值对key/value
的构造方式,可以轻松的将数据通过 Ajax 发送出去。
1 | const formData = new FormData(); |
使用 FormData 上传文件时,无需手动设置Content-Type='multipart/form-data'
,FormData 会自动设置正确的 Content-Type 和 数据类型。
实际开发过程中也是如此,通常会使用 FormData 格式保存文件,关于Content-Type
需要什么类型,取决于后端是怎么设计的。
下载
window.open
open()
方法,用于将指定的资源加载到浏览器新的窗口或者标签页。
当我们指定一个图片链接时,浏览器会自动下载该资源,下载后自动关闭该窗口。
1 | const imgUrl = |
location.href
location.href
表示将当前页面的 URL 设置为一个新的值。它是一个字符串,包含当前页面的完成 URL,包括协议、域名、路径、查询参数和片段标识符。
1 | const imgUrl = |
window.open
和location.href
的区别:
window.open
会打开一个新窗口或选项卡,而location.href
会替换当前页window.open
打开太多新窗口可能会对用户体验产生负面影响location.href
可能会刷新整个页面(但如果在输入框中输入了文本,加载新页面时文本内容不会丢失,这是因为浏览器通常将表单数据保存在浏览器的缓存中)
a 标签
a 标签通常用于用户启动的交互,而location.href
通常用于响应用户事件。
a 标签的方式属性更多,如download
、target
,也更为灵活,在实际开发过程中,我们通常会使用 a 标签封装一个下载功能的函数来使用,如下:
1 | function downloadFile(url, fileName) { |
总结
- File 对象是基于 Blob 对象的,只不过多了一些附加信息,如
name
、size
等 - 想要显示文件读取进度时,我们可以通过 FileReader 的 readAsDataURL(file) 方法,然后监听
FileReader
的progress
事件 - 想要显示上传到服务器的进度时,可以通过
xhr.upload.onprogress
事件 - 使用 FormData 上传文件时,无需手动设置
Content-Type='multipart/form-data'
,FormData 会自动设置正确的 Content-Type 和 数据类型
实际项目应用中,大多数的表单场景都是手动上传文件到服务器,也就是说在提交到服务器之前,我们是不需要使用后端接口的。但现实中遇到的情况往往是后端提供一个上传接口,再提供一个提交表单数据的接口,前一个接口就显得很多余,而且存在数据库内存被乱用的风险。
参考: