批量下载B站UP主页面内的所有视频
小孩子比较喜欢看唱古诗。发现了一个B站UP主婷婷姐姐唱古诗发布了不少古诗视频,打算下载下来放到NAS上,用电视播放给小孩子看。但由于这个并没有专辑,you-get下载时无法按专辑列表批量下载,研究之后整理了一种批量下载的方案。
1. 获取页面视频列表
1.1 用浏览器开发工具,提取视频列表部分的html代码
1.2 提取代码中的视频id
可以观察出data-aid="
之后的一段即为视频id,用grep
提取出这部分文本
grep -E -o "data-aid=.{1,13}" test.txt
用excel分列分离出视频id,并与B站URL合并成下载列表清单,并通过删除重复值
去重。
2. (伪)多线程下载
you-get
可以用-I 地址列表
选项来下载整个清单的视频,但是顺序下载的,并不具备多线程下载功能。
变通方案是把视频列表拆分成多个列表,开多个窗口,分别读取各段列表,同时下载。
you-get -I list_N.txt