小孩子比较喜欢看唱古诗。发现了一个B站UP主婷婷姐姐唱古诗发布了不少古诗视频,打算下载下来放到NAS上,用电视播放给小孩子看。但由于这个并没有专辑,you-get下载时无法按专辑列表批量下载,研究之后整理了一种批量下载的方案。

1. 获取页面视频列表

1.1 用浏览器开发工具,提取视频列表部分的html代码

Snipaste_2022-03-18_23-14-29.png

Snipaste_2022-03-18_23-15-35.png

1.2 提取代码中的视频id

Snipaste_2022-03-18_23-21-51.png
可以观察出data-aid="之后的一段即为视频id,用grep提取出这部分文本

grep -E -o "data-aid=.{1,13}" test.txt

Snipaste_2022-03-18_23-42-19.png
用excel分列分离出视频id,并与B站URL合并成下载列表清单,并通过删除重复值去重。
Snipaste_2022-03-18_23-42-48.png

2. (伪)多线程下载

you-get可以用-I 地址列表选项来下载整个清单的视频,但是顺序下载的,并不具备多线程下载功能。
变通方案是把视频列表拆分成多个列表,开多个窗口,分别读取各段列表,同时下载。

you-get -I list_N.txt

标签: none

添加新评论