python爬虫实战!全是干货!进来看~
【前言】
上面帖子分析了视频网站板块下视频分组URL,这次我们要爬视频!
【工具】
1、python 3X
2、pycharm
3、Sublime
4、chrome
5、notepad++
【实现】
我们需要找到视频真正的播放地址即m3u8链接,这个文件储存的是视频的TS链接,我们要提取出他来,并且下载到本地文件,因模板原因,我会把提取链接跟下载分成两个帖子,下面看代码。
【代码】
try:
lst = []
html = getnumberbuname(url)
restr = r'''width="100%" height="480" src="(.*)" frameborder'''
regex = re.compile(restr, re.IGNORECASE)
mylist = regex.findall(html)
text = mylist[0].split('=')
tet = text[1].rsplit('/', 1)[:1]
print(tet)
#输出信息,用以查看是否正常获取
urls = tet[0] + '/1000k/hls/index.m3u8'
print('获取到m3u8下载链接:', urls)
txt = requests.get(urls).text
res = '''(.*.ts)\n'''
#获取M3U8里的TS链接
reg = re.compile(res, re.IGNORECASE)
myl = reg.findall(txt)
#取出结果
path = 'd:/视频/电影/' + rod + '/'
#文件保存路径
print('文件保存在:', path)
except:
return '解析错误'
ps:我删除了一部分代码,那是用来下载二进制文件到我们自己硬盘上的,版面太小放不下。
【结束语】
下载电影板块的视频的代码就这么长,是不是很简单呢?对它实现的非常简单,首先调用一下之前的函数,获取到网页的内容,然后用正则直接取出我们所M3U8链接,再去获取M3U8里的TS链接,然后用二进制的方法下载下来保存到我们电脑上,步骤就这些,很简单把,一起来实现下它。
PS:代码部分我会放在稍后的下载链接里
【下载地址】
蓝奏云下载:
感觉本文不错的就点个赞,加个关注!每天晚上都会有更新哦~~
