首页 > 编程源码 > python爬虫实战之爬视频网4

python爬虫实战之爬视频网4

楼主:喜欢 [2级] · 2020-2-9 ·  浏览1075 · 编程源码 · ID:
python爬虫实战!全是干货!进来看~
【前言】
上面帖子分析了视频网站板块下视频分组URL,这次我们要爬视频!

【工具】
1、python 3X
2、pycharm
3、Sublime
4、chrome
5、notepad++
【实现】
我们需要找到视频真正的播放地址即m3u8链接,这个文件储存的是视频的TS链接,我们要提取出他来,并且下载到本地文件,因模板原因,我会把提取链接跟下载分成两个帖子,下面看代码。
【代码】
try:
lst = []
html = getnumberbuname(url)
restr = r'''width="100%" height="480" src="(.*)" frameborder'''
regex = re.compile(restr, re.IGNORECASE)
mylist = regex.findall(html)
text = mylist[0].split('=')
tet = text[1].rsplit('/', 1)[:1]
print(tet)
#输出信息,用以查看是否正常获取
urls = tet[0] + '/1000k/hls/index.m3u8'
print('获取到m3u8下载链接:', urls)
txt = requests.get(urls).text
res = '''(.*.ts)\n'''
#
获取M3U8里的TS链接
reg = re.compile(res, re.IGNORECASE)
myl = reg.findall(txt)
#取出结果
path = 'd:/视频/电影/' + rod + '/'
#
文件保存路径
print('文件保存在:', path)

except:
return '解析错误'
ps:我删除了一部分代码,那是用来下载二进制文件到我们自己硬盘上的,版面太小放不下。

【结束语】
下载电影板块的视频的代码就这么长,是不是很简单呢?对它实现的非常简单,首先调用一下之前的函数,获取到网页的内容,然后用正则直接取出我们所M3U8链接,再去获取M3U8里的TS链接,然后用二进制的方法下载下来保存到我们电脑上,步骤就这些,很简单把,一起来实现下它。
PS:代码部分我会放在稍后的下载链接里

【下载地址】
蓝奏云下载:

感觉本文不错的就点个赞,加个关注!每天晚上都会有更新哦~~
- 版权声明 - 1、本帖所有言论和图片等纯属网友个人意见,与流星社区立场无关;
2、其他单位或个人使用、转载或引用本帖时必须同时征得该帖子作者喜欢流星社区的同意;
3、备注原文地址:https://bbs.liuxingw.com/t/23248.html,可忽略第2条;
4、帖子作者需承担一切因本文发表而直接或间接导致的相关责任;
5、如本帖内容或部分内容转载自其它媒体,这并不代表本站赞同其观点和对其真实性负责;
6、如本帖若为资源类,将仅限用于学习和研究目的,您必须在下载后的24个小时之内,从您安装或使用的设备中彻底删除上述内容;
7、如果您喜欢该程序,请支持正版软件,购买注册,可以得到更好的正版服务;
8、如本帖侵犯到任何版权或违法问题,请立即邮件告知我们,我们将及时予以处理。
7条回复 |  最后回复于2020-2-9

[]

第一
发布于2020-2-9

回复列表

  • 内容加载中...

说点什么...

喜欢 [2级]

看座
发布于2020-2-9

回复列表

  • 内容加载中...

说点什么...

[]

没有胡楼了
发布于2020-2-9

回复列表

  • 内容加载中...

说点什么...

[]

?。。。。。。。
发布于2020-2-9

回复列表

  • 内容加载中...

说点什么...

[]

本版块最新版规规定发帖主题必须带有相关图片,无相关图片当做无图处理,请楼主尽快补图,长时间未补图会锁帖处理
发布于2020-2-9

回复列表

  • 内容加载中...

说点什么...

喜欢 [2级]

诺诺诺~~~
发布于2020-2-9

回复列表

  • 内容加载中...

说点什么...

[]

楼主是个大方人
发布于2020-2-9

回复列表

  • 内容加载中...

说点什么...
登录注册 后才可进行评论
签到
12人签到
已签0天
  • 46621帖子
  • 1936600热点量
  • 184883火热值