首页 > 编程源码 > python爬取ppt模板教程

python爬取ppt模板教程

楼主:昔瞳瞳 [1级] · 2020-8-18 ·  浏览2132 · 编程源码 · ID:
首先进去1ppt.com随便选择一个分类
- 版权声明 - 1、本帖所有言论和图片等纯属网友个人意见,与流星社区立场无关;
2、其他单位或个人使用、转载或引用本帖时必须同时征得该帖子作者昔瞳瞳流星社区的同意;
3、备注原文地址:https://bbs.liuxingw.com/t/32675.html,可忽略第2条;
4、帖子作者需承担一切因本文发表而直接或间接导致的相关责任;
5、如本帖内容或部分内容转载自其它媒体,这并不代表本站赞同其观点和对其真实性负责;
6、如本帖若为资源类,将仅限用于学习和研究目的,您必须在下载后的24个小时之内,从您安装或使用的设备中彻底删除上述内容;
7、如果您喜欢该程序,请支持正版软件,购买注册,可以得到更好的正版服务;
8、如本帖侵犯到任何版权或违法问题,请立即邮件告知我们,我们将及时予以处理。
20条回复 |  最后回复于2020-8-18

昔瞳瞳 [1级]

创建文件夹那步写错了
把之前分析的写在括号里然后打印
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

复制到记事本中可以看到都没有前缀等下补全就行了
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

使用列表推导式补全链接
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

再回到网站中使用左上角的小鼠标点击ppt的名字可以看到它是a标签中的文本
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

这个网站有一点特殊打印出来全都是乱码所以我们在响应数据那一步不要加.text
使用encoding将编码改成gbk
在解析的时候加上text就不会出现乱码问题
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

这一次先不讲翻页的问题。
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

15楼补图,
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

然后把名称和链接合成一个字典。可能有其他方法我自己喜欢这样。
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

在回到网站中随便点击一个模板进去网页往下翻可以看到下载地址然后检查刷新网站.....和上面一样不啰嗦了。
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...

昔瞳瞳 [1级]

然后和之前一样响应数据解析获取下载链接
发布于2020-8-18

回复列表

  • 内容加载中...

说点什么...
登录注册 后才可进行评论
签到
4人签到
已签0天
  • 46215帖子
  • 1931578热点量
  • 182989火热值