66
77读音: ` [ˈfiːplæt] `
88
9+ ![ ] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/09/14/16316112326191.jpg )
10+
11+ ## 特性
12+
13+ 1 . 支持任何python脚本,包括不限于` feapder ` 、` scrapy `
14+ 2 . 支持浏览器渲染,支持有头模式。浏览器支持` playwright ` 、` selenium `
15+ 3 . 支持部署服务,可自动负载均衡
16+ 4 . 支持服务器集群管理
17+ 5 . 支持监控,监控内容可自定义
18+ 6 . 支持起多个实例,如分布式爬虫场景
19+ 7 . 支持弹性伸缩
20+ 8 . 支持4种定时启动方式
21+ 9 . 支持自定义worker镜像,如自定义java的运行环境、机器学习环境等,即根据自己的需求自定义(feaplat分为` master-调度端 ` 和` worker-运行任务端 ` )
22+ 10 . docker一键部署,架设在docker swarm集群上
23+
24+
925## 为什么用feaplat爬虫管理系统
1026
1127** 市面上的爬虫管理系统**
1228
1329![ feapderd] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/23/feapderd.png )
1430
15- 需要先部署好master、worker节点, worker节点常驻,等待master的指令执行任务。一个worker节点里可能同时跑了多个爬虫,一旦一个爬虫内存泄露等原因,可能会引发worker节点崩溃,影响该节点里的全部任务。并且worker数量不能弹性伸缩,无法利用云原生的优势
31+ worker节点常驻,且运行多个任务,不能弹性伸缩,任务之前会相互影响,稳定性得不到保障
1632
1733** feaplat爬虫管理系统**
1834
1935![ pic] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/23/pic.gif )
2036
21- 根据配置的爬虫数动态生成worker,爬虫启动时才创建,爬虫结束时销毁。一个worker内只跑一个爬虫,各个爬虫或任务之间互不影响,稳定性强。系统架设在` docker swarm ` 集群上,一台服务器宕机,worker会自动迁移到其他服务器节点。
22-
23- ![ -w1736] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/23/16270242301134.jpg )
24-
25-
26-
27- ## 特性
28-
29- 1 . 爬虫管理系统不仅支持 ` feapder ` 、` scrapy ` ,且** 支持执行任何脚本** ,可以把该系统理解成脚本托管的平台 。
30-
31- 2 . 支持集群
32- 3 . 工作节点根据配置定时启动,执行完释放,不常驻
33- 4 . 一个worker内只运行一个爬虫,worker彼此之间隔离,互不影响。
34- 5 . 支持** 管理员** 和** 普通用户** 两种角色
35- 6 . 可自定义爬虫端镜像
37+ worker节点根据任务动态生成,一个worker只运行一个任务实例,任务做完worker销毁,稳定性高;多个服务器间自动均衡分配,弹性伸缩
3638
3739
3840## 功能概览
3941
40- [ 点我观看视频] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/爬虫管理平台完整版.mp4 )
41-
4242### 1. 项目管理
4343
44- 项目列表
45- ![ -w1786] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/06/16254967791920.jpg )
46-
4744添加/编辑项目
4845![ -w1785] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/06/16254968151490.jpg )
4946
5047### 2. 任务管理
5148
52- 任务列表
53- ![ -w1791] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/06/16254968630425.jpg )
49+ ![ ] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2022/03/03/16463109796998.jpg )
5450
55- 定时支持 crontab、时间间隔、指定日期、只运行一次 四种方式。只运行一次的定时方式会在创建任务后立即运行
56- ![ -w1731] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/06/16254968513292.jpg )
5751
5852### 3. 任务实例
5953
60- 列表
61- ![ -w1785] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/06/16254981090479.jpg )
62-
6354日志
64- ![ -w1742] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/07/06/16254983085371.jpg )
65-
55+ ![ ] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2022/03/03/16463117042527.jpg )
6656
67- ### 4. 用户管理
6857
69- 用户分为 ** 管理员 ** 和 ** 普通用户 ** 两种角色,管理员可看到全部项目,普通用户只可看到自己创建的项目,且只有管理员可看到用户管理面板
58+ ### 4. 爬虫监控
7059
71- ![ ] ( http://markdown-media.oss-cn-beijing.aliyuncs. com/2021/07/12/16260660857747.jpg )
60+ feaplat支持对feapder爬虫的运行情况进行监控,除了数据监控和请求监控外,用户还可自定义监控内容,详情参考 [ 自定义监控 ] ( http://feapder. com/#/source_code/%E7%9B%91%E6%8E%A7%E6%89%93%E7%82%B9?id=%e8%87%aa%e5%ae%9a%e4%b9%89%e7%9b%91%e6%8e%a7 )
7261
73-
74- ### 5. 爬虫监控
75-
76- feaplat支持对feapder爬虫的运行情况进行监控,除了数据监控和请求监控外,用户还可自定义监控内容,详情参考[ 自定义监控] ( source_code/监控打点?id=自定义监控 )
77-
78- 若scrapy爬虫或其他python脚本使用监控功能,也可通过自定义监控的功能来支持,详情参考[ 自定义监控] ( source_code/监控打点?id=自定义监控 )
62+ 若scrapy爬虫或其他python脚本使用监控功能,也可通过自定义监控的功能来支持,详情参考[ 自定义监控] ( http://feapder.com/#/source_code/%E7%9B%91%E6%8E%A7%E6%89%93%E7%82%B9?id=%e8%87%aa%e5%ae%9a%e4%b9%89%e7%9b%91%e6%8e%a7 )
7963
8064注:需 feapder>=1.6.6
8165
@@ -99,7 +83,10 @@ yum remove docker docker-common docker-selinux docker-engine
9983``` shell
10084yum install -y yum-utils device-mapper-persistent-data lvm2 && python2 /usr/bin/yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo && yum install docker-ce -y
10185```
102-
86+ 国内用户推荐使用
87+ ``` shell
88+ yum install -y yum-utils device-mapper-persistent-data lvm2 && python2 /usr/bin/yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo && yum install docker-ce -y
89+ ```
10390启动
10491``` shell
10592systemctl enable docker
@@ -119,9 +106,18 @@ systemctl start docker
119106sudo curl -L " https://github.com/docker/compose/releases/download/1.29.2/docker-compose-$( uname -s) -$( uname -m) " -o /usr/local/bin/docker-compose
120107sudo chmod +x /usr/local/bin/docker-compose
121108```
109+ 国内用户推荐使用
110+ ``` shell
111+ sudo curl -L " https://get.daocloud.io/docker/compose/releases/download/1.29.2/docker-compose-$( uname -s) -$( uname -m) " -o /usr/local/bin/docker-compose
112+ sudo chmod +x /usr/local/bin/docker-compose
113+ ```
122114
123115### 4. 部署feaplat爬虫管理系统
124-
116+ #### 预备项
117+ 安装git(1.8.3的版本已够用)
118+ ``` shell
119+ yum -y install git
120+ ```
125121#### 1. 下载项目
126122
127123gitub
@@ -142,19 +138,15 @@ cd feaplat
142138docker-compose up -d
143139```
144140
145- - 若端口冲突,可修改.env文件,参考[ 常见问题] ( https://boris.org.cn/feapder/#/feapder_platform/question?id=修改端口 )
146-
147- - 首次运行时,检查下后端日志,看是否运行成功,若报mysql连接错误,重启一次即可解决。这是因为第一次初始化环境,可能后端先于mysql运行了。
148- - 查看后端日志命令:` docker logs -f feapder_backend `
149- - 重启命令:` docker-compose restart `
141+ - 若端口冲突,可修改.env文件,参考[ 常见问题] ( http://feapder.com/#/feapder_platform/question?id=%e4%bf%ae%e6%94%b9%e7%ab%af%e5%8f%a3 )
150142
151143#### 3. 访问爬虫管理系统
152144
153145默认地址:` http://localhost `
154146默认账密:admin / admin
155147
156- - 若未成功,参考[ 常见问题] ( https ://boris.org.cn/ feapder/#/feapder_platform/question)
157- - 使用说明,参考[ 使用说明] ( https ://boris.org.cn/ feapder/#/feapder_platform/usage)
148+ - 若未成功,参考[ 常见问题] ( http ://feapder.com /#/feapder_platform/question)
149+ - 使用说明,参考[ 使用说明] ( http ://feapder.com /#/feapder_platform/usage)
158150
159151#### 4. 停止(可选)
160152
@@ -212,7 +204,20 @@ docker swarm leave
212204ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQCd/k/tjbcMislEunjtYQNXxz5tgEDc/fSvuLHBNUX4PtfmMQ07TuUX2XJIIzLRPaqv3nsMn3+QZrV0xQd545FG1Cq83JJB98ATTW7k5Q0eaWXkvThdFeG5+n85KeVV2W4BpdHHNZ5h9RxBUmVZPpAZacdC6OUSBYTyCblPfX9DvjOk+KfwAZVwpJSkv4YduwoR3DNfXrmK5P+wrYW9z/VHUf0hcfWEnsrrHktCKgohZn9Fe8uS3B5wTNd9GgVrLGRk85ag+CChoqg80DjgFt/IhzMCArqwLyMn7rGG4Iu2Ie0TcdMc0TlRxoBhqrfKkN83cfQ3gDf41tZwp67uM9ZN feapder@qq.com
213205```
214206
215- 或在 ` .env ` 文件里配置您的SSH私钥,然后在git仓库里添加您的公钥。
207+ 或在系统设置页面配置您的SSH私钥,然后在git仓库里添加您的公钥,例如:
208+ ![ ] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/10/19/16346353514967.jpg )
209+
210+ 注意,公私钥加密方式为RSA,其他的可能会有问题
211+
212+ 生成RSA公私钥方式如下:
213+ ``` shell
214+ ssh-keygen -t rsa -C " 备注" -f 生成路径/文件名
215+ ```
216+ 如:
217+ ` ssh-keygen -t rsa -C "feaplat" -f id_rsa `
218+ 然后一路回车,不要输密码
219+ ![ ] ( http://markdown-media.oss-cn-beijing.aliyuncs.com/2021/11/17/16371210640228.jpg )
220+ 最终生成 ` id_rsa ` 、` id_rsa.pub ` 文件,复制` id_rsa.pub ` 文件内容到git仓库,复制` id_rsa ` 文件内容到feaplat爬虫管理系统
216221
217222## 自定义爬虫镜像
218223
@@ -235,11 +240,10 @@ RUN pip3 install feapder \
235240
236241| 类型 | 价格 | 说明 |
237242| ------| -----| -------------------------------|
238- | 免费版 | 0元 | 可部署2个任务 |
239- | 绑定版 | 188元 | 同一公网IP或机器码下永久使用 |
240- | 非绑定版 | 288元 | 永久使用 |
243+ | 试用版 | 0元 | 可部署5个任务,删除任务不可恢复额度|
244+ | 正式版 | 288元 | 有效期一年,可换绑服务器|
241245
242- ** 所有版本功能一致,均可免费更新,永久使用 **
246+ ** 部署后默认为试用版,购买授权码后配置到系统里即为正式版 **
243247
244248购买方式:添加微信 ` boris_tm `
245249
@@ -261,4 +265,4 @@ RUN pip3 install feapder \
261265 </tr>
262266 </table >
263267
264- 加好友备注:feaplat
268+ 加好友备注:feaplat
0 commit comments