- 博客(126)
- 收藏
- 关注
转载 50行Python代码实现视频中物体颜色识别和跟踪!
目前计算机视觉(CV)与自然语言处理(NLP)及语音识别并列为人工智能三大热点方向,而计算机视觉中的对象检测(objectdetection)应用非常广泛,比如自动驾驶、视频监控、工业质检、医疗诊断等场景。目标检测的根本任务就是将图片或者视频中感兴趣的目标提取出来,目标的识别可以基于颜色、纹理、形状。其中颜色属性运用十分广泛,也比较容易实现。下面就向大家分享一个我做的小实验———通过Ope...
2019-11-20 13:34:42
894
转载 Python爬虫,批量下载小说网站上的小说!
爬虫脚本把这个小说网上的几乎所有小说都下载到了本地,一共27000+本小说,一共40G。完整代码: ...
2019-11-19 14:13:07
2889
1
转载 Python爬虫框架:scrapy爬取知乎数据!
环境需求基础环境沿用之前的环境,只是增加了MongoDB(非关系型数据库)和PyMongo(Python 的 MongoDB 连接库),默认我认为大家都已经安装好并启动 了MongoDB 服务。测试爬虫效果我这里先写一个简单的爬虫,爬取用户的关注人数和粉丝数,代码如下:import scrapyclass ZhuHuSpider(scrapy.Spider): """ 知...
2019-11-19 14:11:41
1590
转载 Python爬虫爬取智联招聘!谁说Python岗位少的?
运行平台:Windows Python版本:Python3.6 IDE:Sublime Text 其他工具:Chrome浏览器0、写在前面的话本文是基于基础版上做的修改,如果没有阅读基础版,请移步Python爬虫抓取智联招聘(基础版)在基础版中,构造url时使用了urllib库的urlencode函数: url = 'https://sou.zhaopin.c...
2019-11-19 14:07:21
690
转载 Python爬虫反反爬:CSS反爬加密彻底破解!
0 惯性嘚瑟刚开始搞爬虫的时候听到有人说爬虫是一场攻坚战,听的时候也没感觉到特别,但是经过了一段时间的练习之后,深以为然,每个网站不一样,每次爬取都是重新开始,所以,爬之前谁都不敢说会有什么结果。前两天,应几个小朋友的邀请,动心思玩了一下大众点评的数据爬虫,早就听说大众点评的反爬方式不一般,貌似是难倒了一片英雄好汉,当然也成就了网上的一众文章,专门讲解如何爬取大众点评的数据...
2019-11-19 14:05:40
898
转载 python爬虫教程,爬取任意网站上面的视频!
前言对于Python爬虫很多人都不陌生,可以用它来批量下载文字、图片、视频等,其中涉及的知识点也是比较多的,但是Python中有一个方法,一行代码就能爬取任意网站上面的视频,只要你安装了Python环境就可以,哪怕是小白也能轻松学会。You-GetYou-Get是一个基于 Python 3 的下载工具。使用 You-Get 可以很轻松的下载到网络上的视频、图片及音乐。1.安装P...
2019-11-19 14:02:37
11647
6
转载 遇到需要的登录的网站怎么办?用这3招轻松搞定!
你好由于你是游客无法查看本文请你登录再进谢谢合作当你在爬某些网站的时候需要你登录才可以获取数据咋整?莫慌小帅b把这几招传授给你让你以后从容应对那么接下来就是学习 python 的正确姿势登录的常见方法无非是这两种1、让你...
2019-11-19 13:57:59
2957
转载 Python 爬取分析全国 12 个城市 4 万条房价信息,告诉你该怎样买房?
通过分页、线程池、代理池等技术,快速爬取链家网近4万条在售二手房信息,速度可达 10000 条 / 5 分钟。通过对二手房作数据分析,得到北上广深等(新)一线城市四地房价的纵向比较,同时对各个城市各个区的房价做横向对比,并将对比结果可视化出来。主要用到的库或模块包括 Requests、PyQuery、ThreadPoolExecutor、JSON、Matplotlib、PyEcharts。...
2019-11-19 13:29:46
437
转载 这段 Python 代码让程序员赚 300W,公司已确认!网友:神操作!
Python到底还能给人多少惊喜?笔者最近看到了这两天关于Python最热门的话题,关于《地产大佬潘石屹学Python的原因》,结果被这个回答惊到了:躺赚300万,相当于普通程序员10年的工资。没想到Pyhon这么强大,怪不得有人说Python“除了不会生孩子,Python什么都会。”所以,Python到底还能征服多少人?Python到底还能“造福”多少程序员...
2019-11-19 13:26:22
295
转载 Python爬虫基础:验证码的爬取和识别详解!
今天要给大家介绍的是验证码的爬取和识别,不过只涉及到最简单的图形验证码,也是现在比较常见的一种类型。运行平台:WindowsPython版本:Python3.6IDE: Sublime Text其他:Chrome浏览器简述流程:步骤1:简单介绍验证码步骤2:爬取少量验证码图片步骤3:介绍百度文字识别OCR步骤4:识别爬取的验证码步骤5:简单图像处理目前,...
2019-11-18 19:42:23
367
转载 Python爬虫:模拟登录知乎完全详解!
这几天在研究模拟登录, 以知乎 - 与世界分享你的知识、经验和见解为例。实现过程遇到不少疑问,借鉴了知乎xchaoinfo的代码,万分感激!知乎登录分为邮箱登录和手机登录两种方式,通过浏览器的开发者工具查看,我们通过不同方式登录时,网址是不一样的。邮箱登录的地址email_url = 'https://www.zhihu.com/login/email',手机登录网址是phone_url =...
2019-11-18 19:18:17
877
转载 我用python破解了同事的加密压缩包!
又是一杯奶茶。事情的经过是这样的:又是奶茶,行吧行吧。快点开工,争取李大伟回来之前搞定。李大伟说是6位数字密码那么我们可以利用python生成全部的六位数字密码#生成从000000到99999的密码表f=open('passdict.txt','w')foridinrange(1000000)...
2019-11-18 19:13:42
211
原创 使用python结合java写一个自动填写日报程序!
一、前期准备1、要写python首先要搭建python环境(1)首先从python官网下载python安装程序,或者可以到我的网盘直接下载python3.70的版本 ,提取密码vsfr(2)下载完后就可以安装了,路径可以自动选择(3)安装python的运行环境后就可以安装python的客户端工具JetBrains PyCharm Community Edit...
2019-11-18 19:08:23
673
转载 Python数据分析、挖掘常用工具!记得收好备用!
Python语言:简要概括一下Python语言在数据分析、挖掘场景中常用特性:列表(可以被修改),元组(不可以被修改) 字典(<k,v>结构) 集合(同数学概念上的集合) 函数式编程(主要由lambda()、map()、reduce()、filter()构成)Python数据分析常用库:Python数据挖掘相关扩展库N...
2019-11-18 19:04:18
262
原创 Python小技巧:使用一行命令把你的电脑变成服务器!
不知道你有没有遇到这么一种情况,就是你有时候想要把电脑上的一些东西传输到你的手机或者Pad ,你要么需要使用数据线连接到电脑,有时候还要装各种驱动才可以进行数据传输,要么需要借助第三方的工具,在局域网上传输,还有就是使用微信的文件传输助手...不过这些操作都有些局限,比如各种驱动安装不上,第三方的工具突然傻逼,又或者突然断网,这就 wtf 了。...
2019-11-18 18:59:32
452
转载 突发!删除系统 Python 引发的惨案!这个命令符不可再用!
这个案例告诉我们,千万不要动系统自带的 Python,Win系统除外由于实验需要使用 Python3.6 以上版本,于是决定卸载 Python3.5。没用,终端输入 python3 还是可以使用。于是,网上查找卸载python3.5的方法:or接下来,终端输入 python3 依然还是可以使用。然后,突然发现侧边菜单栏变灰,感觉不对劲,重启。然后,侧边菜单栏不见了,右...
2019-11-18 18:57:09
219
原创 Python 的一个脚本错误可能会废掉 150 多个项目!
最近,一组用于计算分析的Python脚本中的一个编程错误可能会导致150篇已发表的化学研究论文作废,而造成这种差异性的罪魁祸首是该脚本使用了Python的glob模块......最近,一组用于计算分析的Python脚本中的一个编程错误可能会导致150篇已发表的化学研究论文作废。夏威夷大学在最近发表的一篇研究论文中揭示了这个名为Willoughby-Hoye脚本中的一处编...
2019-11-18 18:53:46
169
原创 Python爬虫:抓取手机APP的数据!谁说不能爬取app数据的?
摘要大多数APP里面返回的是json格式数据,或者一堆加密过的数据 。这里以超级课程表APP为例,抓取超级课程表里用户发的话题。1抓取APP数据包表单:表单中包括了用户名和密码,当然都是加密过了的,还有一个设备信息,直接post过去就是。另外必须加header,一开始我没有加header得到的是登录错误,所以要带上heade...
2019-11-17 14:50:18
3131
转载 Python爬虫和反爬虫的斗争!掌握这个10K工作不是问题!
在抓取对方网站、APP 应用的相关数据时,经常会遇到一系列的方法阻止爬虫。一方面是为了保证服务的质量,另一方面是保护数据不被获取。常见的一些反爬虫 和反反爬虫的手段如下。(1)IP 限制IP 限制是很常见的一种反爬虫的方式。服务端在一定时间内统计 IP 地址的访问 次数,当次数、频率达到一定阈值时返回错误码或者拒绝服务。这种方式比较直接 简单,但在 IPv4 资源越来越不足的情况下,很...
2019-11-17 14:36:35
615
转载 Python爬虫入门并不难,甚至进阶也很简单!看完这篇文章就会了!
互联网的数据爆炸式的增长,而利用 Python 爬虫我们可以获取大量有价值的数据:1.爬取数据,进行市场调研和商业分析爬取知乎优质答案,筛选各话题下最优质的内容; 抓取房产网站买卖信息,分析房价变化趋势、做不同区域的房价分析;爬取招聘网站职位信息,分析各行业人才需求情况及薪资水平。2.作为机器学习、数据挖掘的原始数据比如你要做一个推荐系统,那么你可以去爬取更多维度的数据...
2019-11-17 14:28:30
408
转载 Python爬虫:一些常用的爬虫技巧总结!拿上即用!
用python也差不多一年多了,python应用最多的场景还是web快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码识别脚本。爬虫在开发过程中也有很多复用的过程,这里总结一下,以后也能省些事情。1、基本抓取网页get方法import urllib2 url = "http://www.baidu.com" respo...
2019-11-17 14:18:26
342
转载 实战案例:带你了解并验证基金定投,附Python代码!
???? Index常见基金介绍 基金定投介绍 基金选择方法 指数基金验证 总结与后续动作???? 常见基金的介绍我们可以在证券交易所上进行交易的基金主要分为三类:1、ETF基金交易型开放式指数基金,通常又被称为交易所交易基金(Exchange Traded Funds,简称“ETF”),是一种在交易所上市交易的、基金份额可变的一种开放式基金,投资者可以在ETF市场价格与基金单...
2019-11-17 13:56:23
1291
原创 Python之极验滑动验证码的识别!其实验证码也不难嘛!
1 滑动验证码的识别介绍本节目标:用程序识别极验滑动验证码的验证,包括分析识别思路、识别缺口位置、生成滑块拖动路径、模拟实现滑块拼合通过验证等步骤。 准备工作:本次案例我们使用Python库是Selenium,浏览器为Chrome。请确保已安装Selenium库和ChromeDriver浏览器驱动。 了解极验滑动验证码: 极验滑动验证码官网为:http://www.geetest.co...
2019-11-17 13:50:34
314
原创 Python 从业十年是种什么体验?老程序员的一篇万字经验分享!
我“接触” Python 已有十年了,当初我们要做一个网站,有个学弟只花两天,就用 Django 开发好了后台。那是我第一次感受到了 Python 的强大魅力。不过,我正式学习和使用它,才仅有两年时间……标题中说的“从业十年”,并不是指我,而是指文章的作者。像他拥有这么长的 Python 经验的程序员并不多见,写成文章分享出来的就更少见了。所以这篇文章还挺有价值的,内容很丰富,特分享给大...
2019-11-17 13:47:11
365
原创 教你使用Python从零开始搭建一个区块链项目!
你是否会和我一样,对加密数字货币底层的区块链技术非常感兴趣,特别想了解他们的运行机制。但是学习区块链技术并非一帆风顺,我看多了大量的视频教程还有各种课程,最终的感觉就是真正可用的实战课程太少。我喜欢在实践中学习,尤其喜欢以代码为基础去了解整个工作机制。如果你我一样喜欢这种学习方式,当你学完本教程时,你将会知道区块链技术是如何工作的。写在开始之前记住,区块链是一个不可变的、有序的...
2019-11-17 13:36:53
814
转载 万亿条数据查询如何做到毫秒级响应?
我们的痛点系统架构要求 勘探 MySQL Sharding 和 MHA 的缺点什么是 TiDB? 我们如何使用 TiDB我们架构中的 TiDB TiDB 的性能指标我们学到了什么更快地导入数据 减少查询延迟 评估资源对 TiDB 3.0 的期望 下一步是什么知乎,在古典中文中意为“你知道吗?”,它是中国的 Quora,一个问答网站,其中各种问题由用户社区创建,回答,编辑...
2019-11-17 13:24:23
426
转载 49式!Python初级到高级招式都全了!
01 初学者1. Welcome to Python.orghttps://www.python.org/ 官方Python站点提供了一个开始使用Python生态系统和学习Python的好方法,包括官方文档。2. Learning Python The Hard Wayhttps://learnpythonthehardway.org/book/ 一本在线书籍,有付费版与免费版的...
2019-11-15 15:04:28
982
转载 解放双手,用Python实现自动发送邮件!
使用Python实现自动化邮件发送,可以让你摆脱繁琐的重复性业务,节省非常多的时间。Python有两个内置库:smtplib和email,能够实现邮件功能,smtplib库负责发送邮件,email库负责构造邮件格式和内容。邮件发送需要遵守SMTP协议,Python内置对SMTP的支持,可以发送纯文本邮件、HTML邮件以及带附件的邮件。1、先导入相关的库和方法 ...
2019-11-15 15:02:14
495
原创 由浅入深:Python 中如何实现自动导入缺失的库?
在写 Python 项目的时候,我们可能经常会遇到导入模块失败的错误:ImportError: No module named 'xxx'或者ModuleNotFoundError: No module named 'xxx'。导入失败问题,通常分为两种:一种是导入自己写的模块(即以 .py 为后缀的文件),另一种是导入三方库。本文主要讨论第二种情况,今后有机会,我们再详细讨论其它的相关话题。...
2019-11-15 14:57:45
158
原创 BadPatch恶意活动再次浮出水面:发现新型Python恶意软件!
主题Python前言在我们通过各种来源持续进行威胁监控的过程中,FortiGuard Labs发现了一条安全研究员@h4ckak发表的推文,其内容涉及到可疑文件,该文件看起来像是APT活动中的诱饵文件。我们对其进行了更加深入的研究,发现该文件很可能是新型BadPatch恶意活动的一部分。BadPatch是指一系列恶意软件,在历史上某次恶意活动中集中使用,可能与2017年首次发现的加沙黑客...
2019-11-15 14:55:52
737
原创 如何优雅滴在手机上跑Python代码!手机市场越来越火热了!
本文重点围绕苹果设备,给大家介绍一下小编自己如何在苹果移动设备上玩转Python代码的。▍Pythonista它是一款安装在手机上的Python IDE软件,推荐指数4.7????。扣掉的0.3????是因为软件略贵(9.99刀)。该软件可以在苹果移动设备上提供几乎完整的Python开发环境(毕竟软件大小500M+),软件里有很多的Demo程序,包括了游戏、数据处理、图片处理等。说实话,本人...
2019-11-15 14:35:55
1033
原创 Python爬虫层层递进,从爬取一章小说到爬取全站小说!
很多好看的小说只能看不能下载,教你怎么爬取一个网站的所有小说知识点:requests xpath 全站小说爬取思路开发环境:版 本:anaconda5.2.0(python3.6.5) 编辑器:pycharm第三方库:requests parsel进行网页分析目标站点:私信博主01 领取完整代码!开发者工具的使用networkelement...
2019-11-15 14:30:35
989
1
原创 双十一数据被质疑?教你如何用Python预测未来趋势!
正当大家还沉静在购物狂欢的氛围之中,质疑数据造假的声音也随之而来。就在今年4月份的时候,有人按照公式已经得出了2019年双11的大致成绩,即2689亿元,这样精准的预测引得不少网友再次围观。利用二次多项式预测未来三年数据结果:预测2019年淘宝双11当天销售额:2676.37亿预测2020年淘宝双11当天销售额:3273亿预测2021年淘宝双11当天销售额:3930.76亿...
2019-11-15 14:27:22
1648
1
原创 手把手教你用Python搭建一个AI智能问答系统!
导读:智能问答系统是自然语言处理的一个重要分支。今天我们将利用分词处理以及搜索引擎搭建一个智能问答系统。具体的效果如下所示:私信小编01 领取完整代码!下面简单了解下智能问答系统和自然语言处理的概念,智能问答系统是自然语言处理的一个重要分支。现在普遍认为智能问答能够独立解决很多问题,但是必须要承认现在技术所处的初级阶段的性质。也就是说,智能问答系统在现阶段最大的...
2019-11-15 14:16:36
3502
14
原创 Python文章自动生成器火了!没错,它的名字叫“狗屁不通”!
【导读】最近,一个名字相当接地气的“狗屁不通”文章生成器(https://github.com/menzi11/BullshitGenerator)火了,截至目前 GitHub 上 Star 数已超过 7300,还上了微博热搜。这个神器可以生成各种各样奇葩文章,比如领导专用“彩虹屁”万字长文。只有你想不到,没有这个神器写不成的文章。但是,生成的文章确实也是“狗屁不通”。这次我们就来解读一下,这个...
2019-11-15 14:11:28
1284
原创 "看到新同事的工资后,我退出了群聊"Python入侵各大行业!
最近,我在后台看到了一个读者给我的留言,表示最近想要学习计算机编程,但是他有点纠结,不知道学习了对自己有没有帮助。在这里,我想发表一下自己的看法,事实上现在很多行业都会使用到计算编程,这其实已经是一个时代趋势了。AI办公其实已经在我们身边,它如同5G、人脸识别一样席卷而来。计算机替代重复工作的低效工作人员已经不可避免,特别是大多数重复的银行柜员。学会编程将和使用计算机一样变为大...
2019-11-14 14:49:04
1081
1
原创 Python之极验滑动验证码的识别(教程+案例)!
1 滑动验证码的识别介绍本节目标:用程序识别极验滑动验证码的验证,包括分析识别思路、识别缺口位置、生成滑块拖动路径、模拟实现滑块拼合通过验证等步骤。 准备工作:本次案例我们使用Python库是Selenium,浏览器为Chrome。请确保已安装Selenium库和ChromeDriver浏览器驱动。 了解极验滑动验证码: 极验滑动验证码官网为:http://www.geetest.co...
2019-11-14 14:44:40
702
原创 用Python实现微信自动拉人进群!微商福利!
微信群的用户添加逻辑是 —— 当群人数达到100人后,用户无法再通过扫描群二维码加入,只能让用户先添加群内联系人微信,再由联系人把用户拉进来。这样,联系人员的私人微信会添加大量陌生人,给其带来不必要的打扰,而且纯人工操作,也容易出现纰漏。那么,是否可以通过代码,做一个自动拉群机器人呢?由微信机器人来实现自动加群功能,一劳永逸解决人工拉群的麻烦。私信博主 001 领取完整项目代码...
2019-11-14 14:40:27
2192
4
原创 Python才是世界上最好的语言!不服来杠!
Python是人工智能的未来。前不久电气和电子工程师协会( IEEE)发布了顶级编程语言交互排行榜:Python超越Java高居首位。私信博主001 领取大量完整项目代码!而且随着大数据和人工智能的发展,Python受到了越来越多程序员的欢迎。“人生苦短,我用 Python。”已经在程序员的世界中广为流传。1>>>简...
2019-11-14 14:08:28
755
原创 用Python轻松打造定制款《植物大战僵尸》!玩这个游戏我都用脚本
植物大战僵尸》这款游戏也算是曾经风靡一时,不少网友曾用Python开发《坦克大战》、《飞机大战》、《扫雷》等经典游戏,开发《植物大战僵尸》当然也没问题。相比《坦克大战》等游戏,《植物大战僵尸》的游戏元素更多,设计起来会更加复杂,不过不必担心,因为我们这次不是从0开始凭空开发,而是借助一款植物大战僵尸的Python开源框架来实现。01.现有框架1).先睹为快既然是借助框架...
2019-11-14 13:51:30
1235
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅