数据知道
码龄7年
求更新 关注
提问 私信
  • 博客:25,461,099
    社区:586
    问答:710
    动态:2,458
    25,464,853
    总访问量
  • 1,661
    原创
  • 137
    排名
  • 74,786
    粉丝
  • 444
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:香港
加入CSDN时间: 2018-09-29

个人简介:IT技术博主,博主会持续更新专栏文章,欢迎关注和订阅文章博客,欢迎私信和博主交流技术,欢迎关注公众号:数据知道的成长之路。商务合作等请站内私信或者联系VX名片(ID:data_know)

博客简介:

数据知道的博客

博客描述:
有任何问题欢迎私聊博主。
查看详细资料
个人成就
  • 优质创作者: python技术领域
  • 领域专家: 数据科学与机器学习技术领域
  • 获得21,219次点赞
  • 内容获得1,015次评论
  • 获得28,161次收藏
  • 代码片获得55,883次分享
  • 原力等级
    原力等级
    9
    原力分
    17,074
    本月获得
    290
创作历程
  • 852篇
    2025年
  • 318篇
    2024年
  • 52篇
    2023年
  • 45篇
    2022年
  • 42篇
    2021年
  • 77篇
    2020年
  • 304篇
    2019年
成就勋章
  • 入选《本周创作者榜》第71名
TA的专栏
  • 2026年系统架构设计师(软考高级)
    付费
    258篇
  • 2026年系统分析师(软考高级)
    付费
    132篇
  • 2026年信息系统项目管理师(软考高级)
    付费
    271篇
  • Python3案例和总结
    付费
    217篇
  • 2025年爬虫和逆向教程
    付费
    165篇
  • Python Web项目集锦
    付费
    31篇
  • 机器翻译60天修炼
    付费
    71篇
  • Go从入门到精通系列
    付费
    80篇
  • 大数据和数据库实战
    72篇
  • linux相关&shell编程
    55篇
  • 设计模式实战案例
    25篇
  • AI大模型基础
    13篇
  • 数据结构算法总结
    28篇
  • java语言核心与案例
    78篇
  • C/C++总结和案例
    20篇
  • 前端案例和总结
    22篇
  • 网络爬虫总结
    37篇
  • 开发工具的使用
    14篇
  • 常见错误汇总
    9篇
  • 程序人生
    14篇
  • 其它
    13篇

TA关注的专栏 4

TA关注的收藏夹 0

TA关注的社区 16

TA参与的活动 14

TA的推广
数据知道
微信号:data_know ,欢迎沟通和交流技术。
创作活动更多

AI 镜像开发实战征文活动

随着人工智能技术的飞速发展,AI 镜像开发逐渐成为技术领域的热点之一。Stable Diffusion 3.5 FP8 作为强大的文生图模型,为开发者提供了更高效的图像生成解决方案。为了推动 AI 镜像开发技术的交流与创新,我们特此发起本次征文活动,诚邀广大开发者分享在 Stable Diffusion 3.5 FP8 文生图方向的实战经验和创新应用 本次征文活动鼓励开发者围绕 Stable Diffusion 3.5 FP8 文生图方向,分享以下方面的内容: 1. 技术实践与优化 - Stable Diffusion 3.5 FP8 模型架构解析与优化技巧 - 文生图生成效果的提升方法与技巧 - 模型部署与加速策略,例如使用 Hugging Face、Diffusers 等工具 - 针对特定场景(例如二次元、写实风)的模型微调与定制化开发 2. 应用场景探索 - Stable Diffusion 3.5 FP8 在不同领域的应用案例分享,例如游戏设计、广告创意、艺术创作等 - 利用 Stable Diffusion 3.5 FP8 实现图像编辑、图像修复、图像增强等功能的探索 - 结合其他 AI 技术(例如 NLP、语音识别)构建更强大的应用 3. 创新应用与思考 - 基于 Stable Diffusion 3.5 FP8 的创新应用场景设计 - AI 镜像开发的未来发展方向的思考与展望 - 对 AI 镜像开发伦理、安全等问题的探讨

23人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 关注/订阅/互动
  • 资源
  • 收藏
  • 代码仓
更多
  • 最近

  • 文章

  • 专栏

  • 关注/订阅/互动

  • 资源

  • 收藏

  • 代码仓

  • 社区

  • 问答

  • 帖子

  • 视频

  • 课程

搜索 取消

《Python3案例和总结》-专栏介绍和目录

本专栏专注于Python基础和进阶的系统讲解,逐步深入实际应用场景到python高级特性,让你轻松学会用Python解决各种实际问题。不管是零基础还是有经验的开发,相信都能从本专栏获益。
原创
博文更新于 3 小时前 ·
13213 阅读 ·
63 点赞 ·
1 评论 ·
14 收藏

Python设计模式:抽象工厂模式详解

本文介绍了抽象工厂模式的设计思想与应用场景。抽象工厂模式提供一个接口用于创建一系列相关或相互依赖的对象(产品族),而不需指定具体类。其核心思想是处理产品族的创建,如不同风格的UI组件或跨平台数据库连接。文章通过UML图展示了抽象工厂、具体工厂、抽象产品和具体产品四个核心角色,并分析了该模式的优缺点:优点包括确保产品兼容性、解耦客户端与具体产品;缺点则是扩展性差和类数量爆炸。典型应用场景包括跨平台UI工具包和数据库访问层。最后通过Python代码示例展示了如何实现跨平台数据库连接,并比较了抽象工厂模式与工厂方
原创
博文更新于 3 小时前 ·
11 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

《爬虫和逆向教程》 - 专栏介绍和目录

本专栏为爬虫初学者和进阶开发者量身定制的爬虫和逆向学习园地。为你提供全面而深入的爬虫和逆向技术指导,从入门到精通,从基础理论到高级实战,助你在数据的海洋中畅游,挖掘出有价值的信息。通过本专栏的学习,你将具备独立开发和优化爬虫程序的能力,及逆向分析能力和项目开发能力,成为爬虫领域的佼佼者。
原创
博文更新于 3 小时前 ·
16538 阅读 ·
62 点赞 ·
6 评论 ·
22 收藏

从零到一构建一个AI回答监控爬虫系统

本文介绍了一个完整的AI回答监控爬虫系统设计方案。系统由任务调度器、爬虫执行器、数据解析器和数据存储器四大核心组件构成,采用APScheduler/Celery、Playwright/Requests、Pydantic/BeautifulSoup和PostgreSQL等技术栈实现。文章详细阐述了系统架构、技术选型、实现步骤和后续维护要点,包括反爬虫对抗策略、健壮性保障措施以及系统扩展方案。该系统可用于持续监控多个AI引擎的问答数据,为GEO逆向分析和优化策略制定提供数据支持。
原创
博文更新于 3 小时前 ·
353 阅读 ·
18 点赞 ·
0 评论 ·
3 收藏

用Docker从零到一部署Python爬虫案例

Docker部署爬虫实践 本文介绍了一个基于Docker的豆瓣图书Top250爬虫项目。主要内容包括: 项目结构:创建了包含爬虫代码、依赖文件和Docker配置的标准项目目录。 爬虫实现:使用requests和BeautifulSoup抓取图书信息并保存为CSV文件。 Docker化:通过Dockerfile定义镜像构建过程,包含Python环境配置、依赖安装和代码部署。 数据持久化:使用数据卷将爬取结果保存到宿主机,避免容器删除后数据丢失。 运行方式:提供两种运行方案 - 直接使用docker run命令
原创
博文更新于 4 小时前 ·
109 阅读 ·
5 点赞 ·
0 评论 ·
3 收藏

GEO的工作原理,以及GEO会催生出更多的爬虫岗位吗?

摘要: GEO(生成式引擎优化)是提升内容在AI搜索(如ChatGPT、Perplexity等)中引用率的新策略,核心在于优化内容的可抓取性、语义清晰度、权威性。与传统SEO不同,GEO聚焦AI的引用逻辑,需通过爬虫监控AI回答、逆向分析引用源特征(如结构化数据、权威背书),并构建自动化工具优化内容。爬虫工程师需转型为“AI可见性基础设施构建者”,重点关注高权威站点、知识库及官方信息源,同时确保技术可抓取性(如放行AI爬虫UA)。GEO的核心是从“排名”转向“被AI引用”,强调实体识别与动态对话适配。
原创
博文更新于 5 小时前 ·
22 阅读 ·
3 点赞 ·
0 评论 ·
3 收藏

Python设计模式:建造者模式详解

建造者模式是一种创建型设计模式,通过分步骤构建复杂对象,将对象的构建与表示分离。该模式包含产品、抽象建造者、具体建造者和指挥者四个角色,适用于构建内部结构复杂的对象。Python实现中,以构建电脑为例展示了游戏电脑和办公电脑的不同建造过程。建造者模式的优点包括分步创建、精细控制和代码复用,但会增加系统复杂度。与工厂模式相比,建造者模式更关注对象的构建过程而非简单创建。
原创
博文更新于 7 小时前 ·
15 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

《Python Web项目集锦》-专栏介绍和目录

本专栏专注于Python Web项目,涉及内容包含FastAPI、Django、Flask等,所有项目代码完整且可直接运行。不管是零基础还是有经验的开发,相信都能从本专栏获益。有任何问题欢迎私聊博主,专栏持续更新中...
原创
博文更新于 前天 09:22 ·
2247 阅读 ·
60 点赞 ·
1 评论 ·
15 收藏

FastAPI项目:从零到一搭建一个反转语录生成器系统

项目打开截图如下:首先,安装必要的Python库。然后,创建以下项目结构:1.2 配置环境变量 ()创建 文件来配置数据库连接。请将 替换为你自己的MySQL密码。在MySQL中创建数据库和表。创建表:二、完整代码2.1 后端代码 ()这是整个应用的核心,包含了Web服务、AI模拟器和数据库操作。main.py2.2 前端页面 ()这是一个简洁美观的单页应用,用于与后端交互。templates/index.html
原创
博文更新于 前天 09:15 ·
524 阅读 ·
20 点赞 ·
1 评论 ·
6 收藏

Flask项目:从零到一搭建一个反转语录生成器系统

本文介绍了使用Flask框架构建一个反转语录生成器的完整流程。主要内容包括:1) 环境准备与依赖安装;2) 配置环境变量和MySQL数据库;3) 核心后端代码实现,包含AI模拟器生成反转语录;4) 前端页面设计。项目通过Flask-SQLAlchemy操作数据库,使用python-dotenv管理配置,并提供了完整的代码示例。该应用能随机生成幽默反转语录并存储到数据库,适合作为Python Web开发入门项目。
原创
博文更新于 前天 09:12 ·
255 阅读 ·
10 点赞 ·
1 评论 ·
6 收藏

《100天Go语言从入门到精通系列》-专栏介绍和目录

本专栏专注于Go语言基础到进阶,从项目实战到源码分析的系统讲解,逐步深入实际应用场景到Go语言的高级特性,轻松学会用Go语言解决各种实际问题。不管是零基础还是有经验的开发,相信都能从本专栏获益。持续更新中...
原创
博文更新于 前天 08:56 ·
3984 阅读 ·
93 点赞 ·
3 评论 ·
25 收藏

Go语言Gin框架项目:从零到一搭建一个“反转语录”生成网站

本文介绍了一个使用Go语言开发的Web应用项目,主要功能是模拟AI生成反转语录并存储到MySQL数据库。项目采用Gin框架搭建Web服务器,使用GORM进行数据库操作,实现前后端分离的API设计。主要内容包括:1) 环境准备和项目初始化步骤;2) 数据模型定义;3) AI生成器服务实现;4) 主程序核心逻辑。项目结构清晰,包含环境变量配置、数据库连接、路由设置等功能模块,适合Go语言初学者学习Web开发实践。
原创
博文更新于 前天 08:52 ·
192 阅读 ·
8 点赞 ·
0 评论 ·
6 收藏

Python设计模式:原型模式详解

本文介绍了原型模式的概念及其在Python中的实现。原型模式通过克隆已有对象来创建新实例,适用于需要快速生成大量相似对象的场景(如游戏开发)。文章详细解析了原型模式的核心思想、结构角色、优缺点及适用场景,并通过游戏敌人生成系统的代码示例,演示了如何利用Python的copy模块实现深拷贝克隆。关键点包括区分深拷贝与浅拷贝,以及原型模式与工厂方法、建造者模式的区别。该模式特别适合资源密集型对象创建或需要绕过构造函数的情况。
原创
博文更新于 2025.12.16 ·
238 阅读 ·
9 点赞 ·
1 评论 ·
5 收藏

Python设计模式:适配器模式详解

本文介绍了适配器模式的概念及其在软件开发中的应用。适配器模式通过转换接口使不兼容的类能够协同工作,其核心思想是在不修改原有代码的情况下创建适配器层来解决接口不匹配问题。文章通过USB转接头的现实例子形象说明了该模式的作用,并详细分析了适配器模式的三个核心角色(目标接口、被适配者和适配器)、优缺点以及适用场景。最后通过Python代码示例展示了如何将第三方日志库CoolLogger适配到自定义Logger接口的实际应用。适配器模式特别适用于集成第三方库、统一不同数据源格式或兼容API版本变更等场景。
原创
博文更新于 2025.12.16 ·
201 阅读 ·
7 点赞 ·
1 评论 ·
4 收藏

Python设计模式:桥接模式详解

桥接模式通过分离抽象与实现,解决多维变化导致的类爆炸问题。核心思想是将两个独立变化的维度(如遥控器类型与电视品牌)解耦,用组合代替继承,使它们能独立扩展。该模式包含抽象、扩充抽象、实现和具体实现四个角色,适用于存在多个变化维度的场景,如跨平台UI、驱动程序等。优点包括扩展性强、避免类爆炸、职责分离清晰,但可能增加系统理解难度。示例展示了消息推送系统中消息类型与推送平台的桥接实现。
原创
博文更新于 2025.12.15 ·
264 阅读 ·
8 点赞 ·
1 评论 ·
6 收藏

Python设计模式:访问者模式详解

访问者模式是一种行为设计模式,用于在不改变对象结构的前提下定义新操作。其核心思想是双分派,通过两次动态分派(元素类型和访问者类型)实现操作与数据结构的解耦。该模式包含五个角色:访问者、具体访问者、元素、具体元素和对象结构。优点包括优秀的开闭原则支持、操作集中管理和解耦,但缺点是增加新元素类困难、破坏封装性和复杂度高。适用于对象结构稳定而操作频繁变化的场景,如编译器、文档处理等。在Python中,由于动态特性,可以简化部分实现。
原创
博文更新于 2025.12.15 ·
310 阅读 ·
12 点赞 ·
0 评论 ·
6 收藏

Android模拟采集:一文掌握 uiautomator2 的详细使用

是一个基于 Python 的 Android UI 自动化测试工具,它封装了 Google 的框架,提供了更简单易用的 API,适用于自动化测试、爬虫、批量操作等场景。GitHub文档。
原创
博文更新于 2025.12.15 ·
9797 阅读 ·
9 点赞 ·
2 评论 ·
8 收藏

Python设计模式:责任链模式详解

责任链模式是一种将请求发送者与接收者解耦的设计模式,通过链式传递请求,让多个处理者都有机会处理请求。其核心思想是动态构建处理链,每个处理器决定是否处理或传递请求。适用于审批流程、客服系统等场景。Python中的Web框架中间件机制就是典型应用。优点是降低耦合、增强灵活性,缺点是可能影响性能和调试困难。实现时需定义抽象处理器、具体处理器和客户端,支持动态构建处理链。
原创
博文更新于 2025.12.14 ·
194 阅读 ·
8 点赞 ·
1 评论 ·
7 收藏

Python设计模式:策略模式详解

策略模式是一种设计模式,它将算法封装成独立类,使它们可以相互替换。本文以电商折扣计算和导航系统为例,展示了策略模式的核心思想、结构、优缺点及适用场景。在Python中,策略模式可以更轻量地通过函数实现。该模式能有效避免条件语句的臃肿,支持开闭原则,提升代码复用性和灵活性,适用于需要动态切换算法的场景。
原创
博文更新于 2025.12.14 ·
189 阅读 ·
7 点赞 ·
0 评论 ·
7 收藏

数据存储:MySQL如何能存储一亿条链接信息?

本文介绍了MySQL存储亿级链接信息的优化方案,重点包括表结构设计、参数调优和索引设计。核心建议:使用雪花算法作为主键避免写入热点,精简字段类型(如TINYINT状态、BINARY哈希)节省空间,并通过唯一索引加速去重查询。同时配置InnoDB内存和IO参数提升性能,设计复合索引优化高频查询场景。最终可实现单表12GB存储一亿条数据,压缩后仅5-7GB。
原创
博文更新于 2025.12.13 ·
354 阅读 ·
10 点赞 ·
1 评论 ·
7 收藏
加载更多