四月天03
码龄11年
求更新 关注
提问 私信
  • 博客:1,233,648
    问答:1,112
    1,234,760
    总访问量
  • 273
    原创
  • 52,132
    粉丝
  • 6
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
加入CSDN时间: 2014-10-24
博客简介:

.

博客描述:
'能用钱解决的问题,千万别花时间'。 '能升级硬件解决的问题,千万别优化程序'。
查看详细资料
个人成就
  • 领域专家: 大数据技术领域
  • 获得924次点赞
  • 内容获得137次评论
  • 获得6,347次收藏
  • 代码片获得3,425次分享
  • 博客总排名1,680,693名
  • 原力等级
    原力等级
    8
    原力分
    6,193
    本月获得
    11
创作历程
  • 1篇
    2025年
  • 2篇
    2024年
  • 7篇
    2023年
  • 60篇
    2022年
  • 71篇
    2021年
  • 43篇
    2020年
  • 91篇
    2019年
成就勋章
TA的专栏
  • Hive
    付费
    13篇
  • 数仓&数据中台
    付费
    23篇
  • 数据治理
    付费
    24篇
  • Flink
    18篇
  • 信创
    3篇
  • Hadoop
    3篇
  • Hbase
    15篇
  • Kafka
    12篇
  • Spark
    14篇
  • Spark Streaming
    4篇
  • Flume
    4篇
  • ETL数据同步
    11篇
  • Redis
    7篇
  • Elasticsearch
    6篇
  • 湖仓一体(Delta、Hudi、Iceberg)
    6篇
  • Kudu
    3篇
  • Shell
    3篇
  • BI数据分析&OLAP
    16篇
  • 数仓电商项目
    10篇
  • 大数据项目实战
    11篇
  • 云原生数据中台:让数据用起来
    12篇
  • 云计算
    3篇
  • 大数据(其他)
    10篇
  • 大数据(工具、调度)
    11篇
  • 用户画像
    5篇
  • Python
    6篇
  • 数据分析、机器学习(Python)
    16篇
  • AI大模型&人工智能
    2篇
  • 算法&数据结构
    1篇
  • 数据库
    8篇
  • J2EE--SpringMVC&SpringBoot
    13篇
  • 项目管理
    9篇
  • temp
    16篇

TA关注的专栏 1

TA关注的收藏夹 0

TA关注的社区 3

TA参与的活动 0

兴趣领域 设置
  • 大数据
    sqlhbasehadoophivesparkkylinsqoop数据仓库etl
创作活动更多

AI 镜像开发实战征文活动

随着人工智能技术的飞速发展,AI 镜像开发逐渐成为技术领域的热点之一。Stable Diffusion 3.5 FP8 作为强大的文生图模型,为开发者提供了更高效的图像生成解决方案。为了推动 AI 镜像开发技术的交流与创新,我们特此发起本次征文活动,诚邀广大开发者分享在 Stable Diffusion 3.5 FP8 文生图方向的实战经验和创新应用 本次征文活动鼓励开发者围绕 Stable Diffusion 3.5 FP8 文生图方向,分享以下方面的内容: 1. 技术实践与优化 - Stable Diffusion 3.5 FP8 模型架构解析与优化技巧 - 文生图生成效果的提升方法与技巧 - 模型部署与加速策略,例如使用 Hugging Face、Diffusers 等工具 - 针对特定场景(例如二次元、写实风)的模型微调与定制化开发 2. 应用场景探索 - Stable Diffusion 3.5 FP8 在不同领域的应用案例分享,例如游戏设计、广告创意、艺术创作等 - 利用 Stable Diffusion 3.5 FP8 实现图像编辑、图像修复、图像增强等功能的探索 - 结合其他 AI 技术(例如 NLP、语音识别)构建更强大的应用 3. 创新应用与思考 - 基于 Stable Diffusion 3.5 FP8 的创新应用场景设计 - AI 镜像开发的未来发展方向的思考与展望 - 对 AI 镜像开发伦理、安全等问题的探讨

37人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

Docker部署nginx+mysql+前后端分离项目

本文详细介绍了使用Docker部署前后端项目的完整流程。主要内容包括:安装Docker环境;部署Nginx服务并配置目录挂载;安装MySQL数据库;打包SpringBoot项目为Jar并编写Dockerfile构建镜像;打包Vue项目并配置Nginx代理,通过Dockerfile构建前端镜像。文章提供了每个步骤的具体命令和参数说明,涵盖了从环境搭建到前后端项目部署的全方位指导,最后还包含服务测试方法,是一份完整的Docker部署实战指南。
原创
博文更新于 2025.11.14 ·
1645 阅读 ·
0 点赞 ·
2 评论 ·
7 收藏

SpringBoot+WebSocket实时监控

需要服务端主动向客户端发送消息,所以很容易的就想到了用WebSocket来实现这一功能。预期效果,未接收到请求前----->id为3的提交了异常,id为3的王五变成了红色。
原创
博文更新于 2025.05.22 ·
575 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

DeepSeek部署在本地电脑

作为一款现象级的Ai产品,用户量暴增,最近服务器又被攻击,使用DeepSeek,经常出现服务器繁忙,将DeepSeek部署在本地电脑就方便很多。3、选择对应的模型来下载,1.5b、7b、8b、14b、32b、70b或671b,这里有很多版本可选,模型越大,要求电脑内存、显卡等的配置越高。通过以上三步,DeepSeek就部署在本地电脑上了,有些不方便公开的数据,比如实验数据,可以通过部署大模型到本地的方式进行处理,不用担心数据泄露。2、进入就可以看到deepseek-r1模型,如果没有,在搜索栏搜索即可。
原创
博文更新于 2025.02.07 ·
863 阅读 ·
4 点赞 ·
1 评论 ·
7 收藏

风控信用评分卡建模

银行信贷业务场景中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段,评分卡打出的分数越高,客户的信用等级越高,风险越小。p和q为常熟,p是补偿,p是刻度。我们现在已经有了我们的箱子,接下来我们要做的是计算各箱的WOE,并且把WOE替换到我们的原始数据中,因为我们将使用WOE后的数据来建模,我们希望获取的是”各个箱”的分类结果,即评分卡上各个评分项目的分类结果。对于X4,X5,X6,X8,以及X10而言,IV值都比较低,因此可以舍弃这些预测能力较差的特征,只选择X1,X2,X3,X7,X9。
原创
博文更新于 2024.09.09 ·
839 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

信用评分卡模型

信贷风险是指借款人因偿还贷款或履行合同承诺而破产而产生损失的可能性。传统上,它与贷款人无法偿还所欠利息和本金、影响现金流和增加装配成本所产生的风险有关。很难准确预测谁会违约。尽管如此,适当的评估和风险管理可以通过减少损失的严重程度,帮助您显著降低此类信贷风险。个人信用风险当任何贷款人发放贷款(如抵押贷款、信用卡或其他类似贷款)时,存在借款人可能无法偿还贷款金额的可避免风险。此外,如果一家公司向客户提供此类信贷,客户也会面临同样的风险,即客户不会偿还。
原创
博文更新于 2024.09.09 ·
5015 阅读 ·
2 点赞 ·
0 评论 ·
43 收藏

如何搭建漂亮的SpringBoot架构

在开发一个新项目之前,先下载IDE,虽然有诸多限制,但IDE必须还得用啊,官方提供了社区版,很多同学用着社区版,还有一部分同学继续走着破解之路。接下来咱们先看看如何用IDE创建springboot项目,然后一路next就行了这就是刚创建好的项目,新鲜出炉,有启动类、配置文件、测试启动类。
原创
博文更新于 2024.08.26 ·
368 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Spring Boot 整合 Spring AI 实现项目接入ChatGPT(OpenAl的调用)

第四种:聊天的程序的第三种实现方式(调用stream方法,用法和call一样,只不过返回值不一样,Stream返回的是Fiux,叫做数据的序列一序列的数据,一个一个的数据返回,调用Stream叫做流式API)4.1 因为所有的接口的父接口都继承与Model,可以看到聊天方式的实现就是注入OpenAiChatModel 因为这个springboot自动装配的功能,只需要注入即可。第三种:聊天的程序的第三种实现方式(比上一个方法多了一个关于gpt参数的设置)第三步:配文件(这个的api -key就是你自己的)
原创
博文更新于 2024.08.19 ·
3246 阅读 ·
13 点赞 ·
0 评论 ·
18 收藏

国内AI大模型盘点

大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。原文链接:https://blog.csdn.net/2301_76168381/article/details/139677043。简介: 智谱华章自研的AI大模型,融合海量知识,可用于商业分析、决策辅助、客户服务等领域。简介: 阿里达摩院推出的大模型,拥有千亿参数,可用于智能问答、知识检索、文案创作等场景。简介: 科大讯飞推出的AI大模型,支持对话、写作、编程等功能,还能提供语音交互方式。
原创
博文更新于 2024.07.24 ·
1736 阅读 ·
0 点赞 ·
2 评论 ·
1 收藏

WORD批量修改文献引用为上标

1、点击word开始页面的替换选项卡,或Ctrl+H键,打开替换页面。1、点击word开始页面的替换选项卡,或Ctrl+H键,打开替换页面。1、点击word开始页面的替换选项卡,或Ctrl+H键,打开替换页面。点击替换栏,再点击格式,选择字体,勾选上标。点击替换栏,再点击格式,选择字体,勾选上标。点击替换栏,再点击格式,选择字体,勾选上标。点击更多,选择使用通配符。点击更多,选择使用通配符。点击更多,选择使用通配符。
原创
博文更新于 2024.07.20 ·
5314 阅读 ·
6 点赞 ·
2 评论 ·
10 收藏

一文搞懂ERP、MES、SCM、PLM、CRM、WMS、APS、SCADA、QMS、EAM

MES(制造执行系统)、ERP(企业资源规划)、SCM(供应链管理)、WMS(仓库管理系统)、APS(高级计划和排程)、SCADA(监控控制与数据获取)、PLM(产品生命周期管理)、QMS(质量管理系统)、CRM(客户关系管理)、EAM(企业资产管理)这些系统各自针对企业的不同运营方面提供专门的管理和控制功能。运营层专注于具体业务流程的管理,如产品、采购、制造、质量、物流、销售和服务等,有PLM、SRM、MES、EAM、QM、TMS、WMS和SP等。它包括质量规划、控制、保证和持续改进的方法。
原创
博文更新于 2024.07.18 ·
891 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

OLAP(二):Presto 、和impala性能测试

Presto 是一个开源的分布式 SQL 查询引擎,数据量支持 GB 到 PB 字节,主要用来处理秒级查询的场景。注意:虽然 Presto 可以解析 SQL,但它不是一个标准的数据库。不是MySQL、Oracle的代替品,也不能用来处理在线事务(OLTP)。
原创
博文更新于 2024.03.26 ·
3170 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

批处理-交互式分析一体化Trino深度测评

2020年12月27日,Presto社区将开源项目PrestoSQL的名字更名为TrinoDB(本文简称Trino)。Trino是一款开源的高性能、分布式SQL查询引擎,专门用于对各种异构数据源运行交互式分析查询,支持从GB到PB的数据量范围。Trino专门为交互式分析而设计,可以对来自不同数据源的数据(包括:Hive、AWS S3、Alluxio、MySQL、Kafka、ES等等)进行合并查询,并提供良好的自定义连接器编程扩展框架。适用于期望响应时间从亚秒到数分钟不等的分析师场景。
原创
博文更新于 2024.03.26 ·
1398 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

CDH/HDP迁移星环大数据产品TDH

通过8种独立的存储引擎,支持业界主流的10种存储模型:关系型数据存储、宽表存储、搜索引擎、地理空间 存储、图存储、键值存储、事件存储、时序存储、文本存储、对象存储。星环科技TDH已完成与主流信创生态厂商的适配互认工作,适配长城飞腾、华为泰山、浪潮等服务器,鲲鹏、飞腾CPU,麒麟、统信等OS,并有官方认证,支持基于ARM与X86服务器服务器混合部署并有落地案例,满足信创验收要求。TDH的多模架构,支持关系表、文本、时空地理、图数据、文档、时序等在内的10种数据模型;整个易用性、开发效率和运行效率都提高很多。
原创
博文更新于 2024.03.18 ·
1978 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

Python爬虫:原理与实战

在当今的信息时代,互联网上的数据如同浩瀚的海洋,充满了无尽的宝藏。Python爬虫作为一种高效的数据抓取工具,能够帮助我们轻松地获取这些数据,并进行后续的分析和处理。本文将深入探讨Python爬虫的原理,并结合实战案例,帮助读者快速掌握爬虫技术。如果我们把互联网比作一张大的蜘蛛网,数据便是存放于蜘蛛网的各个节点,而爬虫就是一只小蜘蛛,沿着网络抓取自己的猎物(数据)爬虫指的是:向网站发起请求,获取资源后分析并提取有用数据的程序。从技术层面来说就是 通过程序模拟浏览器请求站点的行为,把站点返回的HTML代码/J
原创
博文更新于 2024.03.15 ·
2932 阅读 ·
17 点赞 ·
1 评论 ·
40 收藏

Flink SQL时间属性和窗口介绍 ,窗口表值函数

在创建表的 DDL(CREATE TABLE 语句)中,可以增加一个字段,通过 WATERMARK语句来定义事件时间属性。WATERMARK 语句主要用来定义水位线(watermark)的生成表达式,这个表达式会将带有事件时间戳的字段标记为事件时间属性,并在它基础上给出水位线的延迟时间。具体定义方式如下:) WITH (...把 ts 字段定义为事件时间属性,而且基于 ts 设置了 5 秒的水位线延迟。
原创
博文更新于 2024.03.11 ·
2973 阅读 ·
2 点赞 ·
0 评论 ·
7 收藏

文档系统:HDFS+Elasticsearch

在将文档索引到Elasticsearch之前,您需要为索引定义一个映射(mapping),并在映射中指定分词器。分词器决定了如何将文本字段分解成单个的词条(terms)。例如,如果您使用的是Elasticsearch的默认分词器(standard analyzer),它适用于大多数语言,并且会按照空格和标点符号来分解文本。但如果您需要处理特定语言(如中文),您可能需要使用更适合的分词器,如IK分词器。},// 其他字段定义...在这个例子中,我们定义了一个名为的分词器,它是IK分词器的一个变体(
原创
博文更新于 2024.02.29 ·
339 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

分布式爬虫系统设计、实现与实战:爬取京东、苏宁易购全网手机商品数据+MySQL、HBase存储

https://blog.51cto.com/xpleaf/2093952
原创
博文更新于 2024.02.19 ·
569 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

待完善 Elasticsearch 在大数据的应用:Spring Boot + Elasticsearch:高效管理大数据的利器

ES作为一个功能丰富、性能优越的大数据搜索引擎,已经被越来越多的企业广泛应用。本文介绍了ES的核心组件、数据结构和数据类型、查询和聚合操作等知识点,以及ES的实践操作,并通过Java代码示例进行讲解。希望本文能够帮助开发者更好地了解和应用ES,进一步推动ES的发展和应用。
原创
博文更新于 2024.02.19 ·
896 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

待完善 快速排序、二分查找、

快速排序5,7,2,4,6,1,11,3,9基准数后面的数需要大于基准数,从后向前寻找a[j]< tmp,寻找到a[8]的3<5,将a[8]放入空位a[0]中,a[j]=a[8]此时空出位置接着从前向后遍历a[i] > 5,找到a[1]符合条件,将a[1]放入空位a[8],a[1]空出继续从后向前寻找继续从后向前寻找遍历至i == j 结束...
原创
博文更新于 2024.02.19 ·
246 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

待完善 SSM-- Spring整合Mybatis

web.xml的加载过程是context-param >> listener >>fileter >> servlet<?xml version="1.0" encoding="UTF-8"?><web-app xmlns……> <display-name>ssm-manager</display...
原创
博文更新于 2024.02.19 ·
224 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多