ZhaoYingChao88
码龄14年
求更新 关注
提问 私信
  • 博客:4,208,370
    社区:429
    4,208,799
    总访问量
  • 549
    原创
  • 1,212
    排名
  • 3,002
    粉丝
  • 163
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
目前就职: 阿里巴巴
加入CSDN时间: 2011-09-08

个人简介:学而不思则罔,思而不学则殆!

博客简介:

赵英超的博客

博客描述:
相互学习,共同进步,如果对你有帮助,请记得点赞支持,谢谢!
查看详细资料
个人成就
  • 领域专家: 后端开发技术领域
  • 获得2,914次点赞
  • 内容获得470次评论
  • 获得14,727次收藏
  • 代码片获得16,778次分享
  • 原力等级
    原力等级
    8
    原力分
    6,136
    本月获得
    13
创作历程
  • 4篇
    2025年
  • 6篇
    2024年
  • 24篇
    2023年
  • 12篇
    2022年
  • 31篇
    2021年
  • 36篇
    2020年
  • 115篇
    2019年
  • 277篇
    2018年
  • 82篇
    2017年
成就勋章
TA的专栏
  • AI
    2篇
  • ozone
    1篇
  • hudi
    2篇
  • clickhouse
    2篇
  • prresto
  • presto
    1篇
  • ambari
    3篇
  • 数据治理
    1篇
  • 创业资源
    1篇
  • 逆向工程
    3篇
  • 用户画像
    1篇
  • Python
    1篇
  • linux-shell
    14篇
  • redis
    8篇
  • squid
    2篇
  • Nginx
    2篇
  • java
    69篇
  • jvm
    28篇
  • spark-sql
    11篇
  • spark
    33篇
  • akka
    3篇
  • scala
    1篇
  • 机器学习
    26篇
  • YARN
    15篇
  • NiFi
    1篇
  • elasticsearch
    50篇
  • storm
    5篇
  • 开发工具
    59篇
  • HBase
    13篇
  • MapReduce
    4篇
  • Benchmark
    4篇
  • Neo4j
    2篇
  • Hadoop
    7篇
  • 系统调优
    16篇
  • hive
    10篇
  • postgresql
    1篇
  • django
    1篇
  • zookeeper
    2篇
  • kubernetes
    4篇
  • spring boot
    58篇
  • Greenplum
    1篇
  • SQL
    12篇
  • Netty
    1篇
  • Dubbo
    1篇
  • maths
    1篇
  • kylin
    1篇
  • Go
    3篇
  • kafka
    2篇
  • Cloudos
    1篇
  • linux
    5篇
  • NodeJs
    2篇
  • graph
    4篇
  • 云计算
    1篇
  • flink
    2篇
  • Ignite
    1篇
  • 闲聊
    4篇
  • lvs
    1篇
  • UML
    1篇
  • 微服务
    1篇
  • spring cloud
    9篇
  • web
    2篇
  • mysql
    14篇
  • git
    1篇
  • 架构设计
    8篇
  • npm
    2篇
  • React
    14篇
  • markdown
  • weixin
    1篇
  • actitivi
    2篇
  • node
    2篇
  • JanusGraph
    5篇
  • ELectron
  • docker
    1篇
  • 博文推荐

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 15

TA参与的活动 2

兴趣领域 设置
  • 大数据
    flink
  • 人工智能
    opencv语音识别计算机视觉机器学习深度学习神经网络自然语言处理tensorflowpytorch图像处理nlp数据分析
创作活动更多

AI 镜像开发实战征文活动

随着人工智能技术的飞速发展,AI 镜像开发逐渐成为技术领域的热点之一。Stable Diffusion 3.5 FP8 作为强大的文生图模型,为开发者提供了更高效的图像生成解决方案。为了推动 AI 镜像开发技术的交流与创新,我们特此发起本次征文活动,诚邀广大开发者分享在 Stable Diffusion 3.5 FP8 文生图方向的实战经验和创新应用 本次征文活动鼓励开发者围绕 Stable Diffusion 3.5 FP8 文生图方向,分享以下方面的内容: 1. 技术实践与优化 - Stable Diffusion 3.5 FP8 模型架构解析与优化技巧 - 文生图生成效果的提升方法与技巧 - 模型部署与加速策略,例如使用 Hugging Face、Diffusers 等工具 - 针对特定场景(例如二次元、写实风)的模型微调与定制化开发 2. 应用场景探索 - Stable Diffusion 3.5 FP8 在不同领域的应用案例分享,例如游戏设计、广告创意、艺术创作等 - 利用 Stable Diffusion 3.5 FP8 实现图像编辑、图像修复、图像增强等功能的探索 - 结合其他 AI 技术(例如 NLP、语音识别)构建更强大的应用 3. 创新应用与思考 - 基于 Stable Diffusion 3.5 FP8 的创新应用场景设计 - AI 镜像开发的未来发展方向的思考与展望 - 对 AI 镜像开发伦理、安全等问题的探讨

28人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

数据智能体DMS Meta Agent

MetaAgent数据智能体是基于DMSOneMeta体系开发的智能数据管理解决方案,整合大模型能力实现企业数据资产的高效管理。核心功能包括:1)自动化资产盘点,通过元数据扫描生成业务描述和知识库;2)智能资产问答服务DataCopilot,支持自然语言查询和分析建议。系统提供完善的知识管理机制,支持手动/自动两种方式积累业务知识:通过Copilot交互自动记录知识,或手动填写/批量导入知识。知识库支持标签管理、多条件检索等功能,并与SQL窗口深度整合,实现SQL知识的便捷复用。该系统显著提升了数据管理智能
原创
博文更新于 2025.11.20 ·
1022 阅读 ·
14 点赞 ·
0 评论 ·
27 收藏

什么是Lance & LanceDB AI 多模态数据库

LanceDB是一种面向AI时代的新型数据库系统,专为处理大规模多模态数据而设计。其核心创新在于自主研发的Lance数据格式,相比传统Parquet格式,在随机访问速度上提升100倍,并能高效处理图像、视频、文本等非结构化数据。LanceDB通过三层架构实现:底层文件存储、数据湖管理和应用层接入,支持单机SDK和分布式引擎访问。主要优势包括:1)同时满足快速扫描、随机访问和大数据块处理三大需求;2)内置向量搜索能力;3)独特的模式演化和版本控制功能。目前已被MidJourney等AI公司采用,在RAG、分布
原创
博文更新于 2025.08.08 ·
3492 阅读 ·
16 点赞 ·
0 评论 ·
24 收藏

Model Context Protocol(MCP)详解和开发教程

导入包并定义mcp实例""""""通过注解,把一个函数注册为Tool# 注册工具的装饰器,可以很方便的把一个函数注册为工具asyncdef query_logistics(order_id: str = Field(description="订单号")) -> str:"""查询物流信息。当用户需要根据订单号查询物流信息时,调用此工具Args:order_id: 订单号Returns:物流信息的字符串描述"""# 统一的物流信息数据。
原创
博文更新于 2025.03.21 ·
8590 阅读 ·
32 点赞 ·
0 评论 ·
46 收藏

【AI】推荐12个AI智能体应用开发平台

人工智能(AI)已经成为推动创新和增长的关键力量。无论是在医疗、金融、教育还是零售行业,AI的应用都在不断扩展,为各行各业带来革命性的变化。本文将介绍12个AI Agent和AI应用开发平台,平台的兴起,为广泛的用户群体提供了一个易于访问、成本效益高的解决方案,AI技术和应用不再是大公司的专属。AI应用开发平台通过提供预训练的模型、拖放界面和丰富的API,非技术用户也能快速构建和部署自己的AI应用。
原创
博文更新于 2025.02.05 ·
28137 阅读 ·
20 点赞 ·
0 评论 ·
58 收藏

嵌入式从零基础到精通的视频学习过程

发布资源 2013.01.09 ·
pdf

Linux系统命令及其使用详解

发布资源 2013.01.09 ·
doc

自动化运维工具 Ansible 详细部署

发布资源 2016.07.07 ·
docx

maven-shade-plugin代替maven-assembly-plugin打包输出文件一致

【代码】maven-shade-plugin代替maven-assembly-plugin打包输出文件一致。
原创
博文更新于 2024.06.28 ·
357 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

maven-shade-plugin relocation解决包冲突(spark udf okhttp3 okio包冲突问题解决)

maven-shade-plugin中提供了一个Relocating(迁移)的功能,通过将原来包下的类迁移到我们指定的包名下。和okio的包删除,使用我们自己打的包。启动后发现可以,但是这肯定会导致集群用这两个包时报错。经过排查,发现大数据集群中依赖了okhttp和okio的包,而集群中也有okhttp和okio的包。如下图所示,就将okio和okhttp3包移到了我们制定的shaded目录下。剔除okhttp和okio的包,再次启动还是不行,集群里对应的包版本太低。打包,扔到集群中,是可行的。
原创
博文更新于 2024.06.28 ·
865 阅读 ·
4 点赞 ·
0 评论 ·
7 收藏

presto / trino plugin(自定义UDF函数)开发指南

ScalarFunction("to_upper") // 固定参数,表示函数名的意思,也就我们在使用Presto的时候用的函数名@Description("我的大小写转换函数") // 函数的注释@SqlType(StandardTypes.VARCHAR) // 表示数据类型// 将获取到的数据转换大写// 在转换后的数据放入内存返回实现presto函数的开发,使用新建maven工程的方式,要比在presto代码下新建子工程的方式简单的多,推荐大家使用方法二。
原创
博文更新于 2024.03.12 ·
2623 阅读 ·
22 点赞 ·
0 评论 ·
23 收藏

Maxmind GeoLite2城市csv数据库本地导入使用

官方指导文档:https://dev.maxmind.com/geoip/importing-databases/mysql。您可以使用工具将MaxMind GeoLite2 country/ CSV从GitHub。需要知道必须使用哪些类型的字段,以及如何正确地连接数据库中要从csv-文件导入的表。转换为MySQL/PostgreSQL/Microsoft 2019。中为导入GeoLite2城市csv创建。直接用csv导入就可以使用了。
原创
博文更新于 2024.02.05 ·
1466 阅读 ·
7 点赞 ·
0 评论 ·
9 收藏

绝对完美解决hdfs datanode数据和磁盘数据分布不均调整(hdfs balancer )——经验总结

hdfs 需要存写大量文件,有时磁盘会成为整个集群的性能瓶颈,所以需要优化 hdfs 存取速度,将数据目录配置多磁盘,既可以提高并发存取的速度,还可以解决一块磁盘空间不够的问题。大数据Hadoop之——Hadoop 3.3.4 HA(高可用)原理与实现(QJM)
原创
博文更新于 2024.02.05 ·
3039 阅读 ·
23 点赞 ·
0 评论 ·
27 收藏

常用抓包软件集合(Fiddler、Charles)

Fiddler Everywhere Pro具有扩展的共享和协作选项。与MacOS,Windows和Linux兼容。检查网络流量(HTTP和HTTps)。与合作者保存,共享和接收捕获的流量。解密安全流量(HTTps)。保存编写的API请求。
原创
博文更新于 2024.01.30 ·
2267 阅读 ·
7 点赞 ·
0 评论 ·
20 收藏

Datanode磁盘IO高 hdfs du -sk 导致机器load高

所以,对于DN来说,默认的Du,会产生大量的du -sk的操作,会造成集群严重的IO Wait增加,从而导致任务会变得缓慢。iostat -x 5: 磁盘IOutil 一直处于比较高的使用率,且iowait值比较大,io有一定的等待延迟;(将一个节点上同时产生的多个du操作,加个随机数,随机到集群的不同时间段,)不过也有一些临时的方案,比如说捕获到hdfs调用的 du -sk 命令,使用 df -k 进行替换。iotop排查有大量的du -sk 操作占用IO比较高,且执行很长时间;
原创
博文更新于 2023.12.06 ·
2294 阅读 ·
19 点赞 ·
0 评论 ·
14 收藏

CentOS关闭 swap分区

【代码】CentOS关闭 swap分区。
原创
博文更新于 2023.12.06 ·
1291 阅读 ·
10 点赞 ·
0 评论 ·
4 收藏

pip 安装错误 “python setup.py egg_info“

【代码】pip 安装错误 “python setup.py egg_info“
原创
博文更新于 2023.12.01 ·
944 阅读 ·
8 点赞 ·
0 评论 ·
8 收藏

hdfs数据丢失数据块block missing问题排查解决

告警内容:NameNode Blocks Health:Total Blocks:[13352317], Missing Blocks:[1]最后平滑重启NameNode,在重启异常的DataNode解决。允许ipc通讯最大的数据包为128MB,默认配置为64MB。开始时间:2023-10-02 08:05:12。组件:HDFS/cube-hdfs-1。排查hdfs datanode日志发现。持续时间:8小时44分钟。但是数据一直没法恢复。
原创
博文更新于 2023.10.07 ·
1979 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

磁盘io使用率高问题排查

例如,如果统计间隔1秒,该设备有0.8秒在处理IO,而0.2秒闲置,那么该设备 的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的时候,VFS将请求发到各个FS,如果FS发现不同的读 取请求读取的是相同Block的数据,FS会将这个请求合并Merge);上面的例子中,我们可以看到磁盘sda以及它的各个分区的统计数据,当时统计的磁盘总TPS是39.29,下面是各个分区的TPS。
原创
博文更新于 2023.10.07 ·
6319 阅读 ·
1 点赞 ·
0 评论 ·
15 收藏

spark任务长时间不退出hangs 8+ hour 的排查(AsyncEventQueue: Dropped 18 events from executorManagement)

解決这个问题最简单的办法。2.将群集级别的群集的 Spark 配置中的 spark.scheduler.listenerbus.eventqueue.capacity 值设置为大于 10000 的值。3.此值设置应用状态事件队列的容量,其中包含内部应用程序状态侦听器的事件。1.解决丢event的方法实际上是用Spark提供的参数,静态的让队列在初始化的时候容量变大了,这需要driver的内存大一点。有些listener 太慢了 跟不上新产生的task 的scheduler 的速度,有意思的问题就在这里。
原创
博文更新于 2023.10.06 ·
872 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

下载神器:axel aria2 mwget多线程快速下载取代curl和wget的多线程下载命令

对于在 Linux 的下载工具而言,比较常用的就是 wget 或者 curl,吾也一直用 wget 的方式进行网络上的资源下载。偶然发现了 axel 这个支持多线程的下载工具,试用了几次之后,发现网络文件的下载速度提交了很多,决定将常用的下载工具替换为 axel。1 安装1、Linux 安装CentOS 中安装 axel,axel 系统不自带,且 Yum 源也没有 axel 的包,需要从网络中下载。可以在https://centos.pkgs.org/,搜索找到并下载安装。$ w...
原创
博文更新于 2023.09.30 ·
16401 阅读 ·
5 点赞 ·
2 评论 ·
18 收藏
加载更多