欧学东
码龄6年
求更新 关注
提问 私信
  • 博客:906,009
    社区:3
    906,012
    总访问量
  • 1,035
    原创
  • 2,287
    排名
  • 2,910
    粉丝
  • 2,000
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
加入CSDN时间: 2020-03-12
博客简介:

weixin_42186015的博客

查看详细资料
个人成就
  • 获得12,543次点赞
  • 内容获得0次评论
  • 获得13,770次收藏
  • 代码片获得693次分享
创作历程
  • 862篇
    2025年
  • 85篇
    2024年
  • 150篇
    2021年
  • 16篇
    2020年
成就勋章
TA的专栏
  • 算法、人类与互动:构建以人为本的AI未来
    付费
    9篇

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 11

TA参与的活动 0

创作活动更多

AI 镜像开发实战征文活动

随着人工智能技术的飞速发展,AI 镜像开发逐渐成为技术领域的热点之一。Stable Diffusion 3.5 FP8 作为强大的文生图模型,为开发者提供了更高效的图像生成解决方案。为了推动 AI 镜像开发技术的交流与创新,我们特此发起本次征文活动,诚邀广大开发者分享在 Stable Diffusion 3.5 FP8 文生图方向的实战经验和创新应用 本次征文活动鼓励开发者围绕 Stable Diffusion 3.5 FP8 文生图方向,分享以下方面的内容: 1. 技术实践与优化 - Stable Diffusion 3.5 FP8 模型架构解析与优化技巧 - 文生图生成效果的提升方法与技巧 - 模型部署与加速策略,例如使用 Hugging Face、Diffusers 等工具 - 针对特定场景(例如二次元、写实风)的模型微调与定制化开发 2. 应用场景探索 - Stable Diffusion 3.5 FP8 在不同领域的应用案例分享,例如游戏设计、广告创意、艺术创作等 - 利用 Stable Diffusion 3.5 FP8 实现图像编辑、图像修复、图像增强等功能的探索 - 结合其他 AI 技术(例如 NLP、语音识别)构建更强大的应用 3. 创新应用与思考 - 基于 Stable Diffusion 3.5 FP8 的创新应用场景设计 - AI 镜像开发的未来发展方向的思考与展望 - 对 AI 镜像开发伦理、安全等问题的探讨

28人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

用Langchain-Chatchat将PDF、Word转为可问答的知识库

通过Langchain-Chatchat将PDF、Word等文档转为可问答的本地知识库,结合嵌入模型与向量数据库实现精准语义检索,支持离线部署,保障数据安全,适用于企业内部知识管理与智能问答场景。
原创
博文更新于 1 小时前 ·
229 阅读 ·
9 点赞 ·
0 评论 ·
9 收藏

Langchain-Chatchat打造虚拟偶像互动系统

通过本地部署Langchain-Chatchat,结合RAG与私有知识库,构建具备记忆与人设的虚拟偶像对话系统,实现安全、可控、个性化的智能互动,无需联网即可运行,保护数据隐私的同时赋予AI角色一致性表达。
原创
博文更新于 4 小时前 ·
328 阅读 ·
7 点赞 ·
0 评论 ·
12 收藏

Langchain-Chatchat支持自定义停机维护页面:提升用户体验

Langchain-Chatchat新增自定义停机维护页面功能,通过前端提示提升系统维护期间的用户体验。支持应用层与网关层多种实现方式,降低用户焦虑与运维压力,体现从技术思维到用户思维的产品进化。
原创
博文更新于 5 小时前 ·
428 阅读 ·
17 点赞 ·
0 评论 ·
6 收藏

FaceFusion时间序列一致性优化:让视频帧间过渡更平滑

FaceFusion通过关键帧跟踪、光流引导特征传播和时序滤波等技术,有效解决AI换脸视频中的帧间抖动与闪烁问题。系统在保持低延迟的同时,实现面部几何、纹理与表情的平滑过渡,让生成视频更具真实感和动态连贯性。
原创
博文更新于 10 小时前 ·
660 阅读 ·
4 点赞 ·
0 评论 ·
5 收藏

FaceFusion适合做AI换脸APP后台引擎吗?架构设计建议

FaceFusion凭借模块化架构和高质量换脸能力,成为AI换脸APP后台的可行开源方案。本文分析其技术特性,提出基于Kubernetes、任务队列与GPU资源隔离的生产级架构,并探讨性能优化、成本控制与安全审核等关键工程实践,助力构建高并发、低成本的云原生换脸服务。
原创
博文更新于 12 小时前 ·
556 阅读 ·
16 点赞 ·
0 评论 ·
9 收藏

FaceFusion在法庭证据演示中的合理使用边界

本文探讨生成式AI工具FaceFusion在法庭证据演示中的合理应用与风险,分析其技术流程中的偏差来源,强调必须遵循隔离、可审、标识三项原则,明确其仅能作为解释性辅助材料,不可替代真实证据,并提出建立操作规程与追溯机制以保障司法公正。
原创
博文更新于 12 小时前 ·
285 阅读 ·
13 点赞 ·
0 评论 ·
4 收藏

FaceFusion支持PBR材质贴图增强真实感

FaceFusion通过引入基于物理的渲染(PBR)材质系统,解决AI换脸中皮肤质感失真、光照不自然等问题。系统输出Albedo、法线、粗糙度等多通道贴图,结合IBL环境光照与可微分渲染,实现跨场景的高真实感人脸融合,推动数字人从静态换脸向物理仿真演进。
原创
博文更新于 13 小时前 ·
432 阅读 ·
2 点赞 ·
0 评论 ·
20 收藏

FaceFusion+GPU加速:打造极速人脸处理流水线

本文介绍如何利用GPU加速构建高效的人脸融合流水线,涵盖从检测、对齐、特征提取到生成的全流程优化,结合TensorRT、FP16量化与异步推理等技术,实现低延迟、高保真的实时人脸处理,适用于直播、AI换脸与元宇宙等应用场景。
原创
博文更新于 14 小时前 ·
514 阅读 ·
4 点赞 ·
0 评论 ·
21 收藏

电信客服智能化转型:Kotaemon解决常见问题80%以上

通过RAG与对话代理技术,Kotaemon实现电信常见问题自动解答率超80%,支持知识检索、多轮交互与业务办理闭环,显著降低人工转接率,提升响应速度与客户满意度,推动客服从应答走向自主服务。
原创
博文更新于 前天 07:05 ·
607 阅读 ·
9 点赞 ·
0 评论 ·
22 收藏

EmotiVoice语音合成容器编排最佳实践(K8s)

面对情感化语音合成的高并发与资源挑战,通过Kubernetes实现EmotiVoice的弹性伸缩、GPU精细化调度与模型分离管理,结合缓存优化和可观测性体系,构建稳定高效的生产级TTS服务,让声音真正传递情绪与温度。
原创
博文更新于 2025.12.17 ·
779 阅读 ·
18 点赞 ·
0 评论 ·
15 收藏

EmotiVoice能否用于外语学习陪练?教学场景验证

EmotiVoice通过零样本声音克隆与多情感语音合成,让AI具备真实语调与个性化表达,适用于口语纠错、沉浸式对话与多角色教学场景,显著提升语言学习的互动性与情感共鸣,正在推动外语教育向个性化智能导师时代迈进。
原创
博文更新于 2025.12.17 ·
966 阅读 ·
18 点赞 ·
0 评论 ·
14 收藏

EmotiVoice语音中断恢复机制研究

EmotiVoice通过保存音色、情感嵌入与解码状态,实现语音合成的无缝续播。该机制确保中断后能精准恢复音色一致性与情绪连贯性,适用于虚拟助手、有声书、游戏NPC等高交互场景,兼顾效率、安全与用户体验。
原创
博文更新于 2025.12.17 ·
918 阅读 ·
16 点赞 ·
0 评论 ·
14 收藏

有声内容创作利器:EmotiVoice开源语音合成模型实测

EmotiVoice是一款开源语音合成模型,支持多情感表达与零样本声音克隆,仅需几秒音频即可复刻音色,并精准还原情绪。它在播客、有声书和虚拟角色中展现出强大表现力,推动AI从朗读工具变为创作伙伴,提升内容生产效率与沉浸感。
原创
博文更新于 2025.12.17 ·
775 阅读 ·
11 点赞 ·
0 评论 ·
13 收藏

开发者必看:LobeChat源码结构与二次开发入门路径

本文深入解析LobeChat的源码结构与核心机制,涵盖Next.js架构、Model Provider多模型接入、插件系统设计及Zustand状态管理,指导开发者从品牌定制到私有模型集成再到插件开发的全流程二次开发,助力构建安全可控的企业级AI助手。
原创
博文更新于 2025.12.16 ·
727 阅读 ·
17 点赞 ·
0 评论 ·
5 收藏

LobeChat能否实现SQL注入检测?安全编码辅助工具

本文探讨如何利用LobeChat结合大语言模型进行SQL注入漏洞检测。通过插件扩展和提示工程,将AI引入安全编码审查,实现语义级风险识别,并分析其在本地化部署、输出一致性与分层防御中的实际应用价值。
原创
博文更新于 2025.12.16 ·
571 阅读 ·
28 点赞 ·
0 评论 ·
14 收藏

TensorRT-LLM推理性能实测:Blackwell架构下的极致优化

基于NVIDIA Blackwell GPU的实测数据显示,TensorRT-LLM在Llama-3.3-70B等大模型上实现单卡超10k tokens/sec吞吐,FP4量化与N-Gram投机解码显著提升效率,分布式场景下仍保持近线性扩展,为大规模语言模型部署提供高性能解决方案。
原创
博文更新于 2025.12.16 ·
1006 阅读 ·
7 点赞 ·
0 评论 ·
12 收藏

GPT-SoVITS本地部署与远程访问实战

通过GPT-SoVITS实现低成本语音克隆,结合cpolar内网穿透实现远程生成音频。支持中英日韩粤五语种,Windows一键运行,配合固定公网地址实现随时随地访问AI语音合成服务。
原创
博文更新于 2025.12.16 ·
526 阅读 ·
14 点赞 ·
0 评论 ·
16 收藏

Langchain-Chatchat集成MindIE与Xinference实战

基于华为NPU部署Qwen2.5-3B大模型,通过MindIE实现OpenAI兼容接口,并结合Xinference运行Embedding模型,完成Langchain-Chatchat本地知识库搭建,适用于小规模知识场景的高效推理方案。
原创
博文更新于 2025.12.16 ·
602 阅读 ·
8 点赞 ·
0 评论 ·
26 收藏

Linux系统下安装与配置ComfyUI完整指南

在Ubuntu 20.04环境下,通过Conda创建Python 3.10虚拟环境,安装PyTorch及ComfyUI依赖,配置模型文件路径并运行服务。详细说明了模型下载、工作流导入及端口启动步骤,支持本地部署图像生成与视频生成任务。
原创
博文更新于 2025.12.16 ·
860 阅读 ·
27 点赞 ·
0 评论 ·
12 收藏

ComfyUI ACE-Step:用AI轻松创作多风格音乐

ComfyUI ACE-Step是一款强大的AI音乐生成插件,支持多语言歌词与多种音乐风格创作,仅需文本输入即可快速生成高质量音乐。无论是电影配乐还是电子流行曲,都能通过简单参数定制实现,大幅降低创作门槛,让专业与业余创作者都能高效产出个性化作品。
原创
博文更新于 2025.12.16 ·
587 阅读 ·
30 点赞 ·
0 评论 ·
27 收藏
加载更多