大模型入门学习
码龄2年
求更新 关注
提问 私信
  • 博客:2,771,221
    2,771,221
    总访问量
  • 2,121
    原创
  • 370
    排名
  • 11,997
    粉丝
  • 0
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖南省
加入CSDN时间: 2024-04-19
博客简介:

2401_84494441的博客

查看详细资料
个人成就
  • 获得41,540次点赞
  • 内容获得91次评论
  • 获得36,893次收藏
  • 代码片获得8,313次分享
  • 原力等级
    原力等级
    9
    原力分
    9,262
    本月获得
    214
创作历程
  • 1627篇
    2025年
  • 502篇
    2024年
成就勋章

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

TA的推广
创作活动更多

AI 镜像开发实战征文活动

随着人工智能技术的飞速发展,AI 镜像开发逐渐成为技术领域的热点之一。Stable Diffusion 3.5 FP8 作为强大的文生图模型,为开发者提供了更高效的图像生成解决方案。为了推动 AI 镜像开发技术的交流与创新,我们特此发起本次征文活动,诚邀广大开发者分享在 Stable Diffusion 3.5 FP8 文生图方向的实战经验和创新应用 本次征文活动鼓励开发者围绕 Stable Diffusion 3.5 FP8 文生图方向,分享以下方面的内容: 1. 技术实践与优化 - Stable Diffusion 3.5 FP8 模型架构解析与优化技巧 - 文生图生成效果的提升方法与技巧 - 模型部署与加速策略,例如使用 Hugging Face、Diffusers 等工具 - 针对特定场景(例如二次元、写实风)的模型微调与定制化开发 2. 应用场景探索 - Stable Diffusion 3.5 FP8 在不同领域的应用案例分享,例如游戏设计、广告创意、艺术创作等 - 利用 Stable Diffusion 3.5 FP8 实现图像编辑、图像修复、图像增强等功能的探索 - 结合其他 AI 技术(例如 NLP、语音识别)构建更强大的应用 3. 创新应用与思考 - 基于 Stable Diffusion 3.5 FP8 的创新应用场景设计 - AI 镜像开发的未来发展方向的思考与展望 - 对 AI 镜像开发伦理、安全等问题的探讨

28人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

零基础转行大模型:程序员必备的技能清单与学习资源_普通程序员如何转行大模型?

本文为程序员提供转行大模型领域的详细攻略,包括明确目标方向、掌握Python等基础知识、学习Transformer架构、通过实践项目积累经验、参与开源社区、利用在线资源学习,以及构建个人品牌和寻找职业机会。文章强调理论与实践结合,提供具体学习路径和资源,帮助读者系统掌握大模型技术,实现职业转型。
原创
博文更新于 15 小时前 ·
811 阅读 ·
19 点赞 ·
0 评论 ·
16 收藏

AI进化论:从聊天机器人到能帮你办签证的智能助手

文章详解AI的三重进化:生成式AI(会说话的知识库)、AI Agent(能执行任务的行动派)和Agentic AI(多AI协作的团队),展示AI从单纯聊天到实际办事的能力跃升。通过订机票、办签证等实例,解释AI如何从"工具"进化为"助手"甚至"同事",并指出这些技术已应用于企业系统、智能客服等领域,为开发者提供清晰的技术演进视角。
原创
博文更新于 15 小时前 ·
261 阅读 ·
12 点赞 ·
0 评论 ·
12 收藏

从零开始构建知识图谱:大模型必备的收藏级技术指南

知识图谱是揭示实体间关系的语义网络,构建过程包括知识抽取(实体、关系、属性抽取)、实体对齐、知识表示(如RDF三元组)、知识融合、知识更新(数据层与模式层)以及知识推理等关键技术步骤。这些技术共同构建高质量知识库,为大模型提供结构化知识支撑,增强模型的理解能力和推理能力。
原创
博文更新于 15 小时前 ·
178 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

大模型智能体架构与ReAct框架实现详解

文章介绍了大模型智能体的核心架构(模型、工具、编排),重点讲解了ReAct框架的实现原理。ReAct通过"思考→行动→观察"的循环,使智能体能逐步解决问题。文章提供了详细的代码示例,展示了如何使用LangChain实现ReAct Agent,包括提示词设计、工具定义和模型交互。此外,还对比了ReAct、CoT和ToT三种编排技术在不同场景下的应用,帮助开发者选择合适的框架。
原创
博文更新于 15 小时前 ·
501 阅读 ·
14 点赞 ·
0 评论 ·
5 收藏

GitHub 7.8K+星标!《大模型基础》+ B站视频教程,系统掌握大模型技术

浙江大学DAILY实验室编写的开源书籍《大模型基础》被誉称为"大模型红宝书",配套毛玉仁老师的B站视频课程,提供六大核心模块的系统学习。课程采用"动物园"主题生动讲解,涵盖FlashAttention、Mocha等前沿技术,提供大厂面试真题和实战代码,适合AI初学者、工程师、求职者和产品经理,是学习大模型理论到实践的优质资源。
原创
博文更新于 15 小时前 ·
533 阅读 ·
7 点赞 ·
0 评论 ·
10 收藏

AI大模型训练师:破解AI与人类沟通障碍,高薪岗位全解析

文章介绍了AI大模型训练师这一新兴职业,他们负责解决AI与人类之间的沟通障碍,将模糊需求转化为AI能理解的清晰指令。由于市场供需失衡,该职业薪资优厚,部分年薪可达45万。训练师工作包括数据管理、模型训练、评估迭代和业务落地四大模块,是AI技术落地的关键角色,不需要复杂编程经验,为职场人提供了"弯道超车"的机会。
原创
博文更新于 前天 15:32 ·
819 阅读 ·
22 点赞 ·
0 评论 ·
8 收藏

如何用Dify接入本地大模型?附详细配置步骤,值得收藏

本文详细介绍了在Dify平台接入本地大模型的完整流程,包括Ollama安装部署、大模型选择配置、Dify关键设置及Docker环境下Base URL的正确配置方法。文章提供了具体操作步骤和参数设置,帮助用户成功搭建基于本地大模型的企业级知识库系统,适合希望实现AI私有化部署的开发者参考学习。
原创
博文更新于 前天 15:31 ·
885 阅读 ·
11 点赞 ·
0 评论 ·
24 收藏

大模型框架全方位对比:PyTorch、DeepSpeed、vLLM等15大工具详解,从入门到精通!

本文对比分析了10个大模型开发框架,覆盖训练(PyTorch、DeepSpeed)、推理(Triton、ONNX Runtime)和微调(PEFT、Unsloth)全流程。评估显示:PyTorch在研究场景易用性最佳;Triton适合高吞吐推理但配置复杂;PEFT和Unsloth显著降低微调资源需求;DeepSpeed和Megatron专攻超大规模训练。各框架在生态支持、硬件兼容性和学习曲线方面差异明显,开发者需根据任务规模(单卡实验vs分布式训练)和部署环境(云端vs边缘)选择适配工具。
原创
博文更新于 前天 15:31 ·
679 阅读 ·
23 点赞 ·
0 评论 ·
11 收藏

大模型实战:本地 LLM 文本分析之情感分析

文章介绍如何使用本地大模型(Ollama/vLLM)进行文本情感分析,无需训练模型或构建复杂NLP管线。通过设计稳定Prompt,实现单条文本分析和CSV批量处理,完成正/中/负情感分类任务。提供完整代码示例,适合评论分析、问卷反馈、新闻情绪初筛等场景,并对比Ollama(小批量)和vLLM(大批量)的应用场景,是小白可直接复现的文本分析实践指南。
原创
博文更新于 前天 15:30 ·
900 阅读 ·
23 点赞 ·
0 评论 ·
18 收藏

大模型智能体架构:单智能体vs多智能体选择与实战指南

随着大模型性能提升边际递减,智能体应用成为新焦点。本文系统分析了从单智能体到多智能体的架构演进,重点探讨了中心化与去中心化架构的选择。文章提出专家Agent的设计思路(通才vs专才)和跨Agent路由机制,并通过案例展示高效多智能体系统的构建方法。强调在模型能力范围内选择合适场景、建立稳定输出机制和闭环反馈系统的重要性,为智能体应用开发提供实践指导。
原创
博文更新于 前天 15:30 ·
452 阅读 ·
14 点赞 ·
0 评论 ·
25 收藏

从小白到大神:AI大模型学习资源全汇总,AI大模型学习路线非常详细收藏这一篇就够了

本文是一份AI大模型学习指南,系统介绍从基础概念到实战项目的完整学习路径。内容涵盖数学基础、Python编程、深度学习原理、Transformer模型及预训练技术等核心知识,并提供思维导图、视频教程、应用报告、电子书等免费学习资源。适合零基础小白入门,通过系统学习和实战项目,帮助读者掌握大模型技术,提升职场竞争力。
原创
博文更新于 2025.12.16 ·
1063 阅读 ·
30 点赞 ·
0 评论 ·
12 收藏

2026大模型学习必备资源合集(收藏版):从入门到精通,助你快速成为AI高手!

本文汇总了12个高质量AI学习资源,覆盖产品经理、技术开发者、互联网从业者等不同人群需求。资源包含大模型入门指南、实战教程、面试宝典、最新技术资料等,总大小超过60GB,从理论到实践全方位助力AI学习。无论你是零基础小白还是希望转型的从业者,都能找到适合自己的学习路径,快速掌握AI核心技能。
原创
博文更新于 2025.12.16 ·
720 阅读 ·
15 点赞 ·
0 评论 ·
20 收藏

大模型训练三阶段详解:数据准备、预训练与对齐(面试必学+收藏)

文章系统介绍大模型训练三大阶段:数据准备(收集、清洗、配比和分词)、预训练(学习语言规律)和后训练/对齐(SFT和RLHF)。同时讨论缩放定律、过拟合与梯度问题等关键概念,提供面试回答模板,强调工程与理论视角并重的重要性,帮助求职者系统应对大模型训练相关面试问题。
原创
博文更新于 2025.12.16 ·
899 阅读 ·
9 点赞 ·
0 评论 ·
23 收藏

大模型框架全解析:从PyTorch到vLLM的实战选择指南

本文对比分析了11种大模型开发工具,涵盖训练、推理、微调和部署全流程。PyTorch以其灵活性和研究友好性成为首选训练框架;NVIDIA Triton和ONNX Runtime提供高性能推理方案;Hugging Face生态的Transformers和PEFT简化了NLP模型微调;DeepSpeed和Megatron针对超大规模训练优化;vLLM和Unsloth则专注于推理与微调效率提升。开发者可根据需求选择工具链:研究推荐PyTorch+Transformers,生产部署建议Triton+ONNX Run
原创
博文更新于 2025.12.16 ·
610 阅读 ·
9 点赞 ·
0 评论 ·
18 收藏

GPT-5.2被Gemini 3 Pro碾压?真实编程场景实测,结果出人意料!

本文对比测试了GPT-5.2与Gemini 3 Pro在编程任务上的表现,通过烟花前端效果、学术论文分析和RAG代码重构三个场景进行评测。结果显示,Gemini 3 Pro在理解指令和代码重构方面表现更佳,而GPT-5.2在处理复杂任务时遇到困难。文章提示程序员在选择大模型辅助编程时需谨慎,建议根据具体需求选择合适工具。
原创
博文更新于 2025.12.16 ·
762 阅读 ·
20 点赞 ·
0 评论 ·
26 收藏

收藏!大龄程序员转行大模型全攻略:月薪30K+,附90天学习路径与免费资源

本文为程序员提供转行AI大模型领域的全面指南,分析了转行动机包括高薪机遇、技术前沿等优势,以及大模型通用性、泛化能力等特点。文章详细呈现了90天四阶段学习路径:初阶应用了解基础,高阶应用掌握RAG系统,模型训练学习微调技术,最后实现商业闭环。结合市场数据(47万岗位缺口、28K平均薪资)和真实案例,提供从入门到实战的系统学习资源,帮助程序员顺利转型高薪AI岗位。
原创
博文更新于 2025.12.15 ·
1044 阅读 ·
30 点赞 ·
0 评论 ·
13 收藏

程序员转行大模型领域:零基础入门到项目实战全攻略

转行大模型领域需要扎实的理论基础和丰富的实践经验。通过系统学习、参与项目和开源社区,你可以逐步掌握大模型技术,并在职业发展中取得成功。希望这份攻略能为你的转行之路提供帮助,祝你在大模型领域大展宏图!
原创
博文更新于 2025.12.15 ·
723 阅读 ·
12 点赞 ·
0 评论 ·
20 收藏

PT-5.2全面解析:从Code Red发布到打工人生产力提升指南

OpenAI在谷歌Gemini 3的竞争压力下紧急推出GPT-5.2,启动"Code Red"紧急状态。新模型核心改进包括:幻觉率降低38%、上下文窗口扩大至40万token、知识更新至2025年8月。特别值得关注的是其在ARC-AGI-2(真实智力测试)和GDPval(实际工作能力评估)中的突出表现,证明其更适合日常办公场景。GPT-5.2提供三个版本:Instant(基础版)、Thinking(推理版)和Pro(专业版),满足不同需求层次。尽管是被"催熟"的版本,
原创
博文更新于 2025.12.15 ·
824 阅读 ·
20 点赞 ·
0 评论 ·
17 收藏

提示词设计技巧:为什么推理模型不需要角色指定?

本文分析了通用大模型与推理大模型在设计目标、训练方式和能力表现上的核心差异。通用模型擅长广泛的语言任务,需要角色扮演和详细引导来激发最佳表现;推理模型则专注于逻辑推理,凭借内置推理链能自主完成复杂思考。研究表明,提示词设计策略应因模型而异:通用模型需要具体指令和上下文,而推理模型偏好简洁直接的问题。理解这些差异有助于充分发挥不同模型的潜能,提升交互效果。
原创
博文更新于 2025.12.15 ·
626 阅读 ·
7 点赞 ·
0 评论 ·
14 收藏

GPT-5.2震撼上线!性能碾压人类专家,程序员必学大模型技术,建议收藏

OpenAI发布GPT-5.2大模型反击谷歌Gemini,在44项职业测试中70.9%表现超越人类专家,速度提升11倍,成本降至1%。新模型降低30%幻觉率,推出Instant、Thinking、Pro三版本,已接入微软Office等生态。付费用户立即使用,免费用户13日开放,价格有所上调。明年一季度可能推出"成人模式",AI行业竞争加剧。
原创
博文更新于 2025.12.15 ·
600 阅读 ·
17 点赞 ·
0 评论 ·
14 收藏
加载更多