QbitAl-CSDN博客

QbitAl

码龄7年

IP 属地：北京市

加入CSDN时间： 2019-06-14

查看详细资料

个人成就

企业官方账号
获得28,317次点赞
内容获得4,496次评论
获得51,780次收藏
代码片获得528次分享

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 2

TA参与的活动 0

创作活动更多

AI 镜像开发实战征文活动

随着人工智能技术的飞速发展，AI 镜像开发逐渐成为技术领域的热点之一。Stable Diffusion 3.5 FP8 作为强大的文生图模型，为开发者提供了更高效的图像生成解决方案。为了推动 AI 镜像开发技术的交流与创新，我们特此发起本次征文活动，诚邀广大开发者分享在 Stable Diffusion 3.5 FP8 文生图方向的实战经验和创新应用本次征文活动鼓励开发者围绕 Stable Diffusion 3.5 FP8 文生图方向，分享以下方面的内容： 1. 技术实践与优化 - Stable Diffusion 3.5 FP8 模型架构解析与优化技巧 - 文生图生成效果的提升方法与技巧 - 模型部署与加速策略，例如使用 Hugging Face、Diffusers 等工具 - 针对特定场景（例如二次元、写实风）的模型微调与定制化开发 2. 应用场景探索 - Stable Diffusion 3.5 FP8 在不同领域的应用案例分享，例如游戏设计、广告创意、艺术创作等 - 利用 Stable Diffusion 3.5 FP8 实现图像编辑、图像修复、图像增强等功能的探索 - 结合其他 AI 技术（例如 NLP、语音识别）构建更强大的应用 3. 创新应用与思考 - 基于 Stable Diffusion 3.5 FP8 的创新应用场景设计 - AI 镜像开发的未来发展方向的思考与展望 - 对 AI 镜像开发伦理、安全等问题的探讨

28人参与去参加

更多

小杯Gemini战胜GPT5.2，1分钟模拟Windows操作系统

画一张骑车的鹈鹕，Gemini 3 Flash（右上）的表现明显优于Gemini 2.5 Pro（左）和Gemini 3 Pro（右下），而且这些还都是反复测试后抽取的最佳结果。性能上不仅显著超越Gemini 2.5 Pro，而且在专业多模态测试MMMU Pro、复杂推理测试ARC-AGI-2等方面，还能略胜Gemini 3 Pro。Gemini 3 Flash率先答对，而Gemini 3 Pro将他误认为Gemini前负责人Jack Krawczyk。

博文更新于 12 小时前 ·

国产AI芯片看两个指标：模型覆盖+集群规模能力 | 百度智能云王雁鹏@MEET2026

现在Scale换了一个维度，变成了模型参数的Scale和任务训练规模的Scale，由此带来了整个系统层面的Scale，映射到硬件上就有不同的size、各种形状、不同的切分策略和并行策略。而这意味着模型参数可以有不同的规模，例如十亿、百亿、千亿，同时我们可以跑到不同硬件平台上，比如百卡、千卡、万卡，这两个维度的Scale则会带来整个系统的Scale。多模态模型则带来另一类问题，不同的模态会带来不同的训练强度，不同模态的计算，还用原来的同构拆分方法的话会导致训练的效率非常低，典型情况下MFU可能都不到10%。

博文更新于 12 小时前 ·

不儿，这谁还能看出是AI演的视频啊

这套框架不仅能识别“一个男人在说话”，还能精确标注出“四川话、憨厚音色、带有环境回声”等极具细节的特征，为模型打下了深厚的数据底子。随后，急速推近面部特写，嘴角扯出极淡的冷笑，压迫感满满，并且冰冷蔑视地说话：“凭你也敢挑衅我的权威！AI视频生成到底够不够真，其实最主要需要关注的就是音画会不会出现bug、够不够一致性，运镜是否够专业，以及涉及到方言等内容时，是否能够精准表达等。或许在不久的将来，我们不需要寻找昂贵的配音演员，不需要复杂的后期对口型，甚至连方言的韵律和环境音的质感，AI都能一次性给到。

博文更新于 12 小时前 ·

港股通用GPU第一股也冲刺了！哈佛博士带队，估值209亿

按照未来路线规划，壁仞计划推出第二代架构开发的壁砺20X系列，用于云训练及推理，预计2026年开始商业化；同时，壁仞科技目前仍处于亏损中，2022年~2024年以及今年上半年，公司年内亏损为14.74亿元、17.44亿元、15.38亿元，以及16亿元。投资阵容也是明星云集，包括启明创投、IDG资本、华登中国、平安集团、高瓴创投、格力创投、松禾资本、云晖资本、国盛资本、招商局资本等知名机构。2022年~2024年，壁仞科技的营业收入从50万元涨到3.37亿元，今年上半年收入为5890万元，同比增长约50%。

博文更新于 13 小时前 ·

认知偏差、落地断层、体验割裂是目前AI产品的三大痛点｜百度王颖@MEET2026

当用户向GenFlow发出指令“请调取我写过的月报模板，补充新的协作亮点模块，并添加两个待改进方向”，GenFlow就能精准调用用户历史使用的表格模板与格式，结合其电商运营的职业属性、写作风格以及数据表达的偏好，在原有框架上直接迭代生成一份完全贴合用户习惯和需求的最新月报。基于这样的愿景，我们一直希望将百度文库和百度网盘打造为超级个人智能体，为用户提供个性化、自由化、通用化能力，让每一个使用文库和网盘的用户都能成为超级个体，真正实现自由表达、全能操作。，月活用户规模达到千万级，成为全球最大的通用智能体；

博文更新于 13 小时前 ·

小米大模型“杀”进第一梯队：代码能力开源第一，智商情商全在线

方面，模型表现出卓越的泛化性与稳健性，其在SWE-Bench Multilingual测试中解决了71.7%的问题，在衡量工具使用能力的Tau2-Bench中得分达到80.3，这两项关键指标均位列全球开源模型前茅。MiMo一代时做的7B模型，更像是在“积攒家底”，把全套技术流程跑通，把该踩的坑都踩一遍，主打一个稳扎稳打；根据技术报告中公布的数据显示，MiMo-V2-Flash展现出了极强的综合素质，在衡量通用能力的Arena-Hard基准测试中得分86.2，在复杂推理任务MMLU-Pro中得分84.9。

博文更新于 14 小时前 ·

医生版ChatGPT，估值120亿美元

这直接改变了AI与传统内容供应方的关系。2025年11月，钉钉联合壹生检康发布「豆蔻医生超级助理」，可在1分钟内整合全球超过4000万篇医疗专业文献，辅助妇产科医生临床决策。在多场景评测中，M2 Plus的医疗幻觉率较通用大模型显著降低，相比DeepSeek低约3倍，甚至优于OpenEvidence。另一方面，由于医学场景对可追溯性的要求，使得现在的OpenEvidence并没有直接抢占信息入口，反而是在。企查查显示，自成立以来，百川智能已完成三轮融资，股东包括小米、腾讯、阿里、亚投资本、中金等。

博文更新于 14 小时前 ·

具身智能的数据难题，终于有了可规模化的解法

为了捕捉人类在真实场景中的自然行为与反馈，Gen DAS在设计上完全遵循人机工程学，采用轻量化材质打造，确保用户长时间佩戴无负担、操作无干扰，从根本上避免了设备不适导致的“动作变形”。的理念，融合线上线下运营机制与众包模式，构建起业内首个规模化、自动化的真实场景数据闭环生产系统，成功将数据采集从“实验室”推向“千万家真实场景”。等全球顶尖企业与科研机构的资深专家，曾多次在智驾领域取得破圈成果。：端到端模型的模型训练，期望立刻提供所需的数据，这种需求随时变化，采集的场景行为，也需要更快响应、数据更新线；

博文更新于 14 小时前 ·

行啊AI PC！现在都能隔空测血压、检测皮肤了

它的原理是基于一个简单的物理现象：当心脏收缩泵血时，血液会流经全身的毛细血管，导致皮肤表面的血容量发生微小的、周期性的变化。可以说，正是科思创动创新的AI算法，与英特尔酷睿Ultra NPU提供的强大、高效、安全的本地算力相结合，才共同催生了这台能隔空“懂你”、“关心你”的AI PC。这种端侧AI的能力，正是AI PC区别于传统PC的核心价值所在：它让更多的AI应用不再只依赖云端，已然变成即开即用的日常工具。最终，AI美妆顾问会根据这份综合报告，提供个性化的护肤和美妆方案，精确到推荐具体品牌和产品步骤。

博文更新于 14 小时前 ·

经验记忆黑科技！LightSearcher让AI工具调用减39.6%、推理快48.6%

团队表示，以DeepSeek-R1为代表的深度思考大模型能够处理复杂的推理任务，DeepSearch作为深度思考大模型的核心搜索器，在推理过程中通过迭代调用外部搜索工具，访问参数边界之外的最新、领域特定知识，从而提升推理的深度和事实可靠性。对此，北邮百家AI团队提出LightSearcher框架，首创基于经验记忆的高效RL优化技术，不依赖额外数据，仅通过引入经验记忆机制，实现Agent工具调用高效自主优化，解决痛点问题。3、准确性与效率失衡，部分方法虽提升准确率，但牺牲效率；

博文更新于 14 小时前 ·

LeCun创业首轮估值247亿！Alexandre当CEO

他曾在多个场合直言，现有的LLM路线是通往AGI的“死路”，其智能水平甚至不如一只狗——因为狗能通过观察理解物理世界的因果关系，而单纯靠文本训练的AI做不到。这一安排也符合LeCun一贯的科研志趣——这位65岁的图灵奖得主曾多次表示，自己的核心动力是“提升人类智能”，而非陷入行政管理与财务报表的琐事中。他在最近的播客节目中坦言，尽管到了可以退休的年纪，妻子也希望他回归家庭，但他无法停下，因为“提升人类智能”的使命尚未完成。而他与LeCun的交集，则始于2015年的一次关键并购——当时他创立的语音交互平台。

博文更新于 14 小时前 ·

紧急吃瓜！英伟达GPU供应要缩水了，第一刀砍向RTX 50系列

现在的3A游戏对显存要求越来越高，8GB显存玩起来可能会卡顿、掉帧、降画质，可一旦市面上16GB显卡变少了，那到时候咱要么被迫选8GB，要么就得“忍痛”加钱上更贵的卡。英伟达可能预判到2026年NAND和DRAM的内存成本会涨，这样必然会推高整机的价格，到时候消费者就会犹豫着不买，与其造出来堆库存，不如提前砍掉产能，把控风险。这意味着消费者要么被迫选“阉割版”的8GB显卡，要么就得加钱买更贵的。有朋友肯定知道，这两款卡的显存容量和更贵的RTX 5080是一样的，但售价更亲民，本来是中端玩家的“香饽饽”。

博文更新于 14 小时前 ·

是个公司都在用AI Agent，但大家真的用明白了吗？？| MEET2026圆桌论坛

对于一个基础设施提供方来说，对客户健康度的判断很重要，如果我的客户都很赚钱，那我大概率收取的价格是比较合理且可持续的，如果所有人都在亏钱，或者说大家都是期待下一轮的融资再来付今天用的基础设施的钱，（那么整个生态的健康度就会存疑），对于我们来说也非常关心这个问题。有关产品线的ROI，也想再问一下徐总，您刚刚提到咱们有做一些面向大众普惠型的产品，像刚刚提到收费方面的问题，会不会从您的角度来看，为了让大众使用AI Agent的产品，除了技术上要达成一些目标，是不是还有其他的要素也需要注意的？

博文更新于前天 09:06 ·

Google全链路赋能出海：3人团队调度千个智能体，可成独角兽｜MEET2026

可以想象这样一幅图景：每一个节点代表企业内部不同部门的智能体，或者代表不同企业的智能体，甚至是企业外部的第三方智能体。如果为每个智能体定义好功能层面的API（应用程序接口），这些API就可以被复用，智能体之间就能跨界协同。这一协议已获得传统金融机构和新兴金融科技公司的广泛支持，目标是让智能体之间的交易不被锁定在某个单一支付系统中，而是基于多方共识形成高信任度的支付网络。当3到10人的团队可以调度成百上千个智能体，当智能体与智能体之间能够跨企业自主通信，创业公司的边界、人效比、商业模式都将被重新定义。

博文更新于前天 09:06 ·

摩尔线程算法一鸣惊人，图形学顶会夺银！已开源

摩尔线程创新提出基于“One Warp Per Tile”原则的“Warp-Based Raster”新范式，将梯度聚合简化为一次Warp内归约，并结合扫描线算法与混合精度策略，大幅降低梯度计算开销，同时实现高效的像素级统计能力；，摒弃原有模糊的度量指标，采用更为鲁棒的像素不透明度梯度方差作为致密化的核心判据，精准识别欠拟合区域，其轻量化计算直接受益于底层光栅化器的高效统计支持。作为一种新兴的场景表示与新视角合成技术，3DGS凭借高渲染质量与实时渲染速度，在计算机图形学与视觉领域实现了显著突破。

博文更新于前天 09:03 ·

英伟达护城河又宽了！低调收购开源算力调度王牌工具，全球过半顶级超算在用，Thinking Machines也离不开它

但外界的担忧却没有消散，有人注意到，支撑不少新云厂商提供Slurm-on-Kubernetes服务的Slinky项目，涉及到slurm-operator、slurm-bridge等关键仓库，英伟达并未明确表态会持续投入开发。无论是大模型训练、数据预处理这类AI核心任务，还是天气预报、基因测序等超算级科研工作，都需要靠它实现资源的最优分配，进而保障任务的有序进行。其实双方早就有十年的合作基础，所以收购之后的技术衔接、团队整合的成本都比较低，英伟达也能快速把ScheMD的能力融入自己的生态。

博文更新于前天 08:58 ·

腾讯调整大模型组织架构：姚顺雨加盟，向总裁刘炽平汇报

在产品和服务层面，腾讯元宝持续优化用户体验，上线初期甚至保持了每天一个版本的迭代频率，快速赢得了用户的认可，用户规模稳居国内AI应用前三，成为最受新中产欢迎的AI原生应用。在过往混元大模型训练以及海量业务场景的深度实践中，腾讯已经积累了系统化的工程能力；据称，作为腾讯大模型体系的重要一环，AI Infra部将负责大模型训练和推理平台技术能力建设，聚焦大模型分布式训练、高性能推理服务等核心技术能力，构建大模型AI Infra核心竞争力，为大模型算法研发和业务场景落地提供稳定高效的技术支持和服务。

博文更新于前天 08:56 ·

让大模型“吃一堑长一智”，南理工百度等提出模型记忆新方法

在不改动大模型参数的前提下，ViLoMem能在多个多模态基准上稳定拉升表现，尤其是在需要精细视觉理解的数学与真实场景推理任务上，为构建真正“会从经验中长记性”的多模态智能体提供了一条很有潜力的道路。在多模态解题任务里，大模型经常出现这样的场景——上一题刚刚栽在“把等腰三角形看成等边”上，下一题遇到类似图形，依然毫不犹豫地再犯一次。作者还做了一个有意思的“跨模型记忆迁移”实验——让大模型“带小弟刷分”，也就是小模型直接使用大模型生成的记忆，看分数会发生什么变化。

博文更新于前天 08:54 ·

“特斯拉延期交付机器人是卡在灵巧手上，中国灵巧手遥遥领先”| 灵心巧手@MEET2026

再往上是另外一款Linker Hand L6，也是低自由度灵巧手，以速度见长，做手指弯折动作，这款手0.3秒可以完成弯折的动作，每天工作几个小时，它是真正可以进入到产业环境里面每天工作八个小时不会累，不会休息，不需要散热的灵巧手。想要做好灵巧手，让它像人手一样具备很高的自由度，能够抓能够捏，能够使用各种工具，光有硬件是不够用的，还要有各种软的东西，比如算法够不够，见到一个螺丝刀用几根手指抓它，用多大力量抓它，都要有相应的算法。它是软硬一体的平台，决定了机器人是否具备真正的泛化能力；

博文更新于前天 08:52 ·

反超Nano Banana！OpenAI旗舰图像生成模型上线

拍摄一张20世纪70年代伦敦切尔西的场景照片，画面要逼真，所有景物清晰对焦，人群密集，还有一辆公交车，车身贴着「ImageGen 1.5」的广告，广告上印有OpenAI标志和「创造你的想象」的副标题。而且今天就能用上了，GPT-Image-1.5将在ChatGPT中面向所有用户推出，并在API中作为GPT Image 1.5推出。被谷歌一轮正面「拷打」之后，OpenAI藏了大半年的GPT-Image-1.5，终于憋不住了。事实上，对GPT-Image-1.5世界理解能力的质疑，并非个例。

博文更新于前天 08:50 ·