Lightnews — Scholar-powered news

Crypto Knight

@cryptoknightai.bsky.social

浪潮YuanLab.ai开源Yuan3.0Flash，40B参数稀疏MoE，推理仅激活3.7B

RAPO+RIRM减少无效反思，token消耗最高降75%。企业级RAG、多模态检索、表格理解超GPT-5.1，精度接近235B/671B大模型，token消耗仅1/4-1/2

16bit/4bit权重、技术报告全开放，还支持二次开发，助力企业低成本落地AI

January 2, 2026 at 7:32 AM

Crypto Knight

@cryptoknightai.bsky.social

腾讯混元12.30开源HY‑Motion1.0（1B参数，含0.46B轻量版），DiT+流匹配架构

三阶段训练+RLHF优化，指令遵循78.6%、动作质量3.43/5分。一句话生成SMPL‑H骨骼动画，覆盖200+动作，兼容Blender/Unity/UE

游戏NPC/影视分镜/VR内容制作效率大增，职业高难度动作需微调，是3D动画创作的开源利器，论文arxiv.org/pdf/2512.23464

December 31, 2025 at 10:38 AM

Crypto Knight

@cryptoknightai.bsky.social

Claude Code Workflow Studio爆火，VS Code扩展用拖拽画布替代命令行

支持Prompt/Sub‑Agent等节点快速搭建AI工作流，AI辅助编辑自然语言改流程，导出.claude文件即可执行

适配文档总结、代码修复、网页爬取等场景，解决提示混乱，非码农也能上手，搭配国内同类工具，生态更丰富，AI代理工作流进入可视化时代

December 30, 2025 at 9:25 AM

Crypto Knight

@cryptoknightai.bsky.social

发现个开源神器ClipSketch AI，直接把视频二创效率拉满

粘贴B站或小红书链接，自动下载视频、提取关键帧，还能生成超有质感的手绘分镜，漫画感十足！最绝的是能一键出爆款文案，标题、解说、笔记描述直接复制能用，再也不用熬夜写文案、手动截图了

本地部署超简单，配置个Gemini API Key就行，教程、剧情、种草类内容都适配，GitHub直接搜就能get

December 29, 2025 at 9:28 AM

Crypto Knight

@cryptoknightai.bsky.social

最近阿里通义刚开源的Qwen-Image-Edit-2511，直接解决2509版的“编辑漂移”大坑！

以前改个背景、换件衣服，人物要么歪了要么变形，现在精准到离谱——局部修改只动指定区域，结构、细节、光照全保住

更绝的是支持文本指令和掩码图，新手也能当修图大神，电商换装、影视后期、日常P图全搞定，模型和代码还免费开放！这波精度升级，直接让AIGC从“能用”跳到“好用”

December 28, 2025 at 2:26 PM

Crypto Knight

@cryptoknightai.bsky.social

游戏AI彻底变天了⚠️ NVIDIA联合斯坦福刚出的NitroGen，堪称“游戏通才”，1000多款游戏都能玩，从平台跳跃到射击解谜，没见过的新游戏也能快速上手，直接打破以前“一个游戏一个AI模型”的死局

它牛就牛在两点：一是像人一样靠纯视觉玩游戏，不用扒游戏内部数据；二是把键盘、手柄这些操作统一成标准动作，跨设备都能泛化。更绝的是，4万小时的GameVerse-1K数据集和模型全开源，开发者直接就能用

这可不只是玩游戏，以后机器人控制、自动驾驶都能参考这个思路

December 27, 2025 at 11:22 AM

Crypto Knight

@cryptoknightai.bsky.social

小红书联合复旦大学搞出大动作，推出布局控制生成技术InstanceAssemble，成功攻克AI绘画构图难的痛点，相关论文已入选顶会NeurIPS2025

这项技术靠实例拼装注意力机制，能按指定位置精准生成图像，位置对齐准、语义不脱节，简单与复杂场景都适配

更亮眼的是轻量易适配，无需重训模型，额外参数占比极低，现已开源，未来在设计、广告等创意领域大有可为，感兴趣的看看论文arxiv.org/pdf/2509.16691

December 26, 2025 at 9:49 AM

Crypto Knight

@cryptoknightai.bsky.social

智谱GLM-4.7在圣诞节开源炸场，编码能力直接冲开源第一，还把GPT-5.1给超了

这模型太顶了：SWE-Bench分数73.8%创开源新高，写代码、复杂推理、多语言编程全拿捏，连3D圣诞树、iOS界面、格斗小游戏都能一键生成可运行代码。最牛的是新增“保留式思考”和“轮级思考”，长任务不返工，简单需求秒响应，效率直接翻倍

关键是智谱已经通过港交所聆讯，马上要成“大模型第一股”，现在放这大招就是秀肌肉！而且价格超香，每月20块就能用，比同类模型便宜太多。不管是新手练手还是老手提效，赶紧去BigModel.cn或Z.ai体验

December 25, 2025 at 10:24 AM

Crypto Knight

@cryptoknightai.bsky.social

谷歌AI放大招，Gemini 3 Flash直接“背刺”自家Pro大哥⚠️ 百万级长上下文+白菜价，速度快3倍还更聪明，行业彻底被颠覆

最牛的是100万token上下文准确率90%，能精准理解超长文档里的复杂关联，比其他顶尖模型的256k上限强太多；成本才$0.5/1M输入token，是Pro版的零头。背后藏着混合架构黑科技，又快又聪明还省钱，打破了“大模型就该贵”的定律

据说是Pro给Flash做蒸馏，现在Flash已经是Gemini默认模型，不但免费能用，口述就能生成App、分析长视频、处理法律文档都秒响应

December 24, 2025 at 9:05 AM

Crypto Knight

@cryptoknightai.bsky.social

谷歌DeepMind最新发布了关于AGI安全的重磅论文，核心观点还挺颠覆认知

它认为未来的通用人工智能，可能不会是一个超强的单一超级大脑，反倒会是由好多各有专长的小模型组合而成，靠相互协作完成各类复杂任务，像个去中心化的智能协作体

相应的风险也不再是单个AI出问题，而是来自这些智能体之间的相互作用，比如暗中协同、恶性竞争等，对此也给出了一套多层防御的安全框架，为后续AGI的发展和安全管控指明了新方向，感兴趣的看看论文arxiv.org/abs/2512.16856

December 23, 2025 at 8:21 AM

Crypto Knight

@cryptoknightai.bsky.social

AI编码智能体已经从“几分钟”进化到“几小时”，以后写代码可能真不用熬夜了

Anthropic刚出的Claude Opus 4.5太猛了，能自己连续写代码快5个小时不崩，比OpenAI的GPT-5.1-Codex-Max的2小时53分钟强太多。更吓人的是速度越来越快：之前每7个月能力翻一倍，现在4个月就翻一番，这简直是新摩尔定律

按这节奏，明年AI就能干满一整天活，到2030年甚至能管小公司大部分事。不过它也有短板，记不住长期的事，这是通往AGI的大坎，未来拼的就是记忆和学习能力

想把长编码任务交给AI的，赶紧去试Opus 4.5，现在输入输出价格都砍到原来的1/3，性价比直接拉满

December 22, 2025 at 10:39 AM

Crypto Knight

@cryptoknightai.bsky.social

Mistral AI发布Mistral OCR3，文档处理直接省大钱、提大速

它比上一代强74%，手写、歪掉的扫描件、密密麻麻的复杂表格都能精准识别，连草书都不在话下。最牛的是能把表格还原成HTML，文本转成Markdown，下游系统直接用，不用再人工校对结构。价格更是炸裂：1000页才2美元，批量API半价，1000页只要1美元，比市面上便宜一大截

怎么用？发票自动对账、老档案一键数字化、合规表格自动录入，全流程自动化，出错率降90%，效率提5倍。现在就去试批量API，成本直接砍半！

December 21, 2025 at 11:16 AM

Crypto Knight

@cryptoknightai.bsky.social

最近OpenAI又放了大招——GPT-5.2-Codex，这AI编程模型直接让开发效率起飞

它不只是写代码，能从理解代码、搭环境、挖漏洞到提交PR，全流程自己搞定！最牛的是上下文压缩，改大项目、跨库迁移不卡顿，Token效率还涨30%；以前只适配Linux，现在Windows 10/11上干活成功率超95%；你传张UI截图或手绘草图，它直接出能跑的前端代码，设计到原型一步到位

安全领域已验证：帮工程师把漏洞验证从几天缩到几小时。现在付费ChatGPT用户就能用，API几周后开放。以后工程师不用当码农，当“AI指挥官”——把控需求和架构，脏活累活让AI干

December 20, 2025 at 4:44 PM

Crypto Knight

@cryptoknightai.bsky.social

AI视频编辑王炸来了🎬 Luma AI的Ray3Modify能让实拍视频“换脸换衣换场景，表演一丝不变”

以前改视频，演员的眼神、表情、情绪很容易缺失，现在只需一段实拍视频+目标角色参考图，AI就能把演员变成动漫角色、虚拟代言人，走路转身、微笑皱眉，每一个微表情都原封不动！还能设置起止帧，生成超流畅的过渡镜头，叙事非常顺滑

现在拍一次表演，AI能变出N种版本，不用重搭场景、不用再召集演员，节省很大成本！Luma刚拿9亿融资，还要建2GW算力集群，影视广告游戏的制作效率直接起飞

December 19, 2025 at 8:23 AM

Crypto Knight

@cryptoknightai.bsky.social

今天字节AI放大招🚀 豆包1.8+Seedance 1.5 Pro双更，还有省钱计划，企业和创作者有福了

豆包1.8工具调用强40%，看视频一次能懂1280帧，写代码、复杂指令更稳；Seedance 1.5 Pro音画同步绝了，口型匹配98%+，多语种方言都能精准对，还能自动运镜拍大片，样片功能提效65%，节省60%无效成本

日均50万亿Tokens，百余家企业使用，AI节省计划最高省47%！手机、AI眼镜都能用，大模型+云+终端闭环拉满，AI降本增效的时代真的来了

December 18, 2025 at 9:48 AM

Crypto Knight

@cryptoknightai.bsky.social

腾讯AI又放大招🚀 混元世界模型1.5来了，一个能实时玩的AI生成3D世界

输入文字或图片，秒变可探索的虚拟世界，键盘鼠标手柄都能操控，24帧720P超流畅，离开再回来场景还能精准“记住”3D结构，不穿帮

更狠的是全链路开源，游戏关卡、影视预演、VR开发直接降本提速，文本还能实时触发事件，玩法脑洞拉满！感兴趣的看下论文https://3d-models.hunyuan.tencent.com/world/world1_5/HYWorld_1.5_Tech_Report.pdf

December 17, 2025 at 8:36 AM

Crypto Knight

@cryptoknightai.bsky.social

阿里通义“百聆”语音双模型重大升级并开源

Fun-CosyVoice3仅需3秒录音，即可实现9种语言、18种方言切换及情感模拟，首包延迟降50%，中英混说错误率大降56.4%，支持音色克隆

Fun-ASR噪声环境识别准确率达93%，新增歌词说唱识别，支持31种语言混说，流式识别首字延迟仅160毫秒。双模型均支持本地部署与二次开发，已在多平台开放开源

December 16, 2025 at 7:53 AM

Crypto Knight

@cryptoknightai.bsky.social

全AI生成游戏引发行业争议！独立作品《Codex Mortis》宣称从代码、美术到音乐100%由AI完成，开发者通过“氛围式编码”仅三个月落地，体验如“给创作者装外骨骼”

但上线Steam后争议拉满，差评直指其为“AI流水线产物”，核心矛盾聚焦于“AI协作是解放效率还是放弃创意主权”

作为标志性案例，它映照出行业对“原创”“作者”定义的集体困惑，也成为AI创作时代的真实切片

December 15, 2025 at 7:59 AM

Crypto Knight

@cryptoknightai.bsky.social

欧洲AI巨头Mistral放出编码神器Devstral2，开源还免费，直接硬刚闭源巨头

123B旗舰版解决GitHub问题正确率72.2%，成本比闭源模型低7倍；24B轻量版笔记本就能跑，隐私敏感场景闭眼冲。更狠的是配套Mistral Vibe CLI，自然语言就能操控整个代码库，扫描结构、执行命令、改bug一键搞定，还能集成到IDE里

这波直接把AI编码效率拉满，开源党有福了，闭源垄断要被打破了

December 14, 2025 at 9:32 AM

Crypto Knight

@cryptoknightai.bsky.social

Skywork 5.0版APP上线，手机端直接解锁多Agent并行黑科技，效率直接拉满

长按录音6秒，会议灵感秒变结构化要点、Todo清单和脑图；一句话指令，同时生成PPT、三平台文案、播客脚本和3套海报，不用再切换十个工具。无网也能离线用，4G网络4.8秒出结果，首月免费随便造，次月才29块

这波直接把办公创作门槛踩碎，移动端多Agent时代是真的来了

December 13, 2025 at 3:12 PM

Crypto Knight

@cryptoknightai.bsky.social

AI视频巨头Runway杀入世界模型赛道，推出首个通用世界模型GWM-1，通过逐帧像素预测构建懂物理规律的动态仿真环境，跻身谷歌、OpenAI等巨头行列

具体可分为三大落地分支：GWM-Worlds可生成交互式动态世界，GWM-Robotics助力机器人场景预演，GWM-Avatars打造高逼真数字人

同时Gen4.5模型升级原生音频生成、多镜头合成等工业级功能，标志AI视频从原型迈向量产，世界模型融合成最终目标

December 12, 2025 at 9:35 AM

Crypto Knight

@cryptoknightai.bsky.social

AI动画创作彻底卷疯了🚨 商汤新出的Seko2.0，输入一句话就能一键生成100集动画短剧，成本才一杯奶茶钱

12分钟出片，人物从第1集到第100集零变脸，剧情节奏比人工写的还丝滑。上百种风格随便选，上传自拍就能生成专属3D角色，台词、镜头随时能改，完全不用懂专业技术

关键是比Runway更连贯，比Sora更好控剧情，普通人也能当导演！后续还要出电影质感的作品，甚至冲击院线，AI创作的导演时代真的来了

December 11, 2025 at 10:34 AM

Crypto Knight

@cryptoknightai.bsky.social

OpenAI偷偷搞大事，新图像模型杀疯了🚀 两款代号“栗子”“榛子”的神秘模型正在盲测，直接硬刚谷歌和Midjourney

新模型生成的名人自拍堪比写真，代码公式再也不歪歪扭扭，世界知识理解能力和谷歌顶尖模型平起平坐。更狠的是，这俩大概率是Image-2的轻量版和旗舰版，最快本周就会跟着GPT-5.2一起发布

这波操作直接补上OpenAI的图像短板，以后做设计、写教程、搞创意，出图又快又精准

December 10, 2025 at 8:53 AM

Crypto Knight

@cryptoknightai.bsky.social

英伟达与Mistral AI深化合作，联合推出开源多模态模型家族Mistral 3，12月2日已全面上线

旗舰模型Mistral Large 3采用MoE架构，总参数量6750亿、活跃参数410亿，支持256K超长上下文，适配英伟达GB200 NVL72系统，单节点即可高效部署

同时发布9款3B-14B参数轻量化模型，覆盖边缘设备，开发者可通过Llama.cpp等框架调用，Apache 2.0协议支持无限制商业使用，加速前沿AI民主化落地。

December 9, 2025 at 8:53 AM

Crypto Knight

@cryptoknightai.bsky.social

🚨腾讯AI放大招！自研混元2.0重磅发布，还拉来DeepSeek V3.2组队，双王炸直接落地元宝等应用

混元2.0带406B参数+256K超长上下文，数学竞赛拿一流成绩，代码、长文推理全拿捏，实力冲进国内第一梯队

现在不仅能直接用，企业开发者还能通过腾讯云调用API，零代码就能搭智能体

December 8, 2025 at 12:33 PM

Add to Home Screen

Light up
your news

Add to Home Screen

Light upyour news

Sign in to Lightnews

Sign up to start reading

Connect Bluesky

Connect with Bluesky

Light up
your news