Crypto Knight
cryptoknightai.bsky.social
Crypto Knight
@cryptoknightai.bsky.social
It’s Crypto Knight, crypto, and AI, Innovations are my playground.
浪潮YuanLab.ai开源Yuan3.0Flash,40B参数稀疏MoE,推理仅激活3.7B

RAPO+RIRM减少无效反思,token消耗最高降75%。企业级RAG、多模态检索、表格理解超GPT-5.1,精度接近235B/671B大模型,token消耗仅1/4-1/2

16bit/4bit权重、技术报告全开放,还支持二次开发,助力企业低成本落地AI
January 2, 2026 at 7:32 AM
腾讯混元12.30开源HY‑Motion1.0(1B参数,含0.46B轻量版),DiT+流匹配架构

三阶段训练+RLHF优化,指令遵循78.6%、动作质量3.43/5分。一句话生成SMPL‑H骨骼动画,覆盖200+动作,兼容Blender/Unity/UE

游戏NPC/影视分镜/VR内容制作效率大增,职业高难度动作需微调,是3D动画创作的开源利器,论文arxiv.org/pdf/2512.23464
December 31, 2025 at 10:38 AM
Claude Code Workflow Studio爆火,VS Code扩展用拖拽画布替代命令行

支持Prompt/Sub‑Agent等节点快速搭建AI工作流,AI辅助编辑自然语言改流程,导出.claude文件即可执行

适配文档总结、代码修复、网页爬取等场景,解决提示混乱,非码农也能上手,搭配国内同类工具,生态更丰富,AI代理工作流进入可视化时代
December 30, 2025 at 9:25 AM
发现个开源神器ClipSketch AI,直接把视频二创效率拉满

粘贴B站或小红书链接,自动下载视频、提取关键帧,还能生成超有质感的手绘分镜,漫画感十足!最绝的是能一键出爆款文案,标题、解说、笔记描述直接复制能用,再也不用熬夜写文案、手动截图了

本地部署超简单,配置个Gemini API Key就行,教程、剧情、种草类内容都适配,GitHub直接搜就能get
December 29, 2025 at 9:28 AM
最近阿里通义刚开源的Qwen-Image-Edit-2511,直接解决2509版的“编辑漂移”大坑!

以前改个背景、换件衣服,人物要么歪了要么变形,现在精准到离谱——局部修改只动指定区域,结构、细节、光照全保住

更绝的是支持文本指令和掩码图,新手也能当修图大神,电商换装、影视后期、日常P图全搞定,模型和代码还免费开放!这波精度升级,直接让AIGC从“能用”跳到“好用”
December 28, 2025 at 2:26 PM
游戏AI彻底变天了⚠️ NVIDIA联合斯坦福刚出的NitroGen,堪称“游戏通才”,1000多款游戏都能玩,从平台跳跃到射击解谜,没见过的新游戏也能快速上手,直接打破以前“一个游戏一个AI模型”的死局

它牛就牛在两点:一是像人一样靠纯视觉玩游戏,不用扒游戏内部数据;二是把键盘、手柄这些操作统一成标准动作,跨设备都能泛化。更绝的是,4万小时的GameVerse-1K数据集和模型全开源,开发者直接就能用

这可不只是玩游戏,以后机器人控制、自动驾驶都能参考这个思路
December 27, 2025 at 11:22 AM
小红书联合复旦大学搞出大动作,推出布局控制生成技术InstanceAssemble,成功攻克AI绘画构图难的痛点,相关论文已入选顶会NeurIPS2025

这项技术靠实例拼装注意力机制,能按指定位置精准生成图像,位置对齐准、语义不脱节,简单与复杂场景都适配

更亮眼的是轻量易适配,无需重训模型,额外参数占比极低,现已开源,未来在设计、广告等创意领域大有可为,感兴趣的看看论文arxiv.org/pdf/2509.16691
December 26, 2025 at 9:49 AM
智谱GLM-4.7在圣诞节开源炸场,编码能力直接冲开源第一,还把GPT-5.1给超了

这模型太顶了:SWE-Bench分数73.8%创开源新高,写代码、复杂推理、多语言编程全拿捏,连3D圣诞树、iOS界面、格斗小游戏都能一键生成可运行代码。最牛的是新增“保留式思考”和“轮级思考”,长任务不返工,简单需求秒响应,效率直接翻倍

关键是智谱已经通过港交所聆讯,马上要成“大模型第一股”,现在放这大招就是秀肌肉!而且价格超香,每月20块就能用,比同类模型便宜太多。不管是新手练手还是老手提效,赶紧去BigModel.cn或Z.ai体验
December 25, 2025 at 10:24 AM
谷歌AI放大招,Gemini 3 Flash直接“背刺”自家Pro大哥⚠️ 百万级长上下文+白菜价,速度快3倍还更聪明,行业彻底被颠覆

最牛的是100万token上下文准确率90%,能精准理解超长文档里的复杂关联,比其他顶尖模型的256k上限强太多;成本才$0.5/1M输入token,是Pro版的零头。背后藏着混合架构黑科技,又快又聪明还省钱,打破了“大模型就该贵”的定律

据说是Pro给Flash做蒸馏,现在Flash已经是Gemini默认模型,不但免费能用,口述就能生成App、分析长视频、处理法律文档都秒响应
December 24, 2025 at 9:05 AM
谷歌DeepMind最新发布了关于AGI安全的重磅论文,核心观点还挺颠覆认知

它认为未来的通用人工智能,可能不会是一个超强的单一超级大脑,反倒会是由好多各有专长的小模型组合而成,靠相互协作完成各类复杂任务,像个去中心化的智能协作体

相应的风险也不再是单个AI出问题,而是来自这些智能体之间的相互作用,比如暗中协同、恶性竞争等,对此也给出了一套多层防御的安全框架,为后续AGI的发展和安全管控指明了新方向,感兴趣的看看论文arxiv.org/abs/2512.16856
December 23, 2025 at 8:21 AM
AI编码智能体已经从“几分钟”进化到“几小时”,以后写代码可能真不用熬夜了

Anthropic刚出的Claude Opus 4.5太猛了,能自己连续写代码快5个小时不崩,比OpenAI的GPT-5.1-Codex-Max的2小时53分钟强太多。更吓人的是速度越来越快:之前每7个月能力翻一倍,现在4个月就翻一番,这简直是新摩尔定律

按这节奏,明年AI就能干满一整天活,到2030年甚至能管小公司大部分事。不过它也有短板,记不住长期的事,这是通往AGI的大坎,未来拼的就是记忆和学习能力

想把长编码任务交给AI的,赶紧去试Opus 4.5,现在输入输出价格都砍到原来的1/3,性价比直接拉满
December 22, 2025 at 10:39 AM
Mistral AI发布Mistral OCR3,文档处理直接省大钱、提大速

它比上一代强74%,手写、歪掉的扫描件、密密麻麻的复杂表格都能精准识别,连草书都不在话下。最牛的是能把表格还原成HTML,文本转成Markdown,下游系统直接用,不用再人工校对结构。价格更是炸裂:1000页才2美元,批量API半价,1000页只要1美元,比市面上便宜一大截

怎么用?发票自动对账、老档案一键数字化、合规表格自动录入,全流程自动化,出错率降90%,效率提5倍。现在就去试批量API,成本直接砍半!
December 21, 2025 at 11:16 AM
最近OpenAI又放了大招——GPT-5.2-Codex,这AI编程模型直接让开发效率起飞

它不只是写代码,能从理解代码、搭环境、挖漏洞到提交PR,全流程自己搞定!最牛的是上下文压缩,改大项目、跨库迁移不卡顿,Token效率还涨30%;以前只适配Linux,现在Windows 10/11上干活成功率超95%;你传张UI截图或手绘草图,它直接出能跑的前端代码,设计到原型一步到位

安全领域已验证:帮工程师把漏洞验证从几天缩到几小时。现在付费ChatGPT用户就能用,API几周后开放。以后工程师不用当码农,当“AI指挥官”——把控需求和架构,脏活累活让AI干
December 20, 2025 at 4:44 PM
AI视频编辑王炸来了🎬 Luma AI的Ray3Modify能让实拍视频“换脸换衣换场景,表演一丝不变”

以前改视频,演员的眼神、表情、情绪很容易缺失,现在只需一段实拍视频+目标角色参考图,AI就能把演员变成动漫角色、虚拟代言人,走路转身、微笑皱眉,每一个微表情都原封不动!还能设置起止帧,生成超流畅的过渡镜头,叙事非常顺滑

现在拍一次表演,AI能变出N种版本,不用重搭场景、不用再召集演员,节省很大成本!Luma刚拿9亿融资,还要建2GW算力集群,影视广告游戏的制作效率直接起飞
December 19, 2025 at 8:23 AM
今天字节AI放大招🚀 豆包1.8+Seedance 1.5 Pro双更,还有省钱计划,企业和创作者有福了

豆包1.8工具调用强40%,看视频一次能懂1280帧,写代码、复杂指令更稳;Seedance 1.5 Pro音画同步绝了,口型匹配98%+,多语种方言都能精准对,还能自动运镜拍大片,样片功能提效65%,节省60%无效成本

日均50万亿Tokens,百余家企业使用,AI节省计划最高省47%!手机、AI眼镜都能用,大模型+云+终端闭环拉满,AI降本增效的时代真的来了
December 18, 2025 at 9:48 AM
腾讯AI又放大招🚀 混元世界模型1.5来了,一个能实时玩的AI生成3D世界

输入文字或图片,秒变可探索的虚拟世界,键盘鼠标手柄都能操控,24帧720P超流畅,离开再回来场景还能精准“记住”3D结构,不穿帮

更狠的是全链路开源,游戏关卡、影视预演、VR开发直接降本提速,文本还能实时触发事件,玩法脑洞拉满!感兴趣的看下论文https://3d-models.hunyuan.tencent.com/world/world1_5/HYWorld_1.5_Tech_Report.pdf
December 17, 2025 at 8:36 AM
阿里通义“百聆”语音双模型重大升级并开源

Fun-CosyVoice3仅需3秒录音,即可实现9种语言、18种方言切换及情感模拟,首包延迟降50%,中英混说错误率大降56.4%,支持音色克隆

Fun-ASR噪声环境识别准确率达93%,新增歌词说唱识别,支持31种语言混说,流式识别首字延迟仅160毫秒。双模型均支持本地部署与二次开发,已在多平台开放开源
December 16, 2025 at 7:53 AM
全AI生成游戏引发行业争议!独立作品《Codex Mortis》宣称从代码、美术到音乐100%由AI完成,开发者通过“氛围式编码”仅三个月落地,体验如“给创作者装外骨骼”

但上线Steam后争议拉满,差评直指其为“AI流水线产物”,核心矛盾聚焦于“AI协作是解放效率还是放弃创意主权”

作为标志性案例,它映照出行业对“原创”“作者”定义的集体困惑,也成为AI创作时代的真实切片
December 15, 2025 at 7:59 AM
欧洲AI巨头Mistral放出编码神器Devstral2,开源还免费,直接硬刚闭源巨头

123B旗舰版解决GitHub问题正确率72.2%,成本比闭源模型低7倍;24B轻量版笔记本就能跑,隐私敏感场景闭眼冲。更狠的是配套Mistral Vibe CLI,自然语言就能操控整个代码库,扫描结构、执行命令、改bug一键搞定,还能集成到IDE里

这波直接把AI编码效率拉满,开源党有福了,闭源垄断要被打破了
December 14, 2025 at 9:32 AM
Skywork 5.0版APP上线,手机端直接解锁多Agent并行黑科技,效率直接拉满

长按录音6秒,会议灵感秒变结构化要点、Todo清单和脑图;一句话指令,同时生成PPT、三平台文案、播客脚本和3套海报,不用再切换十个工具。无网也能离线用,4G网络4.8秒出结果,首月免费随便造,次月才29块

这波直接把办公创作门槛踩碎,移动端多Agent时代是真的来了
December 13, 2025 at 3:12 PM
AI视频巨头Runway杀入世界模型赛道,推出首个通用世界模型GWM-1,通过逐帧像素预测构建懂物理规律的动态仿真环境,跻身谷歌、OpenAI等巨头行列

具体可分为三大落地分支:GWM-Worlds可生成交互式动态世界,GWM-Robotics助力机器人场景预演,GWM-Avatars打造高逼真数字人

同时Gen4.5模型升级原生音频生成、多镜头合成等工业级功能,标志AI视频从原型迈向量产,世界模型融合成最终目标
December 12, 2025 at 9:35 AM
AI动画创作彻底卷疯了🚨 商汤新出的Seko2.0,输入一句话就能一键生成100集动画短剧,成本才一杯奶茶钱

12分钟出片,人物从第1集到第100集零变脸,剧情节奏比人工写的还丝滑。上百种风格随便选,上传自拍就能生成专属3D角色,台词、镜头随时能改,完全不用懂专业技术

关键是比Runway更连贯,比Sora更好控剧情,普通人也能当导演!后续还要出电影质感的作品,甚至冲击院线,AI创作的导演时代真的来了
December 11, 2025 at 10:34 AM
OpenAI偷偷搞大事,新图像模型杀疯了🚀 两款代号“栗子”“榛子”的神秘模型正在盲测,直接硬刚谷歌和Midjourney

新模型生成的名人自拍堪比写真,代码公式再也不歪歪扭扭,世界知识理解能力和谷歌顶尖模型平起平坐。更狠的是,这俩大概率是Image-2的轻量版和旗舰版,最快本周就会跟着GPT-5.2一起发布

这波操作直接补上OpenAI的图像短板,以后做设计、写教程、搞创意,出图又快又精准
December 10, 2025 at 8:53 AM
英伟达与Mistral AI深化合作,联合推出开源多模态模型家族Mistral 3,12月2日已全面上线

旗舰模型Mistral Large 3采用MoE架构,总参数量6750亿、活跃参数410亿,支持256K超长上下文,适配英伟达GB200 NVL72系统,单节点即可高效部署

同时发布9款3B-14B参数轻量化模型,覆盖边缘设备,开发者可通过Llama.cpp等框架调用,Apache 2.0协议支持无限制商业使用,加速前沿AI民主化落地。
December 9, 2025 at 8:53 AM
🚨腾讯AI放大招!自研混元2.0重磅发布,还拉来DeepSeek V3.2组队,双王炸直接落地元宝等应用

混元2.0带406B参数+256K超长上下文,数学竞赛拿一流成绩,代码、长文推理全拿捏,实力冲进国内第一梯队

现在不仅能直接用,企业开发者还能通过腾讯云调用API,零代码就能搭智能体
December 8, 2025 at 12:33 PM