AI 每日热点 · 2026-05-23

🔬 AI 新工艺

1. Antigravity 2.0 登顶 OpenSCAD 3D LLM 基准
ModelRift 发布 OpenSCAD 架构设计基准，Antigravity 2.0 在参数化建模任务上超越 GPT-4o 和 Claude。和你在用的 Agent Plan 模式不同在于，它测试的不是通用编码能力，而是模型对几何约束和参数化逻辑的理解——这对 AI 辅助工程设计的评估有独立价值。
https://modelrift.com/blog/openscad-llm-benchmark/

2. smallcode：4B 小模型达 87% 编码基准
专为小型 LLM 优化的 AI 编码代理，在 SWE-bench 上以仅 4B 活跃参数达到 87% 性能。与你日常使用的 Agent Plan 模式依赖大模型不同，smallcode 证明了通过专门架构设计也能让小模型胜任编码任务，对本地化部署和成本控制有启发意义。
https://github.com/Doorman11991/smallcode

3. OpenSquilla：Token 效率型 AI Agent
在相同预算下通过优化 token 使用密度提供更高的智能水平，相比传统 Agent 框架注重 prompt 链编排，OpenSquilla 更关注每个 token 的边际回报。
https://github.com/opensquilla/opensquilla

🛠️ 工具及技巧

1. html-anything：Agent 驱动的 HTML 编辑器
本地 AI 代理直接写 HTML，支持 75 种 Skill × 9 种版面（杂志、海报、演示文稿等），你只管交付。
https://github.com/nexu-io/html-anything

2. mirage：AI Agent 的统一虚拟文件系统
为 AI 代理提供统一的文件系统抽象层，解决跨目录/跨工具操作时的路径混乱问题。
https://github.com/strukto-ai/mirage

3. Hallmark：反 AI 味的设计 Skill
为 Claude Code、Cursor 和 Codex 准备的 Anti-AI-slop 设计指令，让 AI 生成的产品避免千篇一律的"AI 味"。
https://github.com/Nutlope/hallmark

⭐ 开源亮点

1. models.dev — AI 模型规格、定价与能力开源数据库
https://github.com/anomalyco/models.dev

2. reversa — 将遗留系统转化为 AI 编码代理的可执行规约
https://github.com/sandeco/reversa

3. Kanbots — 每张卡片并行运行 Agent 的开源看板
https://www.kanbots.dev/

📰 行业动态

1. Microsoft 开始取消 Claude Code 许可证，The Verge 报道称大量用户收到授权终止通知

2. DeepSeek 将 V4 Pro 的价格折扣转为永久定价策略

3. Fortune 报道微软内部评估发现 AI 成本高于同等人类员工薪资

🚀 重磅发布

1. Anthropic 发布 Project Glasswing 初步更新，展示透明化 AI 内部机制的研究进展

2. Deno 2.8 发布，聚焦性能和开发者体验改进

↑ Back to list

Apps

Android Developer Tools

Android Developer Tools Pro

About Me

Tools: TimeShining

GitHub: Trinea

Facebook: Dev Tools

AI Daily Digest

Daily AI News & Insights

JSON Format, Support error correction

MD5/SHA Encode, Support batch

CSS Format and Compress