AI 每日热点 · 2026-05-23

🔬 AI 新工艺

1. Antigravity 2.0 登顶 OpenSCAD 3D LLM 基准
ModelRift 发布 OpenSCAD 架构设计基准,Antigravity 2.0 在参数化建模任务上超越 GPT-4o 和 Claude。和你在用的 Agent Plan 模式不同在于,它测试的不是通用编码能力,而是模型对几何约束和参数化逻辑的理解——这对 AI 辅助工程设计的评估有独立价值。
https://modelrift.com/blog/openscad-llm-benchmark/

2. smallcode:4B 小模型达 87% 编码基准
专为小型 LLM 优化的 AI 编码代理,在 SWE-bench 上以仅 4B 活跃参数达到 87% 性能。与你日常使用的 Agent Plan 模式依赖大模型不同,smallcode 证明了通过专门架构设计也能让小模型胜任编码任务,对本地化部署和成本控制有启发意义。
https://github.com/Doorman11991/smallcode

3. OpenSquilla:Token 效率型 AI Agent
在相同预算下通过优化 token 使用密度提供更高的智能水平,相比传统 Agent 框架注重 prompt 链编排,OpenSquilla 更关注每个 token 的边际回报。
https://github.com/opensquilla/opensquilla


🛠️ 工具及技巧

1. html-anything:Agent 驱动的 HTML 编辑器
本地 AI 代理直接写 HTML,支持 75 种 Skill × 9 种版面(杂志、海报、演示文稿等),你只管交付。
https://github.com/nexu-io/html-anything

2. mirage:AI Agent 的统一虚拟文件系统
为 AI 代理提供统一的文件系统抽象层,解决跨目录/跨工具操作时的路径混乱问题。
https://github.com/strukto-ai/mirage

3. Hallmark:反 AI 味的设计 Skill
为 Claude Code、Cursor 和 Codex 准备的 Anti-AI-slop 设计指令,让 AI 生成的产品避免千篇一律的"AI 味"。
https://github.com/Nutlope/hallmark


⭐ 开源亮点

1. models.dev — AI 模型规格、定价与能力开源数据库
https://github.com/anomalyco/models.dev

2. reversa — 将遗留系统转化为 AI 编码代理的可执行规约
https://github.com/sandeco/reversa

3. Kanbots — 每张卡片并行运行 Agent 的开源看板
https://www.kanbots.dev/


📰 行业动态

1. Microsoft 开始取消 Claude Code 许可证,The Verge 报道称大量用户收到授权终止通知

2. DeepSeek 将 V4 Pro 的价格折扣转为永久定价策略

3. Fortune 报道微软内部评估发现 AI 成本高于同等人类员工薪资


🚀 重磅发布

1. Anthropic 发布 Project Glasswing 初步更新,展示透明化 AI 内部机制的研究进展

2. Deno 2.8 发布,聚焦性能和开发者体验改进

↑ Back to list
Apps
About Me
GitHub: Trinea
Facebook: Dev Tools
AI Daily Digest