先说一个我自己使用 Codex 时很明显的感受:官方工具越来越强,但“手机控制本机 Codex”这个场景还没有变得足够直接。
无论 PI(@earendil-works/pi-coding-agent)还是 DeepAgents(langchain-ai/deepagents),它们的...
2025 年 8 月底(距今约半年),OpenAI 内部启动了一个极端实验:零人类编写代码,完全由 Codex agent 自主完成一个有真实日常用户的产品。结...
李想也谈到了这一点,他觉得用Openclaw久了之后会觉得变傻,所以他已经切换到用Hermes了。
你是否想过,Skill 其实也可以像神经元参数一样被训练。你总想着授它以鱼,像个训斥孩子的妈妈,一遍一遍对着它苦口婆心地说教——你给我记住!你不许这样!这样不对...
有人图省事,将 .tar.gz 改叫 .tgz(缩写),这在 Linux 里能用。 但如果你自作主张叫它 .zip 或者直接叫 .gz,就会产生混乱:
大模型的技术中可能经常听到"Skill",它是做什么用的?能帮助我们做什么?我们怎么才能用到这个技能?
在上一篇文章 https://www.cnblogs.com/studyzy/p/19885426 中,我们探讨了 tapd-ai-cli 的设计理念:为什么 ...
过去我们谈 AI Coding,很容易把注意力放在模型上。哪个模型更会写代码,哪个模型更适合改工程,哪个模型在某个 Benchmark 上更强,这些当然都重要。...
在上一篇关于 AI Native 研发链路的文章里《别急着谈 AI Native 组织,先让关键链路形成闭环》,我讨论的是一个更偏工程侧的问题:当 AI 不再只...
当我们说一家公司是 AI Native,到底是在说它用了更多 AI 工具,还是说它的运行方式已经被 AI 重新组织了?
这个词之所以被反复提起,不只是因为业界又多了一个新名词,而是因为一个更实际的变化正在发生: 当模型不再只是“回答问题”,而开始真的“完成任务”,问题就不再只在模...
最近一个越来越明显的感受是,前沿 AI Coding 的讨论,正在慢慢从“Agent 会不会做”,转向“系统能不能支撑 Agent 稳定做完”。
AI 论文每天数百篇,新开源项目不断出现,各家公司持续发布工程博客与技术实践。对技术从业者来说,获取信息已经不再困难——甚至可以说,从未如此容易。
当前大模型能生成单个函数或文件,但从高级需求描述自动构建整个软件仓库仍是难题。这项Microsoft Research的工作提出用图结构(RPG)代替自然语言计...
文章结合行业趋势与实践观察,给出控制权迁移模型、自动化断点地图与能力自测视角,作为理解与讨论企业研发自动化的一种结构工具。
传统AI研究工具在处理复杂课题时,准确率通常低于40%。这一局限源于静态的检索增强生成(RAG)管道,它仅能返回与关键词匹配的片段,而无法像人类研究员一样进行多...
复合任务中AI智能体失败率超35%——该论文通过TPS-Bench首次量化这一困境。200个真实场景任务暴露核心痛点:现有基准完全忽略工具调度能力,迫使模型在效...
传统ROSbag分析方法面临三大技术瓶颈,严重制约了机器人数据的交互式分析效率。二进制格式解析困难是首要障碍,ROSbag采用紧凑的二进制编码存储传感器数据,如...