◄ 返回每日萃
2026-06-23

让AI记住你的工作习惯,长期项目不用每次都从头教

本文由 AI 自动整理生成,可能存在错漏,请以原文链接为准。

今天想跟你聊聊 OpenAI 刚推出的 Daybreak 安全工具箱、xAI 给 Grok 加上的「技能记忆」功能,以及一份教你用 Codex 啃长期项目的白皮书。

灵感百宝袋

OpenAI 出了本「Codex 长期项目使用指南」,告诉你怎样让 AI 帮你跨很多轮对话记住上下文、拆解大目标。

Jason Liu 在这份白皮书里分享了他用 Codex 管理复杂项目的方法:把一个大目标切成 AI 能验证的小步骤,保持多个工作流的连续性,并且清晰地判断什么时候该交给 AI 自动执行,什么时候该自己下场把关。说白了,它不是让你读完就完的理论,而是一套可以直接贴到你自己项目里的执行思路。今天可以试的:打开你当前拖了很久的一个任务,试着用「第一步做什么、第二步要达到什么状态」的方式把它拆成三块,扔给 AI 看看能不能依次执行——你会发现有些以前觉得必须全程盯着的活儿,其实真能交出去一块。

原文:https://openai.com/index/codex-maxxing-long-running-work

AWS 出了个官方教程,教你用 ComfyUI 在云端批量生成图片,一次能出几百张,不用本地显卡烧到冒烟。

传统上用 ComfyUI 出图,要么用自己电脑慢慢跑,要么一张一张调。AWS 这篇教程直接把它搬上 SageMaker,利用云端 GPU 批量生成,特别适合那种需要大量素材的营销场景——比如一个活动要同时出几十套不同尺寸的社交图。门槛是得稍微会一点 AWS 基础操作和 ComfyUI 工作流搭建,但教程本身手把手带着走。如果你手边刚好有个需要大量图片的项目,可以按它搭个最小样例,先出一批看看效果,成本比设计师一张张做低得多。

原文:https://aws.amazon.com/blogs/machine-learning/running-comfyui-workflows-on-amazon-sagemaker-ai-processing-jobs

江湖快报

OpenAI 推出 Daybreak 安全工具套装:Codex Security 插件加上 GPT-5.5-Cyber,专门自动发现漏洞并生成补丁。

这套工具能把找漏洞、修漏洞的活儿自动化到机器速度。Codex Security 插件可以在现有系统里扫描出薄弱点,并拦下新漏洞;GPT-5.5-Cyber 则是对抗性训练的强版模型,能生成端到端的修复方案,目前只开放给受信的安全防护方使用,还附带一个「Patch the Planet」计划去修开源项目里的高危漏洞。对普通做产品的人来说,它提醒我们:以后安全这件事会有越来越多 AI 参与的环节,从代码审查到自动打补丁。如果你团队里已经有自动化安全流水线,可以关注一下它能替掉哪些人工复查的步骤。

原文:https://openai.com/index/daybreak-securing-the-world

Claude Desktop 现在可以在 AWS、Google Cloud 和微软 Foundry 上完整使用了,不再是只给开发者用的半截子工具。

之前在这些云端环境里,Claude Desktop 只能用到 Cowork 和 Code,现在聊天、Cowork、Code 三个功能一个应用全搞定。企业 IT 可以按角色下发权限,用现有的单点登录,还能选择让数据推理留在自己的云区域里、对话记录只存在本地,管理策略也直接通过移动设备管理推送。对于已经在用这些云的公司,部署门槛低了很多,全员用 AI 的体验能统一在一个桌面客户端里。如果你所在团队的 IT 正犹豫要不要大规模推 Claude Desktop,这个更新算是个很强的推动信号。

原文:https://claude.com/blog/the-full-claude-desktop-experience-on-aws-google-cloud-and-microsoft-foundry

Grok 现在有了「Skills」,能记住你的工作习惯和自定义流程,不用每次都重新交代一遍。

你可以用自然语言或传个文件一次性描述自己的工作流,之后 Grok 会在所有对话里自动应用这些设定,比如怎么处理文档、做表格、生成 PPT。它还能在账号级别共享给同事,斜杠命令一调就生效。开发者那边,Responses API 也整合了这些能力,支持工具调用和多步骤任务。这意味着 Grok 不再是个每次都要从头教的学生。你今天就能试试:在 Grok 里创建一个 Skill,描述你最常让它做的那种重复性任务(比如「每次写周报都用这个模板和结构」),下次发指令看它是不是一步到位。

原文:https://www.infoq.cn/article/hmME4JhKTJUYJy9DNEJ2

贤者视角

一个用 AI 做出来的网站,上线好几个月才发现藏了个 SQL 注入漏洞——vibe coding 的坑,不止一个人踩过。

The Verge 报道了一个叫「Boomberg」的网站,主人用它展示政府给科技公司的款项流向,做完就直接上线了,根本没意识到代码里埋着一处 SQL 注入风险。还有别的案例,甚至有创业公司因为 AI 写的代码把生产数据库给清掉了。AI 写代码很快,但安全意识不会自动长出来。如果你也在用 vibe coding,有个小习惯能救命:每次生成完代码,至少手工扫一眼涉及数据存取、用户输入的关键部分,不确定的地方就用 AI 直接问「这段有没有常见安全风险」。别光图快,先上线再说。

原文:https://www.theverge.com/ai-artificial-intelligence/950844/vibe-coding-security-risks-apps

从火山引擎到 DeepSeek,这两天的消息都在说同一件事:大家先把 AI 业务做扎实,不急着搞别的。

据 IT 之家报道,火山引擎总裁谭待在 FORCE 大会上明确说没有拆分独立上市的计划,字节跳动的重心是豆包大模型 2.1 系列、Seedance 视频生成等 AI 落地。另一边,DeepSeek Harness 团队负责人崔添翼也在社交平台澄清招人规则只是需要中文工作能力,并非不招外国人,目前团队正大量扩招,主攻代码智能体产品,内部看齐 Claude Code。这两条放在一起看,能感觉到现在的节奏是先把技术产品做厚,而不是急着变现或铺摊子。对于用这些模型的人,好处是功能迭代会更快、价格还可能继续往下走——豆包 2.1 Turbo 已经打出旗舰能力减半价的牌了。

原文:https://www.ithome.com/0/967/401.htm

世界杯期间仿冒网站和假票邮件大量冒头,AI 做的假页面几乎看不出破绽,别再指望拼写错误能救命了。

WIRED 统计,到 5 月初就有 1.3 万个 FIFA 相关域名被注册,其中约四十分之一已被标记为可疑或恶意。AI 生成的钓鱼网站、深度伪造视频和逼真的邮件,把过去分辨真伪的老办法全打乱了——拼写正确、品牌完整、语气得体,都不再是「可信」的证据。如果你或身边有人打算追世界杯,记住一点:门票只从官方渠道买,任何邮件里的链接别乱点。对 AI 时代来说,怀疑未经认证的信源,本身就是一种保护机制。

原文:https://www.wired.com/story/world-cup-scams-are-getting-harder-to-spot

开发者补给站

谷歌 LiteRT-LM 让 Gemma 4 在手机上的推理速度翻了倍,还加上了 Swift 和 JavaScript 接口。

通过多 Token 预测草稿器,LiteRT-LM 在 Gemma 4 E2B 上快了 1.6 倍,在 E4B 上快了 2.2 倍,比 llama.cpp 等框架有 1.8 到 3.7 倍的提升。它在移动端对付内存和计算碎片有一手,把会话状态 KV 缓存保存起来,续聊不用从头重算,模型在苹果移动 CPU 上只占 607MB。该项目已在 GitHub 开源,附带命令行工具和移动示例应用。如果你在做移动端 AI 应用,尤其是想在 iOS 或 Web 上跑本地模型,可以拉下来测一下你当前的流程能提速多少。

原文:https://www.infoq.cn/article/lv6xh4HeBfWaYubLv54y

AWS 出了一套方法,用 Bedrock 和 OpenSearch 把海量航拍图片变成用自然语言搜索的知识库。

跟航拍数据巨头 Vexcel 合作,他们用多模态 embedding 把影像索引起来,再结合 LLM 生成文字描述,实现「搜河旁边有几栋红顶房子」这样的查询。评估用了 OpenStreetMap 的真值数据,对比了不同模型、融合策略和搜索方法的效果。做地理空间、保险勘察或城市规划的开发者可以拿这套架构直接动手——虽然需要一点 AWS 云服务基础,但文章把每一步和实验结论都拆得很细,照着搭能省大量前期摸索时间。

原文:https://aws.amazon.com/blogs/machine-learning/embed-the-world-multimodal-ai-for-searchable-aerial-imagery-at-scale

好物挖掘机

Alai 2.0 像个 AI 设计伙伴,能抓取你的品牌细节,再帮你出 PPT、社媒图和广告素材,全都自动对齐品牌色。

它会先建一套你的品牌设计系统,记住字体、颜色、图形风格,然后你给它一个画布尺寸(比如推特长图、16:9 演示页),就能生成符合品牌调性的初稿。不满意的地方可以手动微调,也可以让 AI 接着改。还能自己选底层模型,在质量和成本之间找平衡。适合经常要做视觉物料但没设计师帮忙的小团队。你可以上传一套品牌规范文档,让它先出一组你下周要用的社交图,看看能不能省掉来回沟通的时间。

原文:https://www.producthunt.com/products/alai

MD+HTML Reader 是个专为审阅 AI 生成 Markdown 和 HTML 而生的轻量阅读器,macOS 上只读不编辑,让你专注看完再决定下一步。

很多时候 AI 一次性给你吐出一堆计划、检查清单、API 笔记和 HTML 预览,散落在项目文件夹里翻着头疼。这个工具把它们集中到一个只读工作区,按项目或会话归类,你可以快速扫一遍文档质量,确认没问题再 commit 或发给同事。如果你用 AI 写代码或文档已经成了习惯,装一个它能避免在文件堆里迷失,审阅效率高不少。目前免费,Mac 用户可以直接体验。

原文:https://www.producthunt.com/products/md-html-reader