GPT-5.3 Instant 发布,回答终于不绕弯了;一条规则让 AI 不再犯同样的错
本文由 AI 自动整理生成,可能存在错漏,请以原文链接为准。
大家好,我是 yanini。关于 AI 的资讯每天都很多,但看完经常觉得——看了一堆,真正有启发的没几个。
所以我做了「AI 新鲜萃」这个栏目,每天从国内外的官方博客、开发者社区里,帮你萃取几条真正值得关注的。重点不是又出了什么新东西,而是这个东西跟我有什么关系、我能怎么用。
希望你能在这里补齐信息差,每天带走一个思路或一个可以试的小动作。
这期有个特别值得抄的思路:AI 老犯同一个错,与其反复纠正,不如加一条规则让它自己修自己。另外,GPT-5.3 Instant 发布了,回答终于不绕弯、不说教了,打开 ChatGPT 就能感受到变化。
灵感百宝袋
AI 老犯同一个错?别每次纠正它,教它自己修。
Notion 的产品设计师 Brian Lovin 分享了一件听起来有点离谱的事:他三个月没有自己写过任何一行前端代码,设计原型全靠 Claude Code 生成。
他搭了一个团队共享的「原型沙盒」——一个连接了真实 AI 模型的开发环境,任何设计师把 Figma 稿丢进去,就能转成浏览器里可以点、可以交互的真实页面,而不是停在静态图上。
最让人眼前一亮的是他的一条工作原则,当 Claude 要求你手动做某件事,就把那件事本身教给 Claude 去做。
他举的例子是,Claude 老是搞错图标名称,他没有去一遍遍纠正,而是让 Claude 写了一段脚本,自动在几千个文件里搜索正确的图标名,从此这个问题就消失了。
这个做法有个更通用的名字叫 Skill。
把踩过的坑、摸索出的经验写成一份 AI 能读懂的指令文档,下次同类任务直接调用,不用重新教。Claude Code、Cursor、Kimi Code 都已经支持,感兴趣可以搜「AI Skill」了解。
就算你平时只用豆包或 Kimi 聊天,也可以试试类似的思路——
比如在豆包里说一句「请记住:以后 XX 任务按这个规则来」,它会帮你存下来,后续对话自动带上。
总的来说,与其每次口头纠正 AI,不如花一次时间把正确做法写成一条规则,之后它自己就会照着做。
https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-notions
AI 做的 PPT 都长一个样?把每页标题换成结论句,质感立刻不同。
职场博主 Jeff Su 在视频里拆解了一件很多人忽略的事:AI 生成 PPT 初稿只需要 30 秒,但大多数人拿到初稿之后就停了,结果做出来的都长一个样。
他展示的做法是在生成初稿之后加几个关键动作:让 AI 把每一页的核心结论用一句话写进标题,而不是用「介绍」「背景」这类没有信息量的标题。
然后针对最重要的两三页,单独追问 AI:这页的受众是谁?他们最在乎哪一个数字?——让 AI 帮你从读者视角重新审视内容。
AI 擅长快速出初稿,但拉开差距的是你拿到初稿之后的追问。
视频里他用的是 Gamma(gamma.app,免费),用 ChatGPT、Kimi 也是同样的思路。
https://www.youtube.com/watch?v=ZpXN9M0WLQ4
卡住了别硬想,先让 AI 试一下——图灵奖得主高德纳就是这么破局的。
计算机科学领域最高荣誉图灵奖的得主、《计算机程序设计艺术》的作者高德纳(Donald Knuth),最近公开表示:他研究了好几个星期没攻克的数学难题,Claude Opus 4.6 解出来了。
他原话说「很震惊」,要重新审视自己对「生成式 AI」的看法了。
这条的价值不在「AI 打败了数学家」——而是给了一个很实际的行动判断:当你手头有个想了很久没进展的东西,不管是策划方案、技术架构还是研究课题,花两分钟丢给 AI 试试。最坏结果是没用,最好结果是省你几周。连高德纳都觉得值得一试,你也可以。
https://simonwillison.net/2026/Mar/3/donald-knuth
行业有什么变化
GPT-5.3 Instant 上线:ChatGPT 终于减少废话和说教了。
OpenAI 更新了 ChatGPT 的默认模型,GPT-5.3 Instant 现在是你打开 ChatGPT 就在用的版本。
这次更新的重点不是「更聪明」,而是减少那种让人烦躁的体验——比如你问一个很正常的问题,它先给你来一段「这是个复杂的话题……」,或者动不动就拒绝回答。
5.3 版本大幅削减了这类不必要的拒绝和说教式开场,回答更直接、语气更像正常人说话。
另外网页搜索的结果也更准了,不会再把不相关的链接塞进来。
如果你最近觉得 ChatGPT 说话啰嗦,现在可以重新试试。
https://openai.com/index/gpt-5-3-instant
Google 发了 Gemini 3.1 Flash-Lite:比旗舰版便宜 8 倍,还支持「思考深度」调节。
Google DeepMind 发布了 Gemini 3.1 Flash-Lite,定位是高性价比的批量任务模型。价格是每百万输入 token 0.25 美元,比 Gemini 3.1 Pro 便宜 8 倍。
有意思的是它支持四个「思考深度」等级——从最浅的「极简」到最深的「深度」——你可以根据任务复杂程度来选让模型想多深,简单任务用浅思考省钱,复杂任务拉高一档。
博主 Simon Willison 测试了四个等级分别生成同一个场景描述,发现 high 档的输出质量明显比 minimal 好,但时间也长一倍多。
如果你在用 Gemini API 做批量处理(比如写描述、打标签、分类),Flash-Lite 是个值得切换测试的选项。
https://deepmind.google/blog/gemini-3-1-flash-lite-built-for-intelligence-at-scale
Claude 宕机近 10 小时:AWS 阿联酋机房被「不明物体」击中引发火灾。
前天晚上,Claude 出现了大规模宕机,持续将近 10 个小时,波及网页端、开发者工具、Claude Code,多个模型接连报错。
原因出在亚马逊 AWS 在阿联酋的一个数据中心——路透社报道,机房被「不明物体」击中后起火断电,AWS 紧急拉闸。Claude 极度依赖 AWS 算力,这波冲击直接传导过来。
经历过这次的人应该有感觉:手边多备一个 AI 工具还是有必要的,不管是豆包、Kimi 还是 ChatGPT,关键时候能顶上。
https://www.36kr.com/p/3706654372901255
苹果发布 M5 Pro/Max 芯片和新款 MacBook Pro,AI 图像处理是上代 4 倍。
苹果今天推出了搭载 M5 Pro 和 M5 Max 芯片的 MacBook Pro,以及两款新显示器。AI 性能是这次的核心卖点:M5 Max 在图像生成、大语言模型提示词处理等任务上,速度是 M4 Max 的 4 倍。
苹果还特别提到,这次「从芯片到软件都是为 AI 精心构建的」,官网演示了在本地直接跑大语言模型和图像生成的场景。
价格方面:14 英寸 M5 Pro 版起售 17999 元,16 英寸 M5 Max 顶配最高约 5.8 万元,比上代同规格涨了 2300 元左右。MacBook Air M5 版反而降了 1000 元,8499 元起。
如果你有换机计划、或者在考虑在本地跑大语言模型,这次是一个明确的选择参考节点。还没到换机周期的先跳过,日常用 AI 工具不受影响。
https://www.36kr.com/p/3707756341801349
阿里开源 Qwen3.5 四款小模型,从 0.8B 到 9B,马斯克评论「惊人」。
阿里巴巴昨天开源了 Qwen3.5 系列:0.8B、2B、4B、9B 四个尺寸,采用原生多模态训练,覆盖从资源极度受限到轻量级高性能的不同场景。
发布后,马斯克在 X 上点赞并评论:「惊人的智能水平」。
这对想在本地设备上跑 AI 模型的人是个好消息——0.8B 的模型可以在很普通的硬件上跑起来,9B 的模型在普通 MacBook 上也能流畅运行。等 Ollama 支持后可以一行命令下载试用。
https://www.36kr.com/p/3707876236931461
今天就能试的一件事
打开 Gamma,让 AI 生成一份你下周要用的 PPT 初稿,然后把每一页标题改成「结论句」。
打开 Gamma(gamma.app,免费注册),发一句话描述你要做的 PPT 主题,让它生成初稿。
拿到初稿之后,别急着美化,先做这一步:把每一页的标题从「背景介绍」「数据分析」这类名词改成结论句,比如「这个季度用户留存下降了 12%,原因在这里」。
原因很简单——听 PPT 的人翻到每一页,前几秒只会看标题。标题写「背景介绍」,对方得读完整页才知道你想说什么;换成结论句,对方扫一眼就抓住重点了。光这一步,PPT 的说服力就不一样。
https://www.youtube.com/watch?v=ZpXN9M0WLQ4
好工具速递
Maestro:帮教育者做出真正因人而异教案的 AI 教学助手。
Maestro 是一个专门面向老师和教育工作者的 AI 工具,核心功能是「适应性教学规划」——你告诉它你的学生情况和教学目标,它帮你生成能根据不同学生水平调整的教案和练习题。
和普通的「让 AI 出题」不一样的地方在于,Maestro 会持续追踪学生反馈,动态调整后续内容的难度和侧重点,而不是每次都从头重新描述一遍学生情况。
对经常需要备课、设计作业的老师、培训师来说,这个工具解决的是「我怎么做到每个学生都照顾到」的问题。直接注册试一下,把下周要讲的一个知识点丢进去,看它生成的差异化材料和你自己备的课有什么不同。
Readout:macOS 桌面工具,实时看你所有 Claude Code 实例的状态。
Readout 是一个轻量的原生 macOS 应用,专门给同时跑多个 Claude Code 实例的人用的。它会实时显示每个实例当前在执行哪个步骤、token 消耗情况、有没有卡住在等待确认。
如果你同时开了好几个 Claude Code 在跑不同任务,有了 Readout 就不用在终端窗口之间来回切换确认进度了,一个小窗口全看到。
对开发者和开始用 Claude Code 做自动化的人来说,这个工具省的是时间和注意力。免费体验,Mac 直接下载安装。
想继续了解 AI 圈里那些热门概念到底是什么、怎么用起来?我之前还写过这几篇,带你从「知道」到「会用」:
如果你有想让我追踪的 AI 工具、玩法或者话题,评论区告诉我,说不定下一期就安排上了。