两句话让 AI 做出你一直想要的小工具;东西装多了总打架,丢给 AI 排查
本文由 AI 自动整理生成,可能存在错漏,请以原文链接为准。
周四的 AI 新鲜萃 来了,我是 yanini。每天帮你挑几条有启发的 AI 新思路,争取看完都能带走点什么。
这期有两个特别能上手的思路。你一直想要但没有的那个小工具,现在两句话描述清楚就能让 AI 帮你做出来——有人前一晚做出来第二天就用上了。另外一个很实用的做法:工具、插件、扩展装多了互相打架,把清单丢给 AI,5 分钟就能帮你理清谁跟谁冲突。
灵感百宝袋
他用 AI 花 45 分钟做出了一个想了很多年的 Mac 应用——用的是他完全不会的语言。
Django 联合创始人 Simon Willison 有个困扰了他很久的问题:每次做演讲,他想把一组网页按顺序全屏展示,用左右键翻页,中途浏览器崩了也不会丢。现有工具没有一个完全满足。
演讲前一晚,他决定自己做一个。他选了 Swift——一个他从来没学过的语言,然后用 AI 一步一步把它搭了出来。整个过程 45 分钟。第二天他就用这个前一晚刚做出来的 App 完成了整场演讲。
更有意思的是他顺手加了一个远程控制功能:在手机浏览器上打开一个页面,就能遥控电脑翻页、调字号、滚动内容。
这条最值得带走的不是「AI 能写 Swift」,而是一个思维转变:你一直缺的那个小工具,现在可能两句话就能做出来。
他的起始 prompt 就两句——界面长什么样、交互怎么走。
不一定要做 Mac 应用,网页小工具、Chrome 插件,都是同一个逻辑——关键是把需求描述清楚。
https://simonwillison.net/2026/Feb/25/present/
选细分赛道、手动跑一遍流程、再让 AI 接手重复的活——他把这套打法拆成了 30 步。
创业圈博主 Greg Isenberg 把自己用 AI 从零搭 SaaS 产品的完整路径录成了一个视频,最核心的思路是三步走。
第一步,选一个极细分的赛道,不要做面向所有人的大市场——那是大公司的战场。找一个足够小、有人愿意为具体痛点付钱的人群就够了。
第二步,把这群人的工作流从头到尾手动梳理一遍,找出哪些步骤在重复消耗时间和金钱。他举的例子是屋顶装修公司:每天处理询盘、回复报价、跟进客户等等。哪些流程可以自动化、哪些必须人来判断,先搞清楚再说。
第三步,把重复机械的部分交给 AI 智能体做,涉及判断的先留给人。他反复强调这一点:AI 最擅长执行固定流程,而不是做决策,一开始混在一起只会让结果变差。
这套思路不只适用于创业。在公司里做内部工具、优化团队工作流,同样可以照着这个顺序走:先把流程梳理清楚,再决定哪部分让 AI 接手。
https://www.youtube.com/watch?v=9T1yWEq5kP0
东西装多了总打架?把清单丢给 AI,5 分钟帮你理清冲突。
一个《模拟人生 3》的玩家分享了个很聪明的做法。玩过这类游戏的人都知道,模组(Mod,就是第三方做的功能扩展包)装多了特别容易互相冲突,轻则功能失效,重则游戏直接崩。
他把手头几十个模组的清单丢给 AI,让它自动分析哪些会打架、哪些能共存,5 分钟就输出了一个不冲突的组合方案,游戏一次加载成功。
这个思路拆开看其实很通用——AI 做的就是「读规则、找矛盾、给方案」。
比如你装了好几个浏览器扩展页面越来越慢、Notion 里插件互相干扰、或者自动化流程跑着跑着某步莫名卡住,都可以用同样的方法:
把你在用的工具清单和各自的功能说明贴给 AI,问一句「这些东西之间有没有冲突或重复」,省掉自己一条条排查的时间。
https://www.reddit.com/r/ClaudeAI/comments/1rl52ln/imo_claude_code_is_the_best_auto_modding_tool
行业有什么变化
NotebookLM 新功能:把你的笔记直接变成一段动画视频。
Google 的 NotebookLM 又进了一步——现在你上传的研究资料和笔记,不仅能生成 AI 播客,还能变成一段有动态画面的「电影级」短片。不是幻灯片配旁白,是真的有动画、有分镜、有叙事节奏的视频。
背后跑的是 Gemini 3 和 Veo 3 等多个模型,系统自己决定叙事结构和视觉风格,还会自查一遍确保前后连贯。
不过目前门槛不低:需要 Google AI Ultra 订阅,每天上限 20 个视频,只支持英文。经常需要把长文档转成更直观格式的人可以留意这个方向。
Google 搜索里可以边聊边出成品了——Canvas 功能全面开放。
Google 把 Canvas 功能接进了搜索的 AI 模式。做法是在搜索框切到 AI Mode,点加号选 Canvas,描述你想做的事——右侧面板会实时生成文档、代码或者可以点击的交互原型。
和之前「搜完自己整理」的流程比,这次等于是边问边出成品,写方案、做原型、起草文档都可以一步到位。
目前还只支持英文,覆盖范围也在逐步扩大中。国内豆包已经有类似的「对话 + 文档生成」能力,逻辑差不多,感兴趣可以先试试。
https://www.theverge.com/tech/889339/google-canvas-ai-mode-search-us-launch
百万播放的「战地实况」有一大半是 AI 生成的——怎么判断真假?
最近伊朗冲突的消息疯狂传播,好些浏览量超百万的「战地纪实」视频,被核查团队逐一拆穿:
有的是九年前其他冲突的旧素材,有的直接截自军事题材电子游戏,还有一张「雷达基地被炸」的卫星图,被人发现爆炸前后的车辆位置和光照阴影一模一样。
爱范儿总结了 5 个判断思路,核心就一句话:别急着信,先看哪里不对劲。
比如拿图片去搜一下有没有更早的原图、看看画面里的影子方向和它说的时间对不对得上、建筑长得像不像那个地方的风格。
他们还测了十多款「AI 检测工具」,结论很直接:用 AI 检测 AI 目前还不靠谱,只能给个参考方向。
结合前面提到的 NotebookLM 和 Veo 3,生成逼真内容的门槛越来越低,辨别能力也得跟上。
看到冲击力强的内容,让子弹飞一会儿,等核查结果出来再转。
今天就能试的一件事
想一个你一直缺的小工具,用两句话描述清楚,让 AI 帮你做出来。
打开你常用的 AI 助手,用两到三句话描述:我需要一个什么工具,它能做什么,大概长什么样。不用说技术实现,只说你要解决的问题和使用场景。
发出去,看 AI 给你什么。产出物是一份可以运行或可以继续迭代的初版方案——哪怕第一版不完美,你也能看出这个方向走不走得通。
https://simonwillison.net/2026/Feb/25/present/
好工具速递
Glaze:输入一句话,直接生成一个能用的 Mac 小工具。
Glaze 是 Mac 启动器 Raycast 推出的新产品,做的事情很直接:你输入一句话描述想要什么,它帮你生成一个完整可运行的 macOS 小应用。记账工具、会议录音、截图转表情包,它自己搞定存储、界面规范和各种接口,你不用碰代码。
它还有个「Glaze Store」,里面是其他用户做好并分享的工具,你可以直接装,也可以拿来改成自己想要的样子。
Raycast 是 Mac 上一个快捷启动工具(类似 Spotlight 的增强版),Glaze 生成的应用会自动和它配合。免费版可以先试,付费版大约 20-30 美元/月。
Open WebUI:给本地 AI 模型配一个漂亮的网页聊天界面,告别黑框框。
Open WebUI 是一个开源的网页前端,专门配合 Ollama 使用。
Ollama 是让你在自己电脑上跑 DeepSeek、Qwen 等开源 AI 模型的工具,但它本身只有命令行界面,Open WebUI 给它补上了一个长得很像 ChatGPT 的聊天页面,在浏览器里打开就能用,支持多模型切换、对话历史、文件上传。
想在本地跑开源模型、又不想每次都对着黑框框的人,Ollama + Open WebUI 是目前最顺手的组合之一。两个都免费,GitHub 上 Open WebUI 有超过 12.5 万颗星,更新很活跃。
配置需要先装 Ollama 再装 Open WebUI,有一点门槛,不过官方文档很清楚,照着做就行。
https://github.com/open-webui/open-webui
n8n:把不同应用和 AI 连起来自动干活的工作流平台。
n8n(读作「n-eight-n」)是一个开源的自动化工具,做的事情用一句话概括就是:把不同的应用和 AI 串在一起,让它们自动协作。
比如「收到邮件 → AI 分析内容 → 自动归档 → 给你发一条消息提醒」,这类流程在 n8n 里拖拖拽拽就能搭出来。
能连的应用有 400 多种,而且流程中间可以直接插一步「让 AI 来处理」,不用自己写代码对接。适合有一点折腾精神的人,或者公司里有 IT 同事能帮忙搭一下的情况。
项目在 GitHub 上有 17 万多星,更新很勤快。怕麻烦的话直接用它的云托管版,不用自己装。
想继续了解 AI 圈里那些热门概念到底是什么、怎么用起来?我之前还写过这几篇,带你从「知道」到「会用」:
如果你有想让我追踪的 AI 工具、玩法或者话题,评论区告诉我,说不定下一期就安排上了。