用聊天的方式让AI做视频和幻灯片,今天来了几个新帮手
本文由 AI 自动整理生成,可能存在错漏,请以原文链接为准。
今天想跟你分享几件挺有意思的事:想不想试试用聊天的方式,让 AI 把一段视频剪好?谷歌放出了 Gemini Omni 的实操演示,真的能这么干。另外Slack里可以直接「雇」个AI同事帮你做报表,写邮件时还能让AI模仿你的语气。
灵感百宝袋
用说话的方式剪视频?谷歌演示的 Gemini Omni 做到了,角色不会崩,场景记得住。
谷歌在官方博客里放了九个视频,展示他们新模型 Gemini Omni 用自然语言生成和编辑视频的能力。你给它图片、音频、视频和文字,它能生成高质量视频,而且通过对话就能修改——比如让它把背景换成海边,镜头拉近,角色服装变一下,它都能保持角色一致、物理效果自然。这跟以前那种一句话生成视频但细节失控的感觉完全不一样。虽然目前还在演示阶段,但你可以先去看看这些视频,感受一下「动嘴就能剪片子」是什么样的体验。等你下次拍了一段素材,不妨试试用文字描述想要的效果,也许以后就是你的新工作流。
原文:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-3-5-videos
把内部数据安全地分享给同事,用一条命令搞定——Simon Willison 做了一个实验。
Simon Willison 最近做了一个实验性插件,让你在自己电脑上跑一个数据查看工具 Datasette,然后通过 Tailscale 加密隧道把链接分享给同事,不用上传到任何云端、也不用搭服务器。原理很简单:一条命令启动,就能自动生成一个只能在你们内部网络里访问的私密网页,对方直接看到表格里的实时数据。你如果有 Excel 或数据库想给团队成员自取,又不想搞复杂的权限管理,可以试试这个思路:装个 Tailscale,把本地 web 服务挂上去,比发文件高效也安全得多。拿手头一个数据文件跑一下命令,看看是不是比你现在的方式省事。
原文:https://simonwillison.net/2026/Jun/16/datasette-tailscale
江湖快报
本地就能跑的 AI 智能体来了,开源、不吃网,自己操控电脑做任务。
Hugging Face 上线了一个叫 Holo3.1 的项目,它是一个可以在你自己电脑上运行、不需要联网的 AI 智能体,能模拟人操作软件。说白了,就是以后你给 AI 下任务,它直接在本地打开浏览器、点击、填表,数据不出你的机器。目前是早期版本,对硬件有一定要求,但感兴趣的可以上 Hugging Face 拉下来试试。
原文:https://huggingface.co/blog/Hcompany/holo31
贤者视角
人形机器人跌到比 iPhone 还便宜了,但专家说先别盯着人形,能赚钱的往往是长得不像人的。
最近人形机器人价格一路雪崩,松延动力的 Bumi 只要 9998 元,供应链国产化率超过 90%,2025 年全球出货中九成来自中国。但 Gartner 副总裁高挺提醒:别光盯着人形。仓库里膝盖向后弯的搬运机器人、单腿加平衡轮的物流机器人,干起活来更稳定、成本更低。真正能让你公司看到回报的,是那些任务边界清晰、环境固定的场景。如果你还在观望机器人投资,不妨先拿工厂仓库里的重复流程做试点,不用等一个完美的人形管家。
原文:https://www.infoq.cn/article/9jUgTpozqbBvjIBXiVXD
谷歌把 AI 的重心转向「动手干活的智能体」,下一步不光聊天,更是替你办事。
在五月份的 I/O 大会上,谷歌 CEO Sundar Pichai 宣布进入「智能体 Gemini 时代」,核心意思是让 AI 不仅能回答,还能在后台帮你执行复杂任务——比如帮你写代码、定行程、管理数据。这其实呼应了现在各种 AI 助手的趋势,从被动问答走向主动代办。如果你做产品或者运营,可以开始设想有哪些重复流程可以交给智能体去跑,越早梳理,越可能先享受到释放人力的好处。
原文:https://blog.google/innovation-and-ai/sundar-pichai-io-2026
开发者补给站
你的 AI 编程助手话太多?这个原始人风格插件让输出省掉 75% 的 token,代码一样好。
caveman 是给 Claude Code 等 AI 编程工具用的技能,它让 AI 用极其精简的短句说话,比如把「这个组件重新渲染是因为每次渲染都创建了新对象引用」压缩成「新对象 ref 每次渲染 = 新 ref = 重渲染,用 useMemo」,技术细节一点不少,token 用量却直降 65%~75%,速度也快三倍。支持多种压缩级别,甚至可以切成文言文,更省。你如果日常用 Claude Code 或 Cursor,装上后下次修复 bug 试试,能感觉到对话速度明显变快,而且省下的 API 费用月底算账会感谢你。
原文:https://github.com/JuliusBrussee/caveman
一个轻量 Web 组件:网页动图别直接加载,让用户点了再播,省流量还提升体验。
Simon Willison 做了个名为「— a still that plays」的渐进增强 Web 组件,把你网页里的 GIF 换成一张静态图,加上播放按钮,用户点击后才加载真正的动图。特别适合博客、文档里放教程动画,避免页面打开时被几十兆的 GIF 拖慢。如果你维护一个文档站或个人博客,想在文章里嵌入动图又不影响加载速度,把这个组件引入进去,两行代码就搞定。
原文:https://simonwillison.net/2026/Jun/17/click-to-play-component
OpenAI 官方 Python 库更新到 v2.42.0,如果你在用,更新一下保持兼容。
没什么大功能发布,就是常规的修复兼容性。鉴于 OpenAI API 迭代快,建议把项目中 openai 库升级到最新版,免得突然碰见废弃接口。
原文:https://github.com/openai/openai-python
好物挖掘机
邮件太多回不过来?Fluxmail 自动帮你排优先级、起草回复,还能模仿你的语气。
Fluxmail 是一个 AI 邮箱助手,特别适合创始人、业务负责人等每天被邮件淹没的人。它能自动筛选紧急邮件,并按照你的口吻写好回复草稿,你扫一眼就能发。目前提供年度半价优惠,可以先试试免费版,看它理不理解你的日常工作语境。
原文:https://www.producthunt.com/products/fluxmail
不想让 AI 回复得像个机器人?Henji 学你的语气和 emoji 习惯,在 Slack 里帮你回消息。
很多 AI 写出来的文字一看就不是本人, Henji 反其道而行,你只负责想法的关键词,它负责把你的半截句子变成完整的回复,而且越用越像你——它学你的用词节奏、标点习惯甚至频率最高的 emoji。现在从 Slack 开始支持,适合团队沟通频繁的人,装上后下次在频道里回个「收到」也能有自己的味道。
原文:https://www.producthunt.com/products/henji
在 Slack 里直接「雇」个 AI 同事,让他自己拉数据做报表、建仪表盘。
Wilson 是一个直接住在你 Slack 里的 AI 同事,你可以在某个线程里@他,让他去连 Stripe、HubSpot、GitHub 等工具拉真实数据,然后生成报告、表格甚至内部工具,成果直接丢回聊天里。他行动前会跟你确认,不会擅自乱动,也不拿你的数据去训练。如果你团队每天在 Slack 上来回转数据,不妨试试 Wilson 能不能省下几轮来回传文件。
原文:https://www.producthunt.com/products/wilson-3
做动画幻灯片不再折磨人:告诉 AI 你要什么,PaneFlow 帮你设计好,还能导出视频。
PaneFlow 新出的 MCP 服务器让 Claude、Cursor 这类 AI 直接帮你生成品牌统一、带动画的幻灯片,不只给出文字,而是真正的可编辑项目文件,可以导出代码、视频或 PDF。内置 50 套模板,再也不用手动对齐动画时间线。如果你经常需要做产品演示或汇报,下载它的 MCP 服务器,下次在制定大纲时就交给 AI 去生成初稿,你只需做微调。