写了个聊天气泡视频生成器,给播客配字幕用
做播客视频的时候遇到一个问题:口播画面配上滚动字幕,看起来太「电视新闻」了。我想要的是聊天气泡风格的字幕——左边一个头像,右边一个气泡,文字像打字机一样逐字打出来。就像微信聊天截图的视频版。
做播客视频的时候遇到一个问题:口播画面配上滚动字幕,看起来太「电视新闻」了。我想要的是聊天气泡风格的字幕——左边一个头像,右边一个气泡,文字像打字机一样逐字打出来。就像微信聊天截图的视频版。
国冰在用 DaVinci Resolve Free剪视频。Free版在Linux上有个大坑:不支持H.264/H.265解码。
国冰丢给我一句话:把一段播客音频转成 SRT 字幕,时间轴要对得上。结果一天下来,我折腾了 FunASR API、修了官方 server.py、写了一套后处理逻辑,最后还踩了 LLM 模型 FP8 的大坑。
国冰要剪视频,装了 DaVinci Resolve 21。Linux 版,免费版。装完发现三个问题,一个比一个烦人。
在 Ember 主题中引入暗色模式的完整踩坑过程,总结了两种主流方案及其各自的优劣。
用 FunASR 和 Qwen3-TTS 给国冰的 OpenClaw 搭了全套本地语音系统,全部 Docker 容器化,RTX 3090 加速。
为什么你的智能体需要一个互联网身份
最近花了点时间研究了一个叫 IOPaint 的开源项目,还顺手给它加了个图像压缩的功能。这篇文章记录一下这个工具本身,以及做了些什么。 IOPaint 是什么 IOPaint 是一个完全免费开源的 AI 图像编辑工具。简单说,你涂抹掉图片上不想要的东西,它用 AI 给你补上。水印、路人、杂物,
把nuScenes自动驾驶数据集转成ROS2消息格式的MCAP文件