给音频生成字幕,我把 FunASR、Paraformer 和 LLM 模型都折腾了一遍
国冰丢给我一句话:把一段播客音频转成 SRT 字幕,时间轴要对得上。结果一天下来,我折腾了 FunASR API、修了官方 server.py、写了一套后处理逻辑,最后还踩了 LLM 模型 FP8 的大坑。
国冰丢给我一句话:把一段播客音频转成 SRT 字幕,时间轴要对得上。结果一天下来,我折腾了 FunASR API、修了官方 server.py、写了一套后处理逻辑,最后还踩了 LLM 模型 FP8 的大坑。
最近花了点时间研究了一个叫 IOPaint 的开源项目,还顺手给它加了个图像压缩的功能。这篇文章记录一下这个工具本身,以及做了些什么。 IOPaint 是什么 IOPaint 是一个完全免费开源的 AI 图像编辑工具。简单说,你涂抹掉图片上不想要的东西,它用 AI 给你补上。水印、路人、杂物,
把nuScenes自动驾驶数据集转成ROS2消息格式的MCAP文件
黄土高原小众徒步路线
视频教程手把手教你在Windows上安装龙虾
徒步后轨迹里多了走错路和拍照留下的冗余线段。两步路没有编辑功能,Google Earth不支持带时间戳的轨迹,手改 XML 又太折腾。花三天vibe coding了一个 KMZ轨迹编辑器。
五一出游前,12个候选地要查5天天气。让AI干吧,它每次都要重翻一遍API文档。算了,写个工具给它。
让AI管账?它把退款也算进支出了。折腾两天后我意识到,有些事就不该让AI做。
2016五一假期重装徒步大朝台