我做了什么
用 Claude Code + 百炼 CLI 搭建了一条活动 Vlog 全自动生产线:从图片直播平台(photoplus)批量爬取活动现场 13 张照片,通过 AI 智能分析筛选并按叙事结构分类,然后调用百炼 CLI 的 bl video generate --image 将关键帧生成 I2V 动态视频、bl speech synthesize 生成全程配音、bl text chat 撰写旁白文案和小红书配文,最后用 ffmpeg 合成字幕 + BGM,端到端产出一支 59 秒的完整活动 Vlog。
完整流程:
图片直播平台爬取 → AI 素材分析分类 → I2V 动态视频生成 → AI 配音 → AI 文案 → 字幕/BGM合成 → 成片
使用的工具
效果展示
最终产出
| 属性 |
值 |
| 时长 |
59 秒 |
| 分辨率 |
1920×1080 |
| 动态片段 |
3 个 I2V 生成(主舞台平移、嘉宾演讲微动、Hackathon 推进) |
| 配音 |
龙安洋·阳光大男孩(CosyVoice,1.3x 语速) |
| 字幕 |
全程中文,白字黑边 |
| BGM |
轻快电子科技感 |
3. 百炼 I2V 生成动态视频
bl video generate \ --image ./图片素材/H05A5631.JPG \ --prompt "缓慢从左到右平移镜头,展示整个活动主KV舞台背景板,灯光微微闪动" \ --download ./vlog/clips/01_stage.mp4 --timeout 300 bl video generate \ --image ./图片素材/H05A5771.jpg \ --prompt "女嘉宾手持话筒正在演讲,嘴唇微动,眼神自信,背景展板灯光柔和" \ --download ./vlog/clips/02_speaker.mp4 --timeout 300 bl video generate \ --image ./图片素材/H05A6052.jpg \ --prompt "大场景缓慢推进,数十位选手专注敲键盘编程,自然光从落地窗洒入" \ --download ./vlog/clips/03_hackathon.mp4 --timeout 300
4. AI 配音(CosyVoice)
bl speech synthesize \ --text "嗨!大家好!今天带大家来看一场超酷的AI活动——阿里云百炼AI生产力实训营!" \ --voice longanyang --rate 1.3 --out ./vlog/audio/01_opening.mp3 # 共 6 段旁白,总时长 59 秒
5. AI 生成小红书配文
bl text chat --message "帮我写一段小红书风格的Vlog配文,活动是阿里云百炼AI生产力实训营(秒搭×百炼CLI专场)..."
6. ffmpeg 最终合成(旁白 + BGM + 字幕)
ffmpeg -i video_track.mp4 -i narration.mp3 -i bgm.mp3 \ -filter_complex "[1:a]volume=1.0[narr];[2:a]volume=0.15[bgm]; [narr][bgm]amix=inputs=2:duration=shortest[aout]; [0:v]subtitles=subtitles.srt[vout]" \ -map "[vout]" -map "[aout]" -shortest output/vlog_final.mp4
踩坑记录
I2V 默认超时不够:视频生成需要 2-3 分钟,必须加 --timeout 300,否则会报 Polling timed out。
系统音色不支持 --instruction:longanyang 等预置音色用 --instruction 控制情感会报 428 错误,改用 --rate 调语速 + 文案本身的语气词来传达情绪即可。
ffmpeg 精简版无字幕功能:macOS 默认 brew install ffmpeg 没有 libass,烧字幕会失败,需要 brew install ffmpeg-full。
I2V 与静态片段帧率不一致:百炼生成的视频和 Ken Burns 片段帧率不同,拼接前必须统一 normalize 到相同分辨率和帧率,否则 concat 花屏。
我做了什么
用 Claude Code + 百炼 CLI 搭建了一条活动 Vlog 全自动生产线:从图片直播平台(photoplus)批量爬取活动现场 13 张照片,通过 AI 智能分析筛选并按叙事结构分类,然后调用百炼 CLI 的
bl video generate --image将关键帧生成 I2V 动态视频、bl speech synthesize生成全程配音、bl text chat撰写旁白文案和小红书配文,最后用 ffmpeg 合成字幕 + BGM,端到端产出一支 59 秒的完整活动 Vlog。完整流程:
图片直播平台爬取 → AI 素材分析分类 → I2V 动态视频生成 → AI 配音 → AI 文案 → 字幕/BGM合成 → 成片使用的工具
百炼 CLI
Skill 名称:
bailian-cli(bl video generate、bl speech synthesize、bl text chat)其他:Claude Code(全流程编排 + 素材智能分析)、ffmpeg(Ken Burns 特效 + 字幕烧录 + BGM 混音 + 拼接)、Node.js 爬虫(图片直播平台批量下载)
效果展示
最终产出
3. 百炼 I2V 生成动态视频
4. AI 配音(CosyVoice)
5. AI 生成小红书配文
bl text chat --message "帮我写一段小红书风格的Vlog配文,活动是阿里云百炼AI生产力实训营(秒搭×百炼CLI专场)..."6. ffmpeg 最终合成(旁白 + BGM + 字幕)
踩坑记录
I2V 默认超时不够:视频生成需要 2-3 分钟,必须加
--timeout 300,否则会报Polling timed out。系统音色不支持
--instruction:longanyang等预置音色用--instruction控制情感会报 428 错误,改用--rate调语速 + 文案本身的语气词来传达情绪即可。ffmpeg 精简版无字幕功能:macOS 默认
brew install ffmpeg没有 libass,烧字幕会失败,需要brew install ffmpeg-full。I2V 与静态片段帧率不一致:百炼生成的视频和 Ken Burns 片段帧率不同,拼接前必须统一 normalize 到相同分辨率和帧率,否则 concat 花屏。