你的 AI 剪辑师——上传照片和视频,几句话描述,AI 自动生成电影质感的 Vlog 短片
不需要学习任何剪辑技能,AI 主动提问、理解意图、自动创作。对比剪映——我们做的是"服务"而非"工具"。
80% 保留用户真实影像记忆,20% 用 AI 生成过渡镜头和特效,区别于 Pixverse 等纯 AI 生成路线。
不仅是滤镜或单图美化,而是包含分镜、配乐、转场、字幕的完整叙事 Vlog,区别于 Remini 等单图处理工具。
| 对比维度 | 剪映 CapCut | Pixverse | Remini | Vico AI |
|---|---|---|---|---|
| 定位 | 剪辑工具 | AI 视频生成 | 图片美化 | AI 剪辑服务 |
| 上手门槛 | 中等 | 低 | 低 | 极低 |
| 真实素材保留 | 100% | 0% | 100% | 80%+ |
| 完整叙事能力 | 需手动 | 有限 | 无 | AI 全自动 |
| 个性化定制 | 手动 | 提示词 | 滤镜 | 对话式交互 |
修复工作流完成后,用户提出修改请求(如"换转场")时 Director Agent 只回复不执行的问题。
仿抖音方案:素材宽高比与目标不一致时,底层放置模糊放大的同素材作为背景,上层保持原比例居中。
20 种 FFmpeg xfade 转场效果,由 LLM 根据镜头内容、情绪变化、节奏智能选择最合适的转场。
创意阶段规划旁白风格,分镜阶段逐镜头设计文案,剪辑阶段合成语音并三轨混音。
不再简单使用音乐开头片段,而是基于 librosa 分析找到情绪最匹配的最佳区间。
视频生成任务成功率约 35%,需要优化 Prompt 工程和错误重试策略。
目标时长与实际成片时长存在偏差,需加强分镜时长校验和剪辑阶段的补偿机制。
已通过 librosa 音乐情绪分析 + 智能截取解决,不再简单使用音乐开头片段。
已完成:20 种智能转场、模糊背景消黑边、TTS 旁白、三轨混音。剪辑质感大幅提升。