AI 视频生成工具

项目概述

一个学习探索性质的 Demo

这是我在 2026 年 1 月刚接触 AIGC 领域时做的尝试性 Demo。当时对 AI 视频生成很好奇，想了解一下整个流程是如何运作的，于是整合了 Edge TTS（文字转语音）、Pollinations AI（AI 生图）和 MoviePy（视频处理），做了一个能跑通基本流程的原型。

文生视频

输入文字描述，生成带配音的简单视频，支持基础参数配置

AI 生图

使用 Pollinations AI 生成图片，支持多种艺术风格

智能配音

基于微软 Edge TTS，免费自然的中文发音

图生视频

上传图片添加动态效果，支持常见图片格式

历史记录

保存生成记录，方便查看和重新下载

多平台适配

支持抖音 9:16、B 站 16:9、Instagram 1:1 等比例

项目反思

为什么这个项目封存了

🔍

学习探索的产物

这是我在 AIGC 领域初期的尝试，主要目的是了解 AI 视频生成的基本流程和技术整合方式。

⚠️

实际效果有限

Demo 虽然能跑通流程，但生成的视频质量一般，与市面上成熟的 AIGC 产品相比差距明显。

💡

更好的选择

国内各大厂提供了更优秀的 AIGC 视频生成服务，如可灵、即梦、智谱等，效果更好且成本低。

📦

评估后封存

在尝试和评估后，认为这个 Demo 没有继续开发的意义，因此作为学习记录封存。

🌟 推荐使用的 AIGC 视频工具

可灵 AI 快手出品，文生视频效果出色

即梦 AI 字节旗下，创意视频生成平台

智谱清言智谱 AI，多模态生成能力

通义万相阿里达摩院，AI 绘画与视频

核心功能

六大核心功能模块

01

文生视频 🎬

输入文字描述，自动生成带配音的视频

支持多种视频比例（16:9 / 9:16 / 1:1）
三种配音声音可选（晓晓/云希/云扬）
灵活视频时长（3 秒 / 5 秒 / 10 秒）
添加 Ken Burns 缩放效果

02

AI 生图 🎨

使用 AI 生成高质量图片

Pollinations AI 完全免费
支持 6 种艺术风格
自定义图片尺寸
正负面提示词支持

03

智能配音 🎙️

使用微软 Edge TTS 进行文字转语音

完全免费，无使用限制
自然流畅的中文发音
多种声音可选
可调节语速和音调

04

图生视频 📸→🎬

上传图片，生成动态视频效果

支持 JPG、PNG、WEBP 格式
添加运动提示词
自动生成动态效果
保持图片质量

05

历史记录 📋

自动保存所有生成记录

自动保存每次生成
快速查看历史
一键重新下载
本地永久存储

06

多平台适配 📱

支持主流社交平台的视频尺寸

抖音/快手 9:16 竖屏
YouTube/B 站 16:9 横屏
Instagram/小红书 1:1 方形
一键切换比例

应用场景

四大应用场景

📱

社交媒体内容创作

适用人群：自媒体创作者、短视频博主

使用场景：抖音/快手短视频、小红书图文内容、Instagram Reels、YouTube Shorts

📚

教育培训视频

适用人群：教师、培训机构、知识博主

使用场景：在线课程制作、知识科普视频、教学演示内容

🛍️

产品营销视频

适用人群：电商卖家、品牌营销人员

使用场景：产品介绍视频、促销广告、品牌宣传

🎨

个人创作

适用人群：视频爱好者、艺术创作者

使用场景：艺术创作、实验性视频、个人表达

技术实现

Demo 技术栈

前端

HTML + CSS + JavaScript 赛博朋克风格 UI

后端

Python Flask RESTful API

TTS

Edge TTS 微软免费文字转语音

AI 生图

Pollinations AI 免费图片生成 API

视频处理

MoviePy Python 视频编辑库

学习收获

从这个 Demo 学到了什么

01

技术整合能力

学会了如何将多个 AI 服务（TTS、生图、视频处理）整合到一个应用中。

02

API 调用经验

积累了调用第三方 API、处理异步任务、管理文件存储的实战经验。

03

产品评估意识

学会了评估一个项目的价值，知道什么时候应该继续投入，什么时候应该放手。

04

对 AIGC 的理解

通过亲手实践，对 AI 生成内容的技术原理和局限性有了更深入的理解。