MiniMax这家公司在国内AI圈一直比较低调,但海螺AI的视频生成能力在圈内已经有了不小的口碑。
产品形态
海螺AI是MiniMax面向C端的产品,涵盖文本对话、语音合成和视频生成。其中视频生成是最拿得出手的。
用户可以通过文字描述生成短视频,风格覆盖写实、动画、艺术等多种类型。生成质量在国产工具里处于第一梯队,一些场景下可以和Sora早期版本掰手腕。
技术底座
视频生成背后是MiniMax自研的多模态基础模型。和Sora类似,走的是扩散模型(Diffusion)+ 时序建模的路线。
MiniMax的特色在于:
- 对中文场景的理解更精准(中文提示词不需要翻成英文再生成)
- 角色一致性做得不错(同一个角色在视频中的外貌不会乱变)
- 生成速度在同类产品中偏快
视频生成赛道格局
这个领域目前还没有绝对的赢家:
- Sora(OpenAI):知名度最高,但商业化路径坎坷
- Kling(快手):国内使用量可能最大
- Runway:海外创作者用得多
- 海螺AI:在质量和体验上追赶很快
视频生成和文本生成不同,用户对”差不多”的容忍度更低。一个手指多了一截、一个物体突然消失,整个视频就废了。这对模型的物理世界理解能力和时序一致性要求极高。
MiniMax的策略是多模态并进——文本、语音、视频用统一的底层架构,不同模态之间的理解可以互相加强。这个思路在长期来看可能比单独做视频模型更有优势。
参考来源:MiniMax官方产品页、36氪报道