MiniMax海螺AI:视频生成领域杀出来的国产黑马

 · 

MiniMax这家公司在国内AI圈一直比较低调,但海螺AI的视频生成能力在圈内已经有了不小的口碑。

产品形态

海螺AI是MiniMax面向C端的产品,涵盖文本对话、语音合成和视频生成。其中视频生成是最拿得出手的。

用户可以通过文字描述生成短视频,风格覆盖写实、动画、艺术等多种类型。生成质量在国产工具里处于第一梯队,一些场景下可以和Sora早期版本掰手腕。

技术底座

视频生成背后是MiniMax自研的多模态基础模型。和Sora类似,走的是扩散模型(Diffusion)+ 时序建模的路线。

MiniMax的特色在于:

  • 对中文场景的理解更精准(中文提示词不需要翻成英文再生成)
  • 角色一致性做得不错(同一个角色在视频中的外貌不会乱变)
  • 生成速度在同类产品中偏快

视频生成赛道格局

这个领域目前还没有绝对的赢家:

  • Sora(OpenAI):知名度最高,但商业化路径坎坷
  • Kling(快手):国内使用量可能最大
  • Runway:海外创作者用得多
  • 海螺AI:在质量和体验上追赶很快

视频生成和文本生成不同,用户对”差不多”的容忍度更低。一个手指多了一截、一个物体突然消失,整个视频就废了。这对模型的物理世界理解能力时序一致性要求极高。

MiniMax的策略是多模态并进——文本、语音、视频用统一的底层架构,不同模态之间的理解可以互相加强。这个思路在长期来看可能比单独做视频模型更有优势。

参考来源:MiniMax官方产品页、36氪报道