
大多数AI能读写思考,但让它们唱歌画画就差点意思。
MiniMax今天发布的MMX-CLI要解决正是这个问题。这个命令行工具给每个AI Agent装了七种新感官:图像生成与理解、视频创作、语音合成、音乐生成、视觉识别、搜索和对话,一站式解决内容创作所需要的所有能力。

安装只需两行命令:
npx skills add MiniMax-AI/cli -y -g
npm install -g mmx-cli配置完成后,可以开始体验各种功能。先来看看最亮眼的音乐生成:
# 带歌词生成
mmx music generate --prompt "轻快流行乐" --lyrics "[verse]啦啦啦,阳光明媚" --out song.mp3
# 自动优化歌词
mmx music generate --prompt "独立民谣,忧郁,雨夜" --lyrics-optimizer
# 纯音乐模式
mmx music generate --prompt "电影配乐" --instrumental --out bgm.mp3实测中,生成1分钟音乐消耗约1500 Token,按标准套餐折算成本不到0.5元。
视频生成采用异步模式,生成10秒动画约需3分钟:
# 异步生成,返回任务ID
mmx video generate --prompt "日落海浪" --async
# 根据任务ID下载结果
mmx video download --file-id 176844028768320 --out video.mp4语音合成支持30+音色和语速调节:
# 选择特定音色和语速
mmx speech synthesize --text "你好" --voice English_magnetic_voiced_man --speed 1.2
# 流式播放
mmx speech synthesize --text "实时流" --stream | mpv -比较意外的是搜索功能。当要求AI"查MiniMax最新动态"时,它真的会返回当天推文和新闻,而非训练数据里的陈旧信息。
这个工具的优势在于可以简单集成到现有工作流中:
# 从文件读取内容生成语音
echo "新闻快讯" | mmx speech synthesize --text-file - --out news.mp3
# JSON格式对话历史
cat messages.json | mmx text chat --messages-file - --output json配置管理也很简单:
# 切换到中国区
mmx config set --key region --value cn
# 检查Token余额
mmx quota小结
官方明确宣称这是"不为人类设计"的开发工具。
这个工具最聪明的设计在于:它没把AI变成瑞士军刀,而是让AI自己学会使用工具。技术细节上,MMX-CLI把复杂的多模态能力封装成了简单的命令行接口。
最后需要提醒的是,最好使用订阅制,按量付费对于这种需要抽卡反复创作的用户,使用得悠着点。
GitHub:http://github.com/MiniMax-AI/cli