MMX-CLI给AI Agent装上七种感官，内容创作更方便

用户11563501

发布于 2026-06-23 13:18:30

810

大多数AI能读写思考，但让它们唱歌画画就差点意思。

MiniMax今天发布的MMX-CLI要解决正是这个问题。这个命令行工具给每个AI Agent装了七种新感官：图像生成与理解、视频创作、语音合成、音乐生成、视觉识别、搜索和对话，一站式解决内容创作所需要的所有能力。

从安装到使用

安装只需两行命令：

npx skills add MiniMax-AI/cli -y -g
npm install -g mmx-cli

配置完成后，可以开始体验各种功能。先来看看最亮眼的音乐生成：

# 带歌词生成
mmx music generate --prompt "轻快流行乐" --lyrics "[verse]啦啦啦，阳光明媚" --out song.mp3

# 自动优化歌词
mmx music generate --prompt "独立民谣，忧郁，雨夜" --lyrics-optimizer

# 纯音乐模式
mmx music generate --prompt "电影配乐" --instrumental --out bgm.mp3

实测中，生成1分钟音乐消耗约1500 Token，按标准套餐折算成本不到0.5元。

其他功能体验

视频生成采用异步模式，生成10秒动画约需3分钟：

# 异步生成，返回任务ID
mmx video generate --prompt "日落海浪" --async

# 根据任务ID下载结果
mmx video download --file-id 176844028768320 --out video.mp4

语音合成支持30+音色和语速调节：

# 选择特定音色和语速
mmx speech synthesize --text "你好" --voice English_magnetic_voiced_man --speed 1.2

# 流式播放
mmx speech synthesize --text "实时流" --stream | mpv -

比较意外的是搜索功能。当要求AI"查MiniMax最新动态"时，它真的会返回当天推文和新闻，而非训练数据里的陈旧信息。

工作流集成

这个工具的优势在于可以简单集成到现有工作流中：

# 从文件读取内容生成语音
echo "新闻快讯" | mmx speech synthesize --text-file - --out news.mp3

# JSON格式对话历史
cat messages.json | mmx text chat --messages-file - --output json

配置管理也很简单：

# 切换到中国区
mmx config set --key region --value cn

# 检查Token余额
mmx quota

小结

官方明确宣称这是"不为人类设计"的开发工具。

这个工具最聪明的设计在于：它没把AI变成瑞士军刀，而是让AI自己学会使用工具。技术细节上，MMX-CLI把复杂的多模态能力封装成了简单的命令行接口。

最后需要提醒的是，最好使用订阅制，按量付费对于这种需要抽卡反复创作的用户，使用得悠着点。

GitHub：http://github.com/MiniMax-AI/cli

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-04-11，如有侵权请联系 cloudcommunity@tencent.com 删除

视频

本文分享自 AI工程化微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度