大家好,我是苏三,又跟大家见面了。
不知道有多少小伙伴在工作中遇到过这种场景:开发AI Agent应用写到一半,调试了无数次终于调通,结果一算token消耗,钱包先扛不住了。
一个简单的任务动辄几千token,稍微复杂点就是几万,多跑几次一个开源模型的免费额度就见底了。
更让人头疼的是,市面上很多号称“免费”的API,要么是有限额(比如每天几百条、或者只给输入、输出另算),要么是只针对个人开发者有额度、企业用户另算,要么是免费的模型版本比较老、能力不足。
总之就是一句话:想白嫖一个顶流模型的稳定API调用,真的不容易。
最近我发现一个非常重磅的消息:讯飞星辰MaaS平台直接开放了两款阿里Qwen模型的免费调用权益——Qwen3.6-35B-A3B 和 Qwen3.5-35B-A3B ,输入输出统统0元/百万tokens。

我反复确认了好几遍,不是“有限试用”,不是“每天限流”,而是新老用户都可以直接领取,活动到6月底截止。
换句话说,6月30日之后这波羊毛就没了。
今天这篇文章,我会用一篇超详细的实操教程,带大家快速搞定这个福利——从注册、领取Key、配置接口,到实际的API调用演示,一步不落。
先简单科普一下这次免费开放的两个模型到底是什么水平。
Qwen3.6-35B-A3B是阿里Qwen团队在2026年4月正式开源的混合专家(MoE)模型,总参数量350亿,但实际激活参数仅30亿。
采用了256个专家网络的MoE结构,每次处理一个token时只启动8个路由专家加1个共享专家。
这是什么概念?
做一个对比大家就有感受了:

简单来说,这个模型的核心优势在于“按需分配”。
好比你的公司有各个领域的专业团队:做财务找财务部,做技术找研发部,不用每次全公司开会。
Qwen3.6也是一样,模型内部有256个“专家”,路由器根据输入内容智能选择最相关的几个专家来处理,实际运算量只相当于一个30亿参数的小模型。
这意味着什么?
你在API调用的实际推理成本极低,所以平台才能做到“免费不限量”给你调用。
那它的能力到底行不行?
根据官方披露的数据,Qwen3.6-35B-A3B在多项关键基准测试上表现亮眼:
用大白话说就是:虽然它每次推理只激活30亿参数,但在编程、智能体任务上表现出了和百亿参数稠密模型相当甚至更强的能力。
据官方披露,Qwen3.6模型原生支持多模态,能够感知和理解图像输入,并且支持非思考模式的快速响应,是目前最具通用性的开源模型之一。
另外,社区有位开发者用8年前的GTX 1060 6GB显卡搭配i3处理器和24GB内存,在llama.cpp框架下通过特定的MoE参数优化,竟然能以每秒17个token的速度跑起了Qwen3.6-35B-A3B。
这说明这个模型对端侧部署极其友好,如果你想在消费级硬件上部署,Qwen3.6也是最佳选择之一。
所以这次讯飞星辰MaaS平台的免费权益——可以直接通过API调用Qwen3.6-35B-A3B。
对想做AI应用开发但又在token成本上纠结的小伙伴来说,真的是一次难得的福利。
废话不多说,直接上干货。
下面是4步拿Key的详细流程,跟着操作5分钟就能搞定。
打开下方专属链接,进入模型广场(这是平台给我们留的专属通道,建议点击收藏、直接使用):
🔗 讯飞星辰MaaS平台专属入口:
https://maas.xfyun.cn/modelSquare?ch=MaaS-jgkol-f3D8i

注意:此入口为通用模型广场入口,活动专属通道需在确定合作后由平台方同步链接。请确保使用有效的推广链接进入,否则可能无法正确享受免费权益。
在模型广场中找到两个模型卡片:

点击进入任一模型详情页,在左侧菜单找到「API Keys」或直接点击模型卡片左下方的「API调用」按钮。
💡 经验分享: 如果你不确定用哪个,个人实测两个模型能力都很强,Qwen3.6更新、编程表现更好,但Qwen3.5也很稳定,两个都可以顺便把Key一起创建了。
如果没有登录,则会自动跳转到登录页面,你可以直接在该页面注册和登录:

目前支持三种登录方式:
在弹出的API调用窗口中,如果之前没有创建过应用,是无法选择应用的。

点击「前往创建应用」按钮,填写应用名称和描述(随便写,“test应用”就行)。

就会看到appID:

再回到刚刚API调用窗口:

在请选择要授权的应用那里,选择我们刚刚创建的应用,然后点击确认按钮。
此时,窗口上方会弹出一个小窗口,提示需要完整实名认证。

点击去认证按钮:

目前支持多种认证方式,可以根据自己的实际情况完成认证。
一会儿就能审核通过:

再回到API调用窗口,点击确认按钮,会在模型服务列表中看到刚刚创建的服务:

这个页面能看到:

把这三项信息复制下来保存好。
注意: 模型ID是一个关键信息,格式类似
xopqwen36v35b这种字符串,不是模型名称,一定要完整准确地记录下来,后面Agent配置里填错会导致调用失败。
拿到API信息后,你可以在以下场景中使用:
场景一:配置到AI编程Agent(以OpenClaw为例)
场景二:直接在代码中使用
用Java代码发送API请求即可开始调用(详见下一节示例)。
拿到 Key 和 URL 后,最直观的验证方式就是用代码直接调用一次。
下面用 Java + OkHttp 演示一个完整的调用示例,代码可以直接复制到你的 Spring Boot 或普通 Java 工程中运行。
在 pom.xml 中加入 OkHttp 和 Jackson(用于处理 JSON):
<dependency>
<groupId>com.squareup.okhttp3</groupId>
<artifactId>okhttp</artifactId>
<version>4.12.0</version>
</dependency>
<dependency>
<groupId>com.fasterxml.jackson.core</groupId>
<artifactId>jackson-databind</artifactId>
<version>2.16.1</version>
</dependency>
如果是 Gradle 项目:
implementation 'com.squareup.okhttp3:okhttp:4.12.0'
implementation 'com.fasterxml.jackson.core:jackson-databind:2.16.1'
import com.fasterxml.jackson.databind.ObjectMapper;
import com.fasterxml.jackson.databind.node.ArrayNode;
import com.fasterxml.jackson.databind.node.ObjectNode;
import okhttp3.*;
import java.io.IOException;
import java.util.concurrent.TimeUnit;
publicclass QwenMaaSDemo {
// ===== 配置参数:填入你在 MaaS 后台获取的信息 =====
privatestaticfinal String API_BASE_URL = "https://maas-api.cn-huabei-1.xf-yun.com/v2"; // 替换为你的 Base URL
privatestaticfinal String API_KEY = "你的 API Key"; // 替换为你的 API Key
privatestaticfinal String MODEL_ID = "你的 modelId"; // 替换为你的 modelId
// =================================================
privatestaticfinal OkHttpClient client = new OkHttpClient.Builder()
.connectTimeout(60, TimeUnit.SECONDS)
.readTimeout(60, TimeUnit.SECONDS)
.build();
privatestaticfinal ObjectMapper mapper = new ObjectMapper();
public static void main(String[] args) throws IOException {
// 测试1:基础问答
callQwen("用一句话介绍一下 MoE(混合专家)模型架构", "你是一个专业的AI助手");
// 测试2:代码生成任务(Qwen3.6 强项)
callQwen(
"写一个 Java 函数,实现归并排序算法,并添加详细的注释",
"你是一名资深 Java 工程师,代码风格简洁规范"
);
}
/**
* 调用讯飞星辰 MaaS 平台的 Qwen 模型 API
* @param prompt 用户输入
* @param systemPrompt 系统提示词
* @return 模型返回的内容,失败返回 null
*/
public static String callQwen(String prompt, String systemPrompt) {
// 1. 构造 OpenAI 格式的请求体(JSON)
ObjectNode root = mapper.createObjectNode();
root.put("model", MODEL_ID);
root.put("temperature", 0.7);
root.put("max_tokens", 2048);
ArrayNode messages = mapper.createArrayNode();
// system 消息
ObjectNode systemMsg = mapper.createObjectNode();
systemMsg.put("role", "system");
systemMsg.put("content", systemPrompt);
messages.add(systemMsg);
// user 消息
ObjectNode userMsg = mapper.createObjectNode();
userMsg.put("role", "user");
userMsg.put("content", prompt);
messages.add(userMsg);
root.set("messages", messages);
String jsonBody;
try {
jsonBody = mapper.writeValueAsString(root);
} catch (Exception e) {
System.err.println("❌ JSON 构造失败: " + e.getMessage());
returnnull;
}
// 2. 构造 HTTP 请求
Request request = new Request.Builder()
.url(API_BASE_URL + "/chat/completions")
.addHeader("Content-Type", "application/json")
.addHeader("Authorization", "Bearer " + API_KEY)
.post(RequestBody.create(jsonBody, MediaType.parse("application/json")))
.build();
// 3. 发送请求并处理响应
try (Response response = client.newCall(request).execute()) {
if (!response.isSuccessful()) {
System.err.println("❌ 调用失败,HTTP状态码: " + response.code());
System.err.println("响应体: " + (response.body() != null ? response.body().string() : ""));
returnnull;
}
String respBody = response.body() != null ? response.body().string() : "";
ObjectNode respJson = (ObjectNode) mapper.readTree(respBody);
// 提取回复内容
String reply = respJson.path("choices")
.path(0)
.path("message")
.path("content")
.asText();
// 提取 token 用量
int promptTokens = respJson.path("usage").path("prompt_tokens").asInt(0);
int completionTokens = respJson.path("usage").path("completion_tokens").asInt(0);
System.out.println("✅ 调用成功!");
System.out.println("📝 响应: " + reply);
System.out.println("📊 Token 统计 - 输入: " + promptTokens + ", 输出: " + completionTokens);
System.out.println("-----------------------------------");
return reply;
} catch (IOException e) {
System.err.println("❌ 网络或解析异常: " + e.getMessage());
returnnull;
}
}
}
ObjectNode 和 ArrayNode 构建符合 OpenAI Chat Completions 格式的 JSON,包含 model、messages、temperature、max_tokens 等字段。
model 字段必须填你在 MaaS 后台拿到的 modelId(类似 xopqwen36v35b),不是模型名称。Authorization: Bearer {API_KEY} 完成认证,Content-Type: application/json 告诉服务端数据格式。execute()),URL 为 {API_BASE_URL}/chat/completions,完全兼容 OpenAI 接口规范。choices[0].message.content 获得模型回答,usage 字段包含本次调用的 token 消耗量,你可以在 MaaS 后台实时核对。很多小伙伴可能会问:白嫖到了免费API,到底能用来做什么?
下面整理几个我最看好的方向:
场景一:RAG知识库问答系统
将企业文档、产品手册、技术文档等转换成向量数据后,调用Qwen模型进行语义检索和答案生成,实现私域知识库的智能问答。
免费API让开发阶段的试错成本直接归零。
场景二:AI编程助手集成
如果你在用OpenClaw、Cursor、Claude Code等AI编程工具,可以无缝切换到Qwen3.6的API,将其作为代码补全、代码审查和单元测试生成的默认模型。
对个人开发者来说,这相当于免费获得了顶级的AI编程队友。
场景三:多语言客服机器人
基于Qwen3.6的多语言支持,可以构建自动化的客服应答系统,7×24小时处理用户咨询,节省大量人力成本。
场景四:结构化数据提取
从PDF合同、邮件、报表等非结构化文本中提取关键信息,比如客户名称、合同金额、有效期等,自动格式化输出。
Qwen3.6在NL2Repo这类结构化任务上的表现极其优秀。
场景五:AI Agent开发测试
用免费API进行Agent应用的功能开发和性能测试,不需要担心因频繁调用产生的Token账单,可以更专注于Agent的逻辑优化和工具调用链路的完善。
等等。
使用场景有很多。
这一波讯飞星辰MaaS平台免费开放Qwen3.6-35B-A3B和Qwen3.5-35B-A3B权益的活动,站在开发者的角度,价值非常清晰:
Token作为AI时代的新计量单位,重要性正与日俱增。
而这次限时免费+不限量调用的福利,确实是实打实的开发者红利。
再说一遍最关键的:本次活动到2026年6月30日截止!
免费权益包括:
所以还没有领取的小伙伴,我强烈建议大家——现在就行动!先领Key、跑通一次调用、体验一下真实效果再说!
访问专属入口:
https://maas.xfyun.cn/modelSquare?ch=MaaS-jgkol-f3D8i
跟着文章步骤,跑起来吧!