零成本调用Qwen3.6无限Token，保姆级教程

苏三说技术

发布于 2026-06-09 19:29:31

230

文章被收录于专栏：苏三说技术苏三说技术

大家好，我是苏三，又跟大家见面了。

前言

不知道有多少小伙伴在工作中遇到过这种场景：开发AI Agent应用写到一半，调试了无数次终于调通，结果一算token消耗，钱包先扛不住了。

一个简单的任务动辄几千token，稍微复杂点就是几万，多跑几次一个开源模型的免费额度就见底了。

更让人头疼的是，市面上很多号称“免费”的API，要么是有限额（比如每天几百条、或者只给输入、输出另算），要么是只针对个人开发者有额度、企业用户另算，要么是免费的模型版本比较老、能力不足。

总之就是一句话：想白嫖一个顶流模型的稳定API调用，真的不容易。

最近我发现一个非常重磅的消息：讯飞星辰MaaS平台直接开放了两款阿里Qwen模型的免费调用权益——Qwen3.6-35B-A3B 和 Qwen3.5-35B-A3B ，输入输出统统0元/百万tokens。

我反复确认了好几遍，不是“有限试用”，不是“每天限流”，而是新老用户都可以直接领取，活动到6月底截止。

换句话说，6月30日之后这波羊毛就没了。

今天这篇文章，我会用一篇超详细的实操教程，带大家快速搞定这个福利——从注册、领取Key、配置接口，到实际的API调用演示，一步不落。

一、聊聊Qwen3.6-35B有多能打

先简单科普一下这次免费开放的两个模型到底是什么水平。

Qwen3.6-35B-A3B是阿里Qwen团队在2026年4月正式开源的混合专家（MoE）模型，总参数量350亿，但实际激活参数仅30亿。

采用了256个专家网络的MoE结构，每次处理一个token时只启动8个路由专家加1个共享专家。

这是什么概念？

做一个对比大家就有感受了：

简单来说，这个模型的核心优势在于“按需分配”。

好比你的公司有各个领域的专业团队：做财务找财务部，做技术找研发部，不用每次全公司开会。

Qwen3.6也是一样，模型内部有256个“专家”，路由器根据输入内容智能选择最相关的几个专家来处理，实际运算量只相当于一个30亿参数的小模型。

这意味着什么？

你在API调用的实际推理成本极低，所以平台才能做到“免费不限量”给你调用。

那它的能力到底行不行？

根据官方披露的数据，Qwen3.6-35B-A3B在多项关键基准测试上表现亮眼：

在Terminal-Bench 2.0终端编程任务中，Qwen3.6拿到51.5分，超过了Qwen3.5-27B的41.6和Gemma4-31B的42.9；
在SWE-bench Verified智能体编程基准上，Qwen3.6得到73.4分，显著超越前代Qwen3.5-35B-A3B的70.0分，甚至超过了350亿参数的稠密模型Qwen3.5-27B；
在NL2Repo端到端代码仓库生成任务上，Qwen3.6的29.4分远超Qwen3.5-35B-A3B的20.5分。

用大白话说就是：虽然它每次推理只激活30亿参数，但在编程、智能体任务上表现出了和百亿参数稠密模型相当甚至更强的能力。

据官方披露，Qwen3.6模型原生支持多模态，能够感知和理解图像输入，并且支持非思考模式的快速响应，是目前最具通用性的开源模型之一。

另外，社区有位开发者用8年前的GTX 1060 6GB显卡搭配i3处理器和24GB内存，在llama.cpp框架下通过特定的MoE参数优化，竟然能以每秒17个token的速度跑起了Qwen3.6-35B-A3B。

这说明这个模型对端侧部署极其友好，如果你想在消费级硬件上部署，Qwen3.6也是最佳选择之一。

所以这次讯飞星辰MaaS平台的免费权益——可以直接通过API调用Qwen3.6-35B-A3B。

对想做AI应用开发但又在token成本上纠结的小伙伴来说，真的是一次难得的福利。

二、手把手领福利

废话不多说，直接上干货。

下面是4步拿Key的详细流程，跟着操作5分钟就能搞定。

第一步：进入讯飞星辰MaaS平台

打开下方专属链接，进入模型广场（这是平台给我们留的专属通道，建议点击收藏、直接使用）：

🔗 讯飞星辰MaaS平台专属入口：

https://maas.xfyun.cn/modelSquare?ch=MaaS-jgkol-f3D8i

注意：此入口为通用模型广场入口，活动专属通道需在确定合作后由平台方同步链接。请确保使用有效的推广链接进入，否则可能无法正确享受免费权益。

第二步：找免费模型，点击「API调用」

在模型广场中找到两个模型卡片：

Qwen3.6-35B-A3B（阿里通义千问最新MoE模型）
Qwen3.5-35B-A3B（前一代MoE模型，同样免费）

点击进入任一模型详情页，在左侧菜单找到「API Keys」或直接点击模型卡片左下方的「API调用」按钮。

💡 经验分享： 如果你不确定用哪个，个人实测两个模型能力都很强，Qwen3.6更新、编程表现更好，但Qwen3.5也很稳定，两个都可以顺便把Key一起创建了。

如果没有登录，则会自动跳转到登录页面，你可以直接在该页面注册和登录：

目前支持三种登录方式：

微信
手机号
账号

第三步：创建应用，获取API信息

在弹出的API调用窗口中，如果之前没有创建过应用，是无法选择应用的。

点击「前往创建应用」按钮，填写应用名称和描述（随便写，“test应用”就行）。

就会看到appID：

再回到刚刚API调用窗口：

在请选择要授权的应用那里，选择我们刚刚创建的应用，然后点击确认按钮。

此时，窗口上方会弹出一个小窗口，提示需要完整实名认证。

点击去认证按钮：

目前支持多种认证方式，可以根据自己的实际情况完成认证。

一会儿就能审核通过：

再回到API调用窗口，点击确认按钮，会在模型服务列表中看到刚刚创建的服务：

这个页面能看到：

API Base URL（接口地址，OpenAI格式兼容）
API Key（调用凭证）
modelId（模型唯一标识）

把这三项信息复制下来保存好。

注意： 模型ID是一个关键信息，格式类似 xopqwen36v35b 这种字符串，不是模型名称，一定要完整准确地记录下来，后面Agent配置里填错会导致调用失败。

第四步：在Agent/代码中配置API

拿到API信息后，你可以在以下场景中使用：

场景一：配置到AI编程Agent（以OpenClaw为例）

打开OpenClaw的设置页面，找到「自定义大模型」或「添加自定义服务商」
API协议类型选择 OpenAI格式（讯飞星辰完美兼容OpenAI接口）
API Key填入上一步复制的Key
Base URL填入API调用地址
模型名称（model）填入刚才记下的modelId
点击测试连接，显示成功后即可使用

场景二：直接在代码中使用

用Java代码发送API请求即可开始调用（详见下一节示例）。

三、跑通完整API

拿到 Key 和 URL 后，最直观的验证方式就是用代码直接调用一次。

下面用 Java + OkHttp 演示一个完整的调用示例，代码可以直接复制到你的 Spring Boot 或普通 Java 工程中运行。

准备工作：添加 Maven 依赖

在 pom.xml 中加入 OkHttp 和 Jackson（用于处理 JSON）：

<dependency>
    <groupId>com.squareup.okhttp3</groupId>
    <artifactId>okhttp</artifactId>
    <version>4.12.0</version>
</dependency>
<dependency>
    <groupId>com.fasterxml.jackson.core</groupId>
    <artifactId>jackson-databind</artifactId>
    <version>2.16.1</version>
</dependency>

如果是 Gradle 项目：

implementation 'com.squareup.okhttp3:okhttp:4.12.0'
implementation 'com.fasterxml.jackson.core:jackson-databind:2.16.1'

完整调用示例代码

import com.fasterxml.jackson.databind.ObjectMapper;
import com.fasterxml.jackson.databind.node.ArrayNode;
import com.fasterxml.jackson.databind.node.ObjectNode;
import okhttp3.*;

import java.io.IOException;
import java.util.concurrent.TimeUnit;

publicclass QwenMaaSDemo {

    // ===== 配置参数：填入你在 MaaS 后台获取的信息 =====
    privatestaticfinal String API_BASE_URL = "https://maas-api.cn-huabei-1.xf-yun.com/v2";  // 替换为你的 Base URL
    privatestaticfinal String API_KEY = "你的 API Key";                                      // 替换为你的 API Key
    privatestaticfinal String MODEL_ID = "你的 modelId";                                     // 替换为你的 modelId
    // =================================================

    privatestaticfinal OkHttpClient client = new OkHttpClient.Builder()
            .connectTimeout(60, TimeUnit.SECONDS)
            .readTimeout(60, TimeUnit.SECONDS)
            .build();
    privatestaticfinal ObjectMapper mapper = new ObjectMapper();

    public static void main(String[] args) throws IOException {
        // 测试1：基础问答
        callQwen("用一句话介绍一下 MoE（混合专家）模型架构", "你是一个专业的AI助手");

        // 测试2：代码生成任务（Qwen3.6 强项）
        callQwen(
            "写一个 Java 函数，实现归并排序算法，并添加详细的注释",
            "你是一名资深 Java 工程师，代码风格简洁规范"
        );
    }

    /**
     * 调用讯飞星辰 MaaS 平台的 Qwen 模型 API
     * @param prompt 用户输入
     * @param systemPrompt 系统提示词
     * @return 模型返回的内容，失败返回 null
     */
    public static String callQwen(String prompt, String systemPrompt) {
        // 1. 构造 OpenAI 格式的请求体（JSON）
        ObjectNode root = mapper.createObjectNode();
        root.put("model", MODEL_ID);
        root.put("temperature", 0.7);
        root.put("max_tokens", 2048);

        ArrayNode messages = mapper.createArrayNode();
        // system 消息
        ObjectNode systemMsg = mapper.createObjectNode();
        systemMsg.put("role", "system");
        systemMsg.put("content", systemPrompt);
        messages.add(systemMsg);
        // user 消息
        ObjectNode userMsg = mapper.createObjectNode();
        userMsg.put("role", "user");
        userMsg.put("content", prompt);
        messages.add(userMsg);

        root.set("messages", messages);

        String jsonBody;
        try {
            jsonBody = mapper.writeValueAsString(root);
        } catch (Exception e) {
            System.err.println("❌ JSON 构造失败: " + e.getMessage());
            returnnull;
        }

        // 2. 构造 HTTP 请求
        Request request = new Request.Builder()
                .url(API_BASE_URL + "/chat/completions")
                .addHeader("Content-Type", "application/json")
                .addHeader("Authorization", "Bearer " + API_KEY)
                .post(RequestBody.create(jsonBody, MediaType.parse("application/json")))
                .build();

        // 3. 发送请求并处理响应
        try (Response response = client.newCall(request).execute()) {
            if (!response.isSuccessful()) {
                System.err.println("❌ 调用失败，HTTP状态码: " + response.code());
                System.err.println("响应体: " + (response.body() != null ? response.body().string() : ""));
                returnnull;
            }

            String respBody = response.body() != null ? response.body().string() : "";
            ObjectNode respJson = (ObjectNode) mapper.readTree(respBody);

            // 提取回复内容
            String reply = respJson.path("choices")
                    .path(0)
                    .path("message")
                    .path("content")
                    .asText();

            // 提取 token 用量
            int promptTokens = respJson.path("usage").path("prompt_tokens").asInt(0);
            int completionTokens = respJson.path("usage").path("completion_tokens").asInt(0);

            System.out.println("✅ 调用成功！");
            System.out.println("📝 响应: " + reply);
            System.out.println("📊 Token 统计 - 输入: " + promptTokens + ", 输出: " + completionTokens);
            System.out.println("-----------------------------------");
            return reply;

        } catch (IOException e) {
            System.err.println("❌ 网络或解析异常: " + e.getMessage());
            returnnull;
        }
    }
}

逐行解释

构造请求体：使用 Jackson 的 ObjectNode 和 ArrayNode 构建符合 OpenAI Chat Completions 格式的 JSON，包含 model、messages、temperature、max_tokens 等字段。 model 字段必须填你在 MaaS 后台拿到的 modelId（类似 xopqwen36v35b），不是模型名称。
设置请求头：Authorization: Bearer {API_KEY} 完成认证，Content-Type: application/json 告诉服务端数据格式。
发送请求：使用 OkHttp 的异步/同步客户端（这里用同步方法 execute()），URL 为 {API_BASE_URL}/chat/completions，完全兼容 OpenAI 接口规范。
解析响应：从返回的 JSON 中提取 choices[0].message.content 获得模型回答，usage 字段包含本次调用的 token 消耗量，你可以在 MaaS 后台实时核对。

四、拿到免费API后能做什么？

很多小伙伴可能会问：白嫖到了免费API，到底能用来做什么？

下面整理几个我最看好的方向：

场景一：RAG知识库问答系统

将企业文档、产品手册、技术文档等转换成向量数据后，调用Qwen模型进行语义检索和答案生成，实现私域知识库的智能问答。

免费API让开发阶段的试错成本直接归零。

场景二：AI编程助手集成

如果你在用OpenClaw、Cursor、Claude Code等AI编程工具，可以无缝切换到Qwen3.6的API，将其作为代码补全、代码审查和单元测试生成的默认模型。

对个人开发者来说，这相当于免费获得了顶级的AI编程队友。

场景三：多语言客服机器人

基于Qwen3.6的多语言支持，可以构建自动化的客服应答系统，7×24小时处理用户咨询，节省大量人力成本。

场景四：结构化数据提取

从PDF合同、邮件、报表等非结构化文本中提取关键信息，比如客户名称、合同金额、有效期等，自动格式化输出。

Qwen3.6在NL2Repo这类结构化任务上的表现极其优秀。

场景五：AI Agent开发测试

用免费API进行Agent应用的功能开发和性能测试，不需要担心因频繁调用产生的Token账单，可以更专注于Agent的逻辑优化和工具调用链路的完善。

等等。

使用场景有很多。

总结

这一波讯飞星辰MaaS平台免费开放Qwen3.6-35B-A3B和Qwen3.5-35B-A3B权益的活动，站在开发者的角度，价值非常清晰：

对个人开发者：低成本开发Agent，零token焦虑，真正实现了“炼丹自由”；
对创业团队：可以先用免费API完成原型和MVP验证，后期再按需升级到Coding Plan或Token Plan，风险可控；
对企业研发团队：降低实验性项目的边际成本，提速AI应用落地。

Token作为AI时代的新计量单位，重要性正与日俱增。

而这次限时免费+不限量调用的福利，确实是实打实的开发者红利。

再说一遍最关键的：本次活动到2026年6月30日截止！

免费权益包括：

两款Qwen模型（Qwen3.6-35B-A3B + Qwen3.5-35B-A3B）API调用全免费
输入输出全部免费（0元/百万tokens）
新老用户均可领取
没有任何隐藏配额限制，不限量使用

所以还没有领取的小伙伴，我强烈建议大家——现在就行动！先领Key、跑通一次调用、体验一下真实效果再说！

访问专属入口：

https://maas.xfyun.cn/modelSquare?ch=MaaS-jgkol-f3D8i

跟着文章步骤，跑起来吧！

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-08，如有侵权请联系 cloudcommunity@tencent.com 删除

token

本文分享自苏三说技术微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度