首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >零成本调用Qwen3.6无限Token,保姆级教程

零成本调用Qwen3.6无限Token,保姆级教程

作者头像
苏三说技术
发布2026-06-09 19:29:31
发布2026-06-09 19:29:31
230
举报
文章被收录于专栏:苏三说技术苏三说技术

大家好,我是苏三,又跟大家见面了。

前言

不知道有多少小伙伴在工作中遇到过这种场景:开发AI Agent应用写到一半,调试了无数次终于调通,结果一算token消耗,钱包先扛不住了。

一个简单的任务动辄几千token,稍微复杂点就是几万,多跑几次一个开源模型的免费额度就见底了。

更让人头疼的是,市面上很多号称“免费”的API,要么是有限额(比如每天几百条、或者只给输入、输出另算),要么是只针对个人开发者有额度、企业用户另算,要么是免费的模型版本比较老、能力不足。

总之就是一句话:想白嫖一个顶流模型的稳定API调用,真的不容易。

最近我发现一个非常重磅的消息:讯飞星辰MaaS平台直接开放了两款阿里Qwen模型的免费调用权益——Qwen3.6-35B-A3B 和 Qwen3.5-35B-A3B ,输入输出统统0元/百万tokens。

我反复确认了好几遍,不是“有限试用”,不是“每天限流”,而是新老用户都可以直接领取,活动到6月底截止。

换句话说,6月30日之后这波羊毛就没了。

今天这篇文章,我会用一篇超详细的实操教程,带大家快速搞定这个福利——从注册、领取Key、配置接口,到实际的API调用演示,一步不落。

一、聊聊Qwen3.6-35B有多能打

先简单科普一下这次免费开放的两个模型到底是什么水平。

Qwen3.6-35B-A3B是阿里Qwen团队在2026年4月正式开源的混合专家(MoE)模型,总参数量350亿,但实际激活参数仅30亿。

采用了256个专家网络的MoE结构,每次处理一个token时只启动8个路由专家加1个共享专家。

这是什么概念?

做一个对比大家就有感受了:

简单来说,这个模型的核心优势在于“按需分配”。

好比你的公司有各个领域的专业团队:做财务找财务部,做技术找研发部,不用每次全公司开会。

Qwen3.6也是一样,模型内部有256个“专家”,路由器根据输入内容智能选择最相关的几个专家来处理,实际运算量只相当于一个30亿参数的小模型。

这意味着什么?

你在API调用的实际推理成本极低,所以平台才能做到“免费不限量”给你调用。

那它的能力到底行不行?

根据官方披露的数据,Qwen3.6-35B-A3B在多项关键基准测试上表现亮眼:

  • Terminal-Bench 2.0终端编程任务中,Qwen3.6拿到51.5分,超过了Qwen3.5-27B的41.6和Gemma4-31B的42.9;
  • SWE-bench Verified智能体编程基准上,Qwen3.6得到73.4分,显著超越前代Qwen3.5-35B-A3B的70.0分,甚至超过了350亿参数的稠密模型Qwen3.5-27B;
  • NL2Repo端到端代码仓库生成任务上,Qwen3.6的29.4分远超Qwen3.5-35B-A3B的20.5分。

用大白话说就是:虽然它每次推理只激活30亿参数,但在编程、智能体任务上表现出了和百亿参数稠密模型相当甚至更强的能力。

据官方披露,Qwen3.6模型原生支持多模态,能够感知和理解图像输入,并且支持非思考模式的快速响应,是目前最具通用性的开源模型之一。

另外,社区有位开发者用8年前的GTX 1060 6GB显卡搭配i3处理器和24GB内存,在llama.cpp框架下通过特定的MoE参数优化,竟然能以每秒17个token的速度跑起了Qwen3.6-35B-A3B

这说明这个模型对端侧部署极其友好,如果你想在消费级硬件上部署,Qwen3.6也是最佳选择之一。

所以这次讯飞星辰MaaS平台的免费权益——可以直接通过API调用Qwen3.6-35B-A3B。

对想做AI应用开发但又在token成本上纠结的小伙伴来说,真的是一次难得的福利。

二、手把手领福利

废话不多说,直接上干货。

下面是4步拿Key的详细流程,跟着操作5分钟就能搞定。

第一步:进入讯飞星辰MaaS平台

打开下方专属链接,进入模型广场(这是平台给我们留的专属通道,建议点击收藏、直接使用):

🔗 讯飞星辰MaaS平台专属入口

https://maas.xfyun.cn/modelSquare?ch=MaaS-jgkol-f3D8i

注意:此入口为通用模型广场入口,活动专属通道需在确定合作后由平台方同步链接。请确保使用有效的推广链接进入,否则可能无法正确享受免费权益。

第二步:找免费模型,点击「API调用」

在模型广场中找到两个模型卡片:

  • Qwen3.6-35B-A3B(阿里通义千问最新MoE模型)
  • Qwen3.5-35B-A3B(前一代MoE模型,同样免费)

点击进入任一模型详情页,在左侧菜单找到「API Keys」或直接点击模型卡片左下方的「API调用」按钮。

💡 经验分享: 如果你不确定用哪个,个人实测两个模型能力都很强,Qwen3.6更新、编程表现更好,但Qwen3.5也很稳定,两个都可以顺便把Key一起创建了。

如果没有登录,则会自动跳转到登录页面,你可以直接在该页面注册和登录:

目前支持三种登录方式:

  • 微信
  • 手机号
  • 账号

第三步:创建应用,获取API信息

在弹出的API调用窗口中,如果之前没有创建过应用,是无法选择应用的。

点击「前往创建应用」按钮,填写应用名称和描述(随便写,“test应用”就行)。

就会看到appID:

再回到刚刚API调用窗口:

在请选择要授权的应用那里,选择我们刚刚创建的应用,然后点击确认按钮。

此时,窗口上方会弹出一个小窗口,提示需要完整实名认证。

点击去认证按钮:

目前支持多种认证方式,可以根据自己的实际情况完成认证。

一会儿就能审核通过:

再回到API调用窗口,点击确认按钮,会在模型服务列表中看到刚刚创建的服务:

这个页面能看到:

  • API Base URL(接口地址,OpenAI格式兼容)
  • API Key(调用凭证)
  • modelId(模型唯一标识)

把这三项信息复制下来保存好。

注意: 模型ID是一个关键信息,格式类似 xopqwen36v35b 这种字符串,不是模型名称,一定要完整准确地记录下来,后面Agent配置里填错会导致调用失败。

第四步:在Agent/代码中配置API

拿到API信息后,你可以在以下场景中使用:

场景一:配置到AI编程Agent(以OpenClaw为例)

  1. 打开OpenClaw的设置页面,找到「自定义大模型」或「添加自定义服务商」
  2. API协议类型选择 OpenAI格式(讯飞星辰完美兼容OpenAI接口)
  3. API Key填入上一步复制的Key
  4. Base URL填入API调用地址
  5. 模型名称(model)填入刚才记下的modelId
  6. 点击测试连接,显示成功后即可使用

场景二:直接在代码中使用

用Java代码发送API请求即可开始调用(详见下一节示例)。

三、跑通完整API

拿到 Key 和 URL 后,最直观的验证方式就是用代码直接调用一次。

下面用 Java + OkHttp 演示一个完整的调用示例,代码可以直接复制到你的 Spring Boot 或普通 Java 工程中运行。

准备工作:添加 Maven 依赖

pom.xml 中加入 OkHttp 和 Jackson(用于处理 JSON):

代码语言:javascript
复制
<dependency>
    <groupId>com.squareup.okhttp3</groupId>
    <artifactId>okhttp</artifactId>
    <version>4.12.0</version>
</dependency>
<dependency>
    <groupId>com.fasterxml.jackson.core</groupId>
    <artifactId>jackson-databind</artifactId>
    <version>2.16.1</version>
</dependency>

如果是 Gradle 项目:

代码语言:javascript
复制
implementation 'com.squareup.okhttp3:okhttp:4.12.0'
implementation 'com.fasterxml.jackson.core:jackson-databind:2.16.1'
完整调用示例代码
代码语言:javascript
复制
import com.fasterxml.jackson.databind.ObjectMapper;
import com.fasterxml.jackson.databind.node.ArrayNode;
import com.fasterxml.jackson.databind.node.ObjectNode;
import okhttp3.*;

import java.io.IOException;
import java.util.concurrent.TimeUnit;

publicclass QwenMaaSDemo {

    // ===== 配置参数:填入你在 MaaS 后台获取的信息 =====
    privatestaticfinal String API_BASE_URL = "https://maas-api.cn-huabei-1.xf-yun.com/v2";  // 替换为你的 Base URL
    privatestaticfinal String API_KEY = "你的 API Key";                                      // 替换为你的 API Key
    privatestaticfinal String MODEL_ID = "你的 modelId";                                     // 替换为你的 modelId
    // =================================================

    privatestaticfinal OkHttpClient client = new OkHttpClient.Builder()
            .connectTimeout(60, TimeUnit.SECONDS)
            .readTimeout(60, TimeUnit.SECONDS)
            .build();
    privatestaticfinal ObjectMapper mapper = new ObjectMapper();

    public static void main(String[] args) throws IOException {
        // 测试1:基础问答
        callQwen("用一句话介绍一下 MoE(混合专家)模型架构", "你是一个专业的AI助手");

        // 测试2:代码生成任务(Qwen3.6 强项)
        callQwen(
            "写一个 Java 函数,实现归并排序算法,并添加详细的注释",
            "你是一名资深 Java 工程师,代码风格简洁规范"
        );
    }

    /**
     * 调用讯飞星辰 MaaS 平台的 Qwen 模型 API
     * @param prompt 用户输入
     * @param systemPrompt 系统提示词
     * @return 模型返回的内容,失败返回 null
     */
    public static String callQwen(String prompt, String systemPrompt) {
        // 1. 构造 OpenAI 格式的请求体(JSON)
        ObjectNode root = mapper.createObjectNode();
        root.put("model", MODEL_ID);
        root.put("temperature", 0.7);
        root.put("max_tokens", 2048);

        ArrayNode messages = mapper.createArrayNode();
        // system 消息
        ObjectNode systemMsg = mapper.createObjectNode();
        systemMsg.put("role", "system");
        systemMsg.put("content", systemPrompt);
        messages.add(systemMsg);
        // user 消息
        ObjectNode userMsg = mapper.createObjectNode();
        userMsg.put("role", "user");
        userMsg.put("content", prompt);
        messages.add(userMsg);

        root.set("messages", messages);

        String jsonBody;
        try {
            jsonBody = mapper.writeValueAsString(root);
        } catch (Exception e) {
            System.err.println("❌ JSON 构造失败: " + e.getMessage());
            returnnull;
        }

        // 2. 构造 HTTP 请求
        Request request = new Request.Builder()
                .url(API_BASE_URL + "/chat/completions")
                .addHeader("Content-Type", "application/json")
                .addHeader("Authorization", "Bearer " + API_KEY)
                .post(RequestBody.create(jsonBody, MediaType.parse("application/json")))
                .build();

        // 3. 发送请求并处理响应
        try (Response response = client.newCall(request).execute()) {
            if (!response.isSuccessful()) {
                System.err.println("❌ 调用失败,HTTP状态码: " + response.code());
                System.err.println("响应体: " + (response.body() != null ? response.body().string() : ""));
                returnnull;
            }

            String respBody = response.body() != null ? response.body().string() : "";
            ObjectNode respJson = (ObjectNode) mapper.readTree(respBody);

            // 提取回复内容
            String reply = respJson.path("choices")
                    .path(0)
                    .path("message")
                    .path("content")
                    .asText();

            // 提取 token 用量
            int promptTokens = respJson.path("usage").path("prompt_tokens").asInt(0);
            int completionTokens = respJson.path("usage").path("completion_tokens").asInt(0);

            System.out.println("✅ 调用成功!");
            System.out.println("📝 响应: " + reply);
            System.out.println("📊 Token 统计 - 输入: " + promptTokens + ", 输出: " + completionTokens);
            System.out.println("-----------------------------------");
            return reply;

        } catch (IOException e) {
            System.err.println("❌ 网络或解析异常: " + e.getMessage());
            returnnull;
        }
    }
}
逐行解释
  1. 构造请求体:使用 Jackson 的 ObjectNodeArrayNode 构建符合 OpenAI Chat Completions 格式的 JSON,包含 modelmessagestemperaturemax_tokens 等字段。 model 字段必须填你在 MaaS 后台拿到的 modelId(类似 xopqwen36v35b),不是模型名称。
  2. 设置请求头Authorization: Bearer {API_KEY} 完成认证,Content-Type: application/json 告诉服务端数据格式。
  3. 发送请求:使用 OkHttp 的异步/同步客户端(这里用同步方法 execute()),URL 为 {API_BASE_URL}/chat/completions,完全兼容 OpenAI 接口规范。
  4. 解析响应:从返回的 JSON 中提取 choices[0].message.content 获得模型回答,usage 字段包含本次调用的 token 消耗量,你可以在 MaaS 后台实时核对。

四、拿到免费API后能做什么?

很多小伙伴可能会问:白嫖到了免费API,到底能用来做什么?

下面整理几个我最看好的方向:

场景一:RAG知识库问答系统

将企业文档、产品手册、技术文档等转换成向量数据后,调用Qwen模型进行语义检索和答案生成,实现私域知识库的智能问答。

免费API让开发阶段的试错成本直接归零。

场景二:AI编程助手集成

如果你在用OpenClaw、Cursor、Claude Code等AI编程工具,可以无缝切换到Qwen3.6的API,将其作为代码补全、代码审查和单元测试生成的默认模型。

对个人开发者来说,这相当于免费获得了顶级的AI编程队友。

场景三:多语言客服机器人

基于Qwen3.6的多语言支持,可以构建自动化的客服应答系统,7×24小时处理用户咨询,节省大量人力成本。

场景四:结构化数据提取

从PDF合同、邮件、报表等非结构化文本中提取关键信息,比如客户名称、合同金额、有效期等,自动格式化输出。

Qwen3.6在NL2Repo这类结构化任务上的表现极其优秀。

场景五:AI Agent开发测试

用免费API进行Agent应用的功能开发和性能测试,不需要担心因频繁调用产生的Token账单,可以更专注于Agent的逻辑优化和工具调用链路的完善。

等等。

使用场景有很多。

总结

这一波讯飞星辰MaaS平台免费开放Qwen3.6-35B-A3B和Qwen3.5-35B-A3B权益的活动,站在开发者的角度,价值非常清晰:

  • 对个人开发者:低成本开发Agent,零token焦虑,真正实现了“炼丹自由”;
  • 对创业团队:可以先用免费API完成原型和MVP验证,后期再按需升级到Coding Plan或Token Plan,风险可控;
  • 对企业研发团队:降低实验性项目的边际成本,提速AI应用落地。

Token作为AI时代的新计量单位,重要性正与日俱增。

而这次限时免费+不限量调用的福利,确实是实打实的开发者红利。

再说一遍最关键的:本次活动到2026年6月30日截止!

免费权益包括:

  • 两款Qwen模型(Qwen3.6-35B-A3B + Qwen3.5-35B-A3B)API调用全免费
  • 输入输出全部免费(0元/百万tokens)
  • 新老用户均可领取
  • 没有任何隐藏配额限制,不限量使用

所以还没有领取的小伙伴,我强烈建议大家——现在就行动!先领Key、跑通一次调用、体验一下真实效果再说!

访问专属入口:

https://maas.xfyun.cn/modelSquare?ch=MaaS-jgkol-f3D8i

跟着文章步骤,跑起来吧!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 苏三说技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 一、聊聊Qwen3.6-35B有多能打
  • 二、手把手领福利
    • 第一步:进入讯飞星辰MaaS平台
    • 第二步:找免费模型,点击「API调用」
    • 第三步:创建应用,获取API信息
    • 第四步:在Agent/代码中配置API
  • 三、跑通完整API
    • 准备工作:添加 Maven 依赖
    • 完整调用示例代码
    • 逐行解释
  • 四、拿到免费API后能做什么?
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档