首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >五句话,手搓了一个私有的A股数据分析平台

五句话,手搓了一个私有的A股数据分析平台

作者头像
勇哥AI笔记
发布2026-05-29 11:03:00
发布2026-05-29 11:03:00
1070
举报
文章被收录于专栏:技术人生黄勇技术人生黄勇

短短续续在尝试用AI做A股分析,像这篇文章智谱也出龙虾了,我养的第4只还让它炒股让它分析恒生互联网ETF(513330)。

更早的文章给 OpenClaw 接入10000+工具和数据,为你盯盘,给出独家策略,接QVeris 数据源来获取A股数据。

这种方式只是适合尝试一下,没法成体系,系统性的给予分析建议。

所以一直在思考应该怎么做,让AI成为投资分析的助力:一是稳定免费的数据来源,二是合适自己的策略。

于是为了解决数据来源问题,尝试市面上的量化模拟平台,数据是免费了,策略也不少,而且支持策略回测、模拟交易。

但是策略都是社区里文章分享的策略,不支持接入自定义的大模型。

不得已,我让AI自己去读聚宽的API文档,把本地一个迭代了六个版本的策略生成为聚宽的代码版本,以便能使用它的模拟交易功能。

这样又觉得效率很低,而且数据和策略脱节。

在本地让AI来写代码调整迭代又卡在数据来源上,数据散落在各个平台,有的要积分,有的要付费,有的接口不稳定,调几次就被封IP。

正好昨天小米模型给我的Token Plan重置了Mimo最高降幅99% Token Plan 用量提升8倍。110亿的 Token 明天就要过期,拿它来写个数据分析系统吧。

过程顺利得出乎我意料,仅仅给了一个指令,四句修正的对话,就生成了一个分析平台雏形。

数据来源选型.md 是计划构建A股数据收集来源平台想法和调研结果,请你构建一个合理的用于分析的系统

数据收集分析平台方案整体可行,添加两条建议:1. 先检测数据源是否可用,2. 检查westock-data 是否可以为平台所用,如果可以,也请纳入数据收集分析范围内

方案v2 很好,仅提一个建议:是否可以安装 mootdx ,先做数据源验证,作为 phase1接入。

请检查“新闻返回0行”的问题,先列出接口返回原始信息,再检查解析是否正确

现在是否可以根据你的方案v2,开始构建一个合理的用于分析的系统,提供给我查看各类数据,以及使用一些专业分析框架来分析这些数据,得出研报

效果跟我在证券APP里看到的信息差不多:有技术、有公告、有资金流向、有相关新闻、有财务分析。

基于这个数据基础,辅助专家技能,再让AI分析,那不原地起飞。

🎯 数据从哪来?

研究了一圈,发现免费能用的数据接口其实不少,关键是选型和组合。

最终研判的结论形成下面的六层数据架构,覆盖A股分析需要的所有数据维度:

数据内容

选型

淘汰方案

淘汰原因

📈 行情层

K线、盘口、PE/PB、市值

mootdx + 腾讯财经

akshare行情

45%打东财封IP

📊 研报层

研报列表、PDF下载、NL搜索

东财 + akshare + iwencai

tushare

积分墙

🔥 信号层

热点归因、题材tags、北向资金

同花顺热点归因

akshare

仅给名单

📰 新闻层

个股新闻、快讯、全球资讯

akshare ×3

唯一免费源

📋 基础数据

财务快照、F10、基本面

mootdx finance

akshare高频

走东财易封

📢 公告层

公告全文、最新摘要

巨潮 + mootdx

唯一免费源

选型核心原则:能用好用免费。

  • mootdx 走TCP协议,稳定性高,适合高频调用
  • akshare 封装了东财、同花顺等数据源,低频使用不会触发反爬
  • iwencai 支持自然语言搜索,比如输入"人形机器人丝杠"就能跨主题检索研报

这套组合覆盖了15个数据接口,从行情到公告,全链路打通。

🔧 系统怎么搭?

数据源确定后,开始搭分析系统。整体架构很简单:

代码语言:javascript
复制
用户输入股票代码
        │
        ▼
┌─────────────────────────────┐
│   ReportGenerator           │  报告生成器
└─────────┬───────────────────┘
          │
          │  6个数据采集任务(独立隔离)
          │
          ├── ① 财务分析
          ├── ② 技术分析
          ├── ③ 最新新闻
          ├── ④ 资金流向
          ├── ⑤ 股东结构
          └── ⑥ 风险事件
          │
          ▼
    渲染为HTML研报 → 保存到本地

关键设计:每个采集任务独立 try-catch,任何一个失败不影响其他部分。

比如新闻接口挂了,财务分析照样能跑完。这种隔离设计在实际使用中非常实用,因为免费接口偶尔抽风是常态。

📊 数据采集层:统一查询API

上层分析器不直接调用各个CLI工具,而是通过一个统一的 DataQuery 接口:

代码语言:javascript
复制
def get_daily(self, code, start, end):
    # 1. 先查 SQLite 缓存
    rows = query("SELECT * FROM daily_kline WHERE code=?", [code])
    if rows:
        return DataFrame(rows)

    # 2. 缓存为空,调数据源
    df = self.westock.kline(code, period="day", limit=2000)

    # 3. 写入缓存
    upsert_many("daily_kline", records)
    return DataFrame(records)

核心逻辑:SQLite缓存优先,缺失时才调数据源补全。

这样做的好处:

  • • 避免重复请求,减少被封风险
  • • 离线也能查看历史数据
  • • 响应速度更快

💰 财务分析逻辑

财务数据来自三个源头,各司其职:

数据源1:三大报表

  • • 利润表 → EPS、营收增长率、净利润增长率、营业利润率
  • • 资产负债表 → 资产负债率、流动比率、权益乘数
  • • 现金流量表 → 存储备用

数据源2:mootdx 37字段快照

  • • ROE、ROA、净利率、毛利率
  • • 杜邦分析三要素

数据源3:实时行情

  • • PE(TTM)、PB、PS、股息率、总市值

这个版本,Mimo模型自行设计了一套评分体系。

后续可以根据自身情况改进。

维度

指标

盈利能力

ROE

>15%

>10%

>5%

≤5%

成长性

max(营收增长, 利润增长)

>20%

>10%

>0%

≤0%

估值

PE(TTM)

<10

<20

<40

≥40

偿债能力

资产负债率

<40%

<60%

<75%

≥75%

综合评分 = 盈利 + 成长 + 健康 的加权平均,最终给出财务评级。

📈 技术分析逻辑

技术分析返回MA/MACD/RSI/KDJ/BOLL/DMI全套指标。

趋势判断

  • • 均线排列:MA5>MA10>MA20 → 多头排列
  • • 价格位置:价格 > MA20 → 短期上涨,价格 > MA60 → 中期上涨

指标信号

  • • MACD:DIF>DEA 且 HIST>0 → 金叉
  • • RSI:>80 严重超买,<20 严重超卖
  • • KDJ:J>100 超买,J<0 超卖

支撑压力位

  • • 强压力位 = 近60日最高价
  • • 弱压力位 = 近60日 top5 最高价均值
  • • 弱支撑位 = 近60日 top5 最低价均值
  • • 强支撑位 = 近60日最低价

最终计算综合信号评分:

维度

多头/利好

空头/利空

短期趋势

+1

-1

中期趋势

+1

-1

均线排列

+2

-2

MACD

+2

-2

RSI

+2

-2

量价配合

+1

-1

总分

信号

强度

≥5

强烈买入

5/5

≥3

买入

4/5

≥0

持有观望

3/5

≥-3

卖出

2/5

<-3

强烈卖出

1/5

📄 研报生成

所有数据采集和分析完成后,输入一个股票代码,等待几秒,一份完整的HTML研报就生成了:

评级和分析后续改进。

这是第一版,还有很多可以优化的地方:

  • • 接入大模型做智能解读,不只是罗列数据
  • • 支持批量分析,一次跑完整个行业
  • • 加入历史回测,验证分析逻辑的准确性
  • • 安装专家分析Skill,金融分析框架

数据层用免费接口组合,稳定可靠;

分析层用自己写的逻辑,灵活可控;

接入任意LLM做智能解读,想用哪个模型就用哪个模型。

不依赖任何商业平台,完全自主可控。

如果你也在做类似的尝试,欢迎评论区留言。

-END-


推荐阅读:

AI 编程智能体为什么没有网上说的那么好用?

韬定律与DeepSeek齐头并进改变人工智能格局

DeepSeek 的 10 万亿美元大战略

Codex 不断更新:8个特性把它用到极致

从零开发AI编程智能体:主循环、上下文压缩与Hook设计

这个开源工具把 token 消耗节省了98%

Mac上双开Codex

Hermes Agent 桌面端:工作台 + Windows/Mac 双端 + 多智能体协作

Anthropic 百万行代码库的官方最佳实践

Multica:让 AI 智能体变为你的员工

不用一个违禁词 让 Claude 说出炸药配方|红队攻击实录

大模型黑箱揭秘:GPT、Claude、Gemini、Grok、Hermes 系统提示词全公开

当 AI 编程使得代码变得便宜......

AI 让我更累了,这不是错觉

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 技术人生黄勇 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🎯 数据从哪来?
  • 🔧 系统怎么搭?
  • 📊 数据采集层:统一查询API
  • 💰 财务分析逻辑
  • 📈 技术分析逻辑
  • 📄 研报生成
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档