首页
学习
活动
专区
圈层
工具
发布

#python

广泛使用的高级编程语言,属于通用型编程语言

Python 量化数据工程:基于 Pandas 的 A 股 K 线标准化清洗与向量化技术指标计算

小白学大数据

前言量化投研领域存在一条公认的数据底层准则:策略回测与量化模型的性能上限,由输入数据集的基准质量决定。A 股市场多数据源输出的原始日度 K 线数据集普遍存在天然...

500

实战:利用Playwright隐藏自动化特征(Stealth模式)的底层原理

jackcode

大家好,今天我们来聊聊自动化爬虫中一个非常让人头疼的问题。很多兄弟经常遇到这样的场景:用Playwright写好的爬虫代码,本地跑得好好的,一放到服务器上就被目...

1000

Python数据库操作与异常处理:一个让我半夜爬起来修Bug的故事

风一样的男子

事情是这样的:我们在做一个用户注册功能,用户填完手机号提交,系统往数据库里插一条记录。正常情况下,手机号是唯一的,不会重复。但那天因为网络抖动,用户点了两次提交...

700

基于 Tick 数据流提取订单流失衡指标:云端量化回测与特征工程完整实践

用户12361263

在短线、高频量化策略开发与批量历史回测工作中,多数开发者习惯采用分钟级聚合 K 线作为模型输入特征,落地后普遍存在策略信号失真、仿真与离线回测收益偏差过大的问题...

1200

Python Scrapy 跨平台爬虫实战:XPath 解析与结构化数据提取

小白学大数据

爬虫开发中,请求—下载—解析—存储是最基础的四段流水线。请求和下载部分各语言方案大同小异,真正拉开效率差距的是解析层。BeautifulSoup 面对深层嵌套、...

3510

Python多线程居然比单线程还慢?记住一个坑

风一样的男子

去年有个朋友跟我吐槽,说他想用多线程加速一个数据处理任务。原代码是单线程跑的,处理100万条数据要8秒。他觉得CPU利用率太低,心想:"我有8个核,开8个线程,...

3310

Python逻辑运算中的短路求值

Crossin先生

程序计算出 x > 0 为True之后,就不会再计算 y < 15的值,因为无论后面是True还是False,都不影响最终的结果。

2210

Python用LoRA微调与ISMOTE过采样实现社交媒体文本15类情感多标签识别

拓端

全文链接:https://tecdat.cn/?p=46216 原文出处: 拓端数据部落公众号 引言

2310

Python用LoRA微调Gemma4视觉模型用于放射学医学影像问答|附AI智能体、代码和数据

拓端

本文系统梳理了使用Unsloth工具链对Gemma4视觉语言模型进行LoRA参数高效微调的完整流程,并将其应用于放射学医学影像问答任务。文章回答了以下核心问题:...

3510

UV vs pip vs Conda:Python环境管理应该怎么选

deephub

写 Python 够久的话,肯定遇到过一个问题clone 一个仓库,pip install -r requirements.txt却特别慢

4810

深度对比:Scrapy vs PySpider,谁更适合作为企业级分布式底层?

jackcode

搭建一个日产千万级页面的企业级分布式爬虫系统,框架选型往往是决定项目生死的第一步。在 Python 生态中,Scrapy 和 PySpider 是提及率最高的两...

2300

Python循环中修改字典键导致遍历异常深度解析实战案例

风骏时光少年

Python字典底层基于哈希表实现,在遍历字典keys()、items()、values()过程中,直接新增、删除字典键会触发迭代器失效,抛出RuntimeEr...

3110

云原生量化工程实践:涨跌停区间 A 股盘口深度快照量化解析与云端落地方案

用户12361263

在基于云服务器搭建 A 股量化行情采集集群、开展打板 / 涨跌停套利策略批量回测与仿真推演的工程实践中,多数量化研发人员会出现同一类性能偏差:策略离线回测收益曲...

4610

DIY高新科技:边缘计算设备状态采集兴起,轻量爬虫接入本地监控系统

用户12583401

边缘计算正在进入更多技术场景。AI 摄像头、工业网关、传感器盒子、边缘推理主机、低功耗服务器,都可能部署在办公室、工厂、实验室或户外节点中。这些设备通常有自己的...

6610

DIY热点:低成本云端爬虫兴起,个人也能搭建长期在线采集系统

用户12583401

过去,很多人写爬虫只是临时运行一次。打开电脑,执行 Python 脚本,抓完数据就结束。但这种方式有明显缺点:电脑关机后任务停止,网络波动时没有恢复机制,运行日...

8110

2026突发:网站更新监控需求爆发,Python 爬虫成为信息提醒新工具

用户12583401

进入 2026 年后,越来越多的信息不再集中发布在一个平台上。课程通知、技术文档、开源项目公告、政策页面、活动报名页、企业新闻页,都可能分散在不同网站。对于普通...

8710

AI 帮我批量重命名 100 个文件,手没抽筋

平泉鉴宝

上个月公司搞活动,我负责拍照。一天拍了 300 多张照片,文件名都是 IMG_0001.jpg、IMG_0002.jpg、DSC_0123.jpg 这种默认名字...

10610

Python周刊2026W26 | PEP 835 添加、3.14 GC 回退、大量 PEP 定稿、Pluggy 解析、PyCon 安全汇总

用户11088760

本期涵盖 Pluggy 插件系统实战、Python 接口实现方式(ABC 与 Protocols)、Scrapy 扩展开发、2026 年任务队列库选型对比、Py...

10810
领券