首页
学习
活动
专区
圈层
工具
发布
首页标签大数据

#大数据

腾讯云大数据解决方案,助力客户快速构建企业级数据架构,获取数据时代核心竞争优势

qData数据中台专业版数据血缘全链路构建实战:自动解析与人工补录的双轨协同

吴同

在数据建设的初期,数据的来源、加工和流向往往依赖开发人员的个人记忆或散落的线下文档。

2510

大数据高级核心技术点问题总结

wuzhigang

2400

别等数据出事才想起“查账”:AI 可审计性的数据流水线,才是合规真正的底座

Echo_Wish

我是 Echo_Wish。做大数据和 AI 这几年,有个越来越明显的趋势:不是模型准不准的问题,而是你能不能说清楚“它为什么这么做”。很多团队一上来就卷模型、卷...

2200

数智平台技术研究报告-中国航信&大数据技术标准推进委员会

独角兽老头

在当今数智化浪潮席卷全球的时代,数据已成为推动社会进步和经济发展的关键生产要素,而智能化技术则成为释放数据要素价值、推动业务创新的核心驱动力,数智化已经成为企业...

4910

Apache DolphinScheduler 新手指南:手把手教你创建第一个工作流!

Apache DolphinScheduler

在本文中,我们将使用 Apache DolphinScheduler 逐步创建和运行一个简单的工作流。在这段旅程中,你将学习 DolphinScheduler ...

4800

我用 CodeX+WhaleStudio Skill 10 分钟创建了 Snowflake 数据仓库!

Apache SeaTunnel

如果有一天,在 WhaleStudio 中创建同步任务、编写 SQL、搭建 DAG、排查任务异常这些工作都能交给 Agent 自动完成,那么数据工程师的价值还体...

4310

Python 用 difflib 实现模糊查询

小田测测看

SequenceMatcher 还有 quick_ratio() 方法,计算速度更快(精度稍降)。若处理几万条商品名等大数据量场景,用 quick_ratio ...

5210

2107 个中国 ES 集群在公网免密裸奔没人管:里面有你们公司吗?

岳涛

腾讯云TDP | 官方产研 (已认证)

前段时间在 INFINI Labs(极限实验室)的视频里第一次系统看到 Shodan 上的 Elasticsearch(以下简称 ES)暴露面:大量实例没有任何...

9320

从学生贡献者到 Apache SeaTunnel Committer:Doyeon Kim 的开源成长之路

Apache SeaTunnel

还记得去年我们曾经采访过的韩国小姐姐吗?韩国萌系新人贡献者爆刷存在感:加入半年,活跃度已经拉满!短短 2 年之内,她已经正式被邀请成为 Apache SeaTu...

3910

全面复盘:BeautifulSoup在处理大规模脏数据时的崩溃问题与解法

jackcode

大家好,今天我们来聊聊一个老生常谈、却又常常让人在生产环境中痛不欲生的话题——大规模脏数据处理。

5910

openClaw 龙虾太火爆,今天聊聊大数据平台的备份

用户7148769

2026年春节到现在openClaw 龙虾实在是太火爆了,如果见面不聊“养龙虾”都感觉不是一个时代的人了,龙虾虽好但消耗的 “token” 以及带来的安全问题不...

4000

数据越多越乱?一套元数据策略,帮你把“大数据垃圾场”变成“数据资产库”

Echo_Wish

大家有没有发现一个现象:很多企业花了几百万甚至上千万建设数据平台,买大数据集群、搭数据湖、建数仓、搞实时计算,结果几年后发现:

6510

深度解析.NET 中IAsyncEnumerable:异步迭代的高效实现与应用】

步步为营DotNet

IAsyncEnumerable支持异步流的概念,即数据可以在需要时逐步获取,而不是一次性加载所有数据。这种方式对于处理大数据集或远程数据源非常有效,因为它减少...

5800

深度解析.NET中LINQ的延迟执行:提升性能与资源管理的关键

步步为营DotNet

LINQ的延迟执行是提升性能和优化资源管理的重要特性。其核心在于表达式树的构建与延迟编译执行,以及迭代时按需生成结果。适用于处理大数据集和动态查询构建等场景,但...

6600

淘宝拍立淘图片搜索 API 技术说明文档(taobao.item.search_img|含原始 JSON + 落地结构化模型)

wx19970108018

taobao.item.search_img 即拍立淘官方图搜接口,依托图像特征检索算法,传入图片即可批量匹配淘宝、天猫同款 / 相似商品,是跨境选品、竞品溯源...

13610

日志存了10年却查不出真相?聊聊合规审计日志的设计与长期可查询存储实践

Echo_Wish

“去年3月份是谁删掉了客户资料?”“某个订单状态是谁改的?”“监管部门要求提供三年前的数据操作记录,能导出来吗?”

10810

数据堆成山才想治理?别等磁盘爆了才后悔:聊聊数据生命周期管理那些事

Echo_Wish

“数据库又满了,领导问为什么存储成本翻了三倍,运维说磁盘快爆了,开发说数据不能删,业务说历史数据以后可能还要查……”

11510
领券