首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏韩锋频道

    浅谈“HTAP

    HTAP是近些年来比较火的一个概念,下面就聊聊其前世今生及技术特点。 1. 数据应用类别 根据数据的使用特征,可简单做如下划分。在选择技术平台之前,我们需要做好这样的定位。 ? 有些专有流式数据处理平台开始提供SQL接口,例如KSQL基于Kafka提供了流式SQL处理引擎。 对于融合了联机事务处理和联机实时分析的场景,也就是下面所谈到的HTAP。此类通用平台方案具备下面优点: 通过数据整合避免信息孤岛,便于共享和统一数据管理。 HTAP HTAP数据库(Hybrid Transaction and Analytical Process,混合事务和分析处理)。 5).HTAP产品 下图是网站找到的数据库产品分类图,针对HTAP类的可参考对象线上的相关产品。当然这只是一家之言,仅供参考! ?

    10.2K1614发布于 2019-09-25
  • 来自专栏Apache IoTDB

    OLTP + OLAP -> HTAP

    HTAP HTAP:Hybrid transaction/analytical processing,混合事务/分析处理。 HTAP 就是 OLAP 和 OLTP 两种场景的结合。在对新旧数据进行 OLAP 分析的情况下增加事务的处理来对数据进行更新。 这种数据库就叫做 HTAP DBMS。 一种构造 HTAP DBMS 的方式就是分别针对新旧数据构建两套引擎,一套负责 OLTP,一套负责 OLAP,相当于将关系数据库和列存数据库进行结合。 一个查询到达后,需要分别解析成两套查询,在两个查询引擎都得到结果后进行合并,还可能用到两阶段提交等分布式事务。这样混合会带来性能的下降和查询模式的限制。 总结 存储模型与适用场景是一一对应的,而 HTAP 是两种场景的结合。

    3.6K30发布于 2020-09-27
  • 来自专栏PingCAP的专栏

    Why HTAP Matters

    说到 Why HTAP Matters,其实包含两部分,一部分是说为什么我们叫 HTAP,另外一部分是说 TiDB 怎样在 HTAP 架构下发挥它的优势。 ## 什么是 HTAPHTAP,首先 HTAP 是 Gartner 提出的一个名词,它其实描述的概念很简单,就是一个数据库同时能具备 TP 和 AP 两种能力。 这套引擎整合在一起其实就是一个可扩展的行存和列存整合的架构,这套整合的架构在存储上是可以使用分离的不同的节点,可以确保两边互相之间没有干扰,它的实时性、一致性、可延展性都能得到很好的保证。 另外添加了向量化引擎,列存本身和行存之间能通过智能的引擎选择。** TiDB 本身其实没有办法做很详细的阐述,因为这是一个短 talk。 ### TiDB HTAP 应用实践 回到前面已经阐述过的观点,**在 HTAP 场景底下 TiDB 能为用户提供一个简化架构,降低运维复杂度,更重要的是我们提升业务的实时性,提升业务的敏捷性。

    1.2K42发布于 2020-08-03
  • 来自专栏AustinDatabases

    临时起意的 HTAP想法,HTAP 是不是伪需求?

    HTAP到底有没有需求,这个问题大部分情况之前的我的想法是,还好吧,不是强需求。最近业务一次深入,直接打脸。 但HTAP也要解决一些棘手的问题,比如资源隔离,多种索引的建立应对不同的需求,数据节点的临时扩展和收缩,满足HTAP的一些临时性能需求,与成本的最小化的要求。 这篇文章是是临时所想,先把问题记录下来,后续就是寻找解决方案,逐步满足业务需求,将数据库往HTAP的道路上引导,最后HTAP是不是潮流我不知道,但这一定是新型数据库的趋势,我要的价值是真正的价值不在于“ 大学习法--OBCA视频学习总结第五章--开发与库表设计 OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装 OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎 主键问题多种解决方案 MySQL 怎么让自己更高级---从内存表说到了开发方式 MySQL timeout 参数可以让事务不完全回滚 MySQL 让你还用5.7 出事了吧,用着用着5.7崩了 MySQL 的SQL引擎很差吗

    14410编辑于 2026-03-12
  • 来自专栏飞总聊IT

    OceanBase CTO杨传辉:有些HTAP数据库,不是真HTAP

    新粉请关注我的公众号 OceanBase CTO 杨传辉,最近在OceanBase公众号上发表了一篇文章:真正的HTAP对用户和开发者意味着什么? 这篇文章写得非常的好,飞总强烈推荐对HTAP有兴趣的人仔细读读这篇文章,顺便聊聊里面一个非常重要的观点。 这种方案并不符合“一份数据“的要求,不是真正的 HTAP。为什么? 杨传辉,公众号:OceanBase真正的HTAP对用户和开发者意味着什么? 这篇文章的这个观点,飞总是非常赞同的。 但是确实有缝合怪在大力宣传自己是很牛逼的HTAP系统啊,既可以做OLAP的也能够处理OLTP的,深受投资人的追捧,和互联网上懵懵懂懂的大众的欢迎。

    1.1K20编辑于 2022-07-14
  • 来自专栏PingCAP的专栏

    TiDB HTAP 深度解读

    TiDB 4.0 是一个针对 HTAP 进行了特别的设计和架构强化,这次给大家带来一篇 VLDB 2020 HTAP 主题的论文解读,比较特殊的是这篇论文是 PingCAP 写的,关于 TiDB HTAP 这种行列混合可以是一种折中格式如 PAX,也可以是在同一存储引擎中通过聪明的算法糅合两种形态。 这次 HTAP 的构思也不例外。 这种方式让我们能单独思考两个场景,也无需对现有的引擎做太大的改变,让产品成型和稳定周期大大缩短。 要达到 HTAP 的目标,TiDB 的列存引擎必须能够支持实时更新,而且这个更新的速率不能低于行存。 事实上,我们肯定不是第一个在业界尝试实现列存更新的产品。

    1.4K11发布于 2020-09-18
  • 来自专栏宗恩

    HTAP 能够取代 OLAP 吗?

    HTAP是什么HTAP(Hybrid Transaction and Analytical Processing)数据库,也称混合型关系数据库,是能同时提供OLTP和OLAP的混合关系型数据库。 在此背景下,由 Gartner 提出的 HTAP成为希望。 基于创新的计算存储框架,HTAP 数据库能够在一份数据上同时支撑业务系统运行和 OLAP 场景,避免在传统架构中,在线与离线数据库之间大量的数据交互。HTAP=OLTP+OLAP? 所以大部分的HTAP并不完整包含OLAP的完整功能,且他们的OLAP功能整体比较弱,只是满足偶尔提取一些需要用于分析的少量数据。在实际的使用过程中,很多企业为了实现HTAP,是花了不少代价的。 选型过程中功能需要考虑的因素包括:数据存储格式、SQL引擎的效率、OLTP/OLAP的资源隔离与防干扰措施、数据有几份备份、如何避免大型集群产生数据沼泽等等。

    73020编辑于 2023-05-08
  • 来自专栏飞总聊IT

    Snowflake发布UniStore,进军HTAP

    新粉请关注我的公众号 在一年一度的Snowflake Summit上,Snowflake宣布它们发布最新的UniStore,正式进军HTAP市场。 UniStore是Snowflake的一个新的存储引擎,不是Column Store 是个Row Store,它保证了Snowflake对一个row的访问会很快,并支持事务处理。 因此,这就成了HTAP,同时支持事务处理和分析处理。 HybridTable也开始正式支持一些以前OLAP不支持的东西,比如说Primary Key和Foreign Key。比如说某些类型的索引。 总之Foundation DB怎么看都不是一个很好的事务存储引擎。 但是Snowflake依然选择了它,大概率是因为之前魔改做Metadata Service有技术积累了吧。继续魔改也不怕。 毕竟Databricks现在想玩LakeHouse,而Snowflake现在却跑去做HTAP了。总是有种Databricks被Snowflake牵着鼻子走的感觉。

    1.1K20编辑于 2022-06-16
  • 来自专栏算法之美

    TiDB 数据库 HTAP 技术 摘要

    TiDB 高级系统管理 :TiDB 数据库 HTAP 技术 要点 思考一下: 1. 异步复制 怎么保证一致性读取? 2 raft 角色有哪三种? TiDB 数据库 HTAP 概述 青铜级练习 特点1 htap 架构是什么 不修改整体结构,引入一个角色(不投票,不选举,只同步数据) tiflash cols 行列混合是2个产品。 MPP 架构可以对聚合、JOIN 等操作加速 答案:b 白银级练习:MPP 架构是什么 与HTAP关系 TiDB 通过 TiFlash 节点引入了 MPP 架构。 数据隔离性:TiKV、TiFlash 可按需部署在不同的机器,解决 HTAP 资源隔离的问题。 采用行存(tikv) + 列存(TiFlash)的混合存储方式(这个是HTAP) B. region 支持 raft 投票和选举(learner) C.

    1.7K30编辑于 2022-03-15
  • 来自专栏数据指象

    未来数仓:不是简单的HTAP

    2014 年 Gartner 提出的 HTAP 概念,使用 In-Memory+列存技术同时处理 TP 和 AP。无非想借助内存处理TP,借助列存技术处理AP。 或者行列混合可以是一种折中格式如PAX,也可以是在同一存储引擎中通过聪明的算法糅合两种形态。但是这种简单的TP+AP的HTAP 却很难等价于TP和AP。 HTAP 也是一种技术框架的创新,在部分场景中有用武之地。HTAP的主要代表有TiDB、OceanBase、CockroachDB等。

    22110编辑于 2024-11-23
  • 来自专栏PingCAP的专栏

    TiDB + TiFlash : 朝着真 HTAP 平台演进

    作者介绍: 韦万,PingCAP 数据库研发工程师,主要领域是数据库的存储引擎研发,以及系统性能优化。 一、为什么我们需要 HTAP 数据库? TiDB 定位为一款 HTAP 数据库,希望同时解决 TP 和 AP 问题。我们知道 TiDB 可以当作可线性扩展的 MySQL 来用,本身设计是可以满足 TP 的需求的。 TiFlash 项目借助了 Clickhouse 的向量化引擎,因此计算上继承了它高性能的优点。 所以做一个 HTAP 系统是一件难度非常高的事情,很考验系统的工程设计能力。 1. 另外我们目前正在研发一款专门为 TiFlash 全新设计的存储引擎,至少带来 2 倍的性能提升。可以期待一下之后出来的性能。

    3K70发布于 2019-09-02
  • 来自专栏PingCAP的专栏

    理想汽车 HTAP 读流量优化指南

    随着电动汽车业务的不断发展,公司业务既有 OLTP 也有 OLAP 的需求,因此需要一款 HTAP 数据库帮助公司实现实时业务决策。 在 TUG 企业行 —— 走进 58 同城活动中,来自理想汽车的郑赫扬老师为大家介绍了理想汽车 HTAP 读流量在物理环境、业务环境、SQL 优化、热点问题、流量环境、版本及架构等方面的优化方案。 HTAP 读流量如何优化? 1)物理环境优化 理想汽车目前把 TiDB 和 PD 集群的配置从原来的 16 核 32G 升级成了 32 核 128G。 考虑到 OLAP 业务 SQL,我们选择了 TiKV 存储引擎,这个时候在 Flink 做完计算的表再写回 TiDB 的话,有一些 AP 的 SQL 就可以变成 TP 了,像 Table Reader TiDB 的读流量优化是个全局视角,除了 SQL 本身外,官方提供了非常全面的优化手段,包括引擎、架构、执行计划、参数控制等。大家可以去按照自己的业务发展去做各种不同的尝试。

    89330发布于 2021-11-05
  • 腾讯云TDSQL:基于架构同源与HTAP引擎实现核心系统国产化替代与运维降本

    构建云上云下同源架构与HTAP智能计算引擎 为应对复杂业务场景与国产化替代需求,腾讯云TDSQL提供了一套兼具高兼容与智能化的全栈数据库产品方案: 架构云上云下同源:采用公有云、专有云与私有云同源架构, 基于代价路由的HTAP引擎:采用智能计算引擎与行列混存架构,真正实现“记、算”一体。支持可插拔式分析引擎与冷热数据分层,在应对海量并发与吞吐时实现灵活调度。 赋能金融与政企核心业务平滑演进 TDSQL已在银行、证券、保险及政务交通等行业实现大规模国产替代,其实际业务价值在多家头部机构中得到验证: 山东农商银行(解决复杂事务处理与跑批效率):通过HTAP智能优化器 中国太平 & 陕西交控(异构系统平滑迁移):分别在复杂系统中验证了针对Oracle与SQL Server的高兼容性,其中中国太平的HTAP多表关联性能达到0.3小时,顺利支撑企业IT架构无缝对接。

    14010编辑于 2026-05-31
  • 来自专栏飞总聊IT

    re:Invent 2022:亚马逊对HTAP说不!

    对的,就是标题说的,亚马逊对HTAP说不。 我们知道HTAP数据库这个概念最近几年特别的红火,很多数据库都说自己是HTAP数据库的,举个例子,比如说PingCap的TiDB,比如说OceanBase。 今年的re:Invent,亚马逊当然没有直接的说,HTAP数据库是渣渣,没有未来的。这种说法未免太粗俗了。 我们到底是需要一个HTAP产品,还是需要两个产品,然后让这两个产品之间的数据同步很迅速呢? 这看你怎么理解了。 说穿了,很多HTAP数据库,其实也可以理解成为两个产品,然后数据同步自动化了。 但是也有的HTAP产品确实只有一个引擎,同时要处理AP还有TP,这个时候,产品做tradeoff就比较困难了。Oracle算是OLTP里面的扛把子,但是OLAP做得也不差。

    64840编辑于 2023-01-10
  • 来自专栏数据和云

    GaussDB(for MySQL) HTAP VS ClickHouse对比测试

    一.什么是HTAP HTAP数据库(Hybrid Transaction and Analytical Process,混合事务和分析处理)。 HTAP只读分析节点在已有的GaussDB(for MySQL)数据库上可以创建对应的同步链路,把数据抽取到HTAP只读分析节点,数据分析是在HTAP只读分析节点中操作完成。 在数据同步过程中,HTAP只读分析节点先做一次全量同步,完成后,后续的数据是以增量的方式同步。 GaussDB(for MySQL) 3.3亿数据全量同步到自建ClickHouse实例: 开启MaterializeMySQL引擎使用: ecs-bd1c : ) SET allow_experimental_database_materialize_mysql cannot be materialized, because there is no primary keys.. 3.2.3 表过滤 表名单过滤功能,ClickHouse的MaterializeMySQL引擎不支持

    1.9K10编辑于 2022-03-20
  • 来自专栏MySQL修行 | 老叶茶馆

    基于开源应用快速构建HTAP系统

    利用ProxySQL、MySQL、ClickHouse快速构建HTAP系统 1. 构建HTAP系统 ClickHouse和ProxySQL的安装本文不再赘述,直接开始动手构建HTAP系统。下面是整体架构示意图 ? ----------------------------------------------------------------------+ ClickHouse的MaterializeMySQL引擎从 monitor"; proxysql> save mysql variables to disk; load mysql variables to runtime; 至此,一个全部基于开源应用的简易HTAP

    1.2K20发布于 2021-01-12
  • 来自专栏tjava

    TiDB 数据库 HTAP 技术 摘要

    TiDB 高级系统管理 :TiDB 数据库 HTAP 技术 要点 思考一下: 1. 异步复制 怎么保证一致性读取? 2 raft 角色有哪三种? TiDB 数据库 HTAP 概述 青铜级练习 特点1 htap 架构是什么 不修改整体结构,引入一个角色(不投票,不选举,只同步数据) tiflash cols 行列混合是2个产品。 加速本节点join 加速group by 最后汇报给tidb server 小测试 1.下面属于 HTAP 场景特点的是?(请选择 3 项) A. 在故障恢复方面可以做到 RPO = 0 B.

    96520编辑于 2022-03-16
  • 来自专栏深度学习与python

    TiDB HTAP 的架构演进及实践

    在此背景下,备受关注的数据库新理念 HTAP,会是一条“正确”的路吗? 在刚过去的 QCon 全球软件开发大会上,PingCAP 实时分析产品负责人马晓宇发表了《TiDB HTAP 的架构演进及实践》的主题演讲,它从 HTAP 的历史入手,详述了 HTAP 的技术挑战以及 首先是分享 HTAP 的历史,其次是 TP 和 AP 之间存储和计算的设计选择、HTAP 的技术挑战以及 TiDB 的应对方案,接着是 TiDB HTAP 的使用情况,最后是展望和总结。 Gartner 提出用内存来做存储介质,把 AP 和 TP 两套引擎统一,2015 年 Gartner 提出的专有名词 HTAP(Hybrid Transactional Analytical Processing 4TiDB 的使用状况 TiDB HTAP 列存 + 行存引擎发布后,到现在大约有 9 个月时间,通过 telemetry 监控剔除玩具和实验性部署之外,TiFlash 大概有 100 - 200 的使用规模

    1.4K20编辑于 2023-04-01
  • 来自专栏GreatSQL出品技术文章

    GreatSQL 构建高效 HTAP 服务架构指南(MGR)

    Primary 节点采用默认 InnoDB 引擎,Secondary 节点使用辅助引擎 Rapid 加速查询构建专属 HTAP 只读节点。 Rapid引擎作为辅助引擎,可以动态安装或卸载,为用户提供了极大的灵活性和可扩展性。 '; 为InnoDB表加上Rapid辅助引擎 greatsql> ALTER TABLE htap_test_db.orders SECONDARY_ENGINE = rapid; 将表数据一次性全量导入到 Rapid 引擎中 greatsql> ALTER TABLE htap_test_db.orders SECONDARY_LOAD; Query OK, 0 rows affected (1.72 自此构建高效 HTAP 服务器架构(MGR)完成!

    38610编辑于 2024-07-26
  • 来自专栏MySQLBeginner

    Oracle云时代MySQL HTAP解决方案

    Oracle Cloud 在2020年终于大张旗鼓的上线了推动,终于搞出来一个本地MySQL和线上MySQL大差异点云上HTAP MySQL方案:MySQL HeatWave。 在MySQL HeatWave架构下实现了数据请求单一入口,数据写入先写InnoDB,如果该表定义为Rapid引擎,同时从会InnoDB则推送给HeatWave; 对于SELECT请求,优化器会判断,如果从 HeatWave Cluster目前支持最多24个节点,每个节点最大内存420G,共9T数据,Rapid引擎数据在内存中,Youtube上有一些详细介绍 2. 表的数据需要自动用HeatWave处理的,引擎需要改为:rapid为第二个引擎,数据还是持久化在InnoDB中, 对于不支持的列需要定义加上:not secondary 参考支持的数据类型: https ,目前没办法线下部署想体验,只能用Oracle Cloud上的MySQL Service,在Oracle MySQL Service中也可以看到低于9T的数据,HTAP基本随意造了。

    1.4K90发布于 2021-02-04
领券