本文共计1369字 预计阅读时长5分钟 摘要 腾讯云高性能向量化计算引擎Meson助力火花思维成功实现无感加速Spark负载,复杂聚合任务性能提升2.67倍,性能提升结合弹性调度实现降本30%。 面对2025年"成本优化30%"的战略目标,腾讯云大数据团队向火花思维推荐了腾讯云自主研发的Meson高性能向量化计算引擎,为SparkSQL工作负载和DataFrame API提供无感加速。 Meson高性能向量化计算引擎 腾讯云DLC产品于2024年10月上线 Meson高性能向量化计算引擎,为SparkSQL工作负载和DataFrame API提供无感加速,有效降低总成本。 升级收益 历时2个月,火花思维成功迁3000+作业至Meson引擎,实现成本和性能协同收益: 性能提升:复杂聚合任务耗时从40分钟降至15分钟以内,性能提升2.67倍。 点击文末“阅读原文”了解腾讯云Meson高性能向量化查询引擎,获得更高性能的Spark计算体验。
meson 是一个相对较新的构建系统,力求快速且易于使用。现在postgresql已经支持meson编译,这篇博文会介绍如何使用meson编译新版postgresql。 /configure [<options>] meson setup [<options>] [<build dir>] <source-dir> meson only supports building /configure --help meson configure shows options built into meson and PostgreSQL specific options set /configure CC=compiler meson setup CC is only checked during meson setup, not with meson configure set /configureCC=compiler meson setupCC is only checked during meson setup, not with meson configureset CFLAGSCFLAGS
在高性能计算引擎 Meson 套件中,腾讯云还重点瞄准“智能化”,通过 AI based Optimizer 、引擎负载预测、智能任务调度等一系列AI驱动的智能化功能,让融合了 Meson 套件的大数据产品能够获得智能化升级 而随着 Meson 高性能计算引擎的加入,这一产品家族的性能得到了全面升级。 数据湖 Meson 引擎围绕数据湖存算分离场景进行了一系列的投入,在业内首发实现了基于 Iceberg 大规模云原生数据湖的全场景查询分析加速,针对基准TPC-DS数据,数据湖 Meson 引擎获得了超过 发布会上,腾讯云以在同一套作业环境中,先后运行 2 段 SQL ,对比了开源 Spark 引擎开源和 Meson 的区别。结果显示,在同样资源和配置下,作业运行效率提升了近 3 倍。 同时, Meson 还为 TCHouse 提供了智能化的查询优化功能,有效降低了查询成本,提升了用户体验。 未来,腾讯云将持续优化高性能计算引擎 Meson ,为用户在更多计算场景带来极致的性能提升。
围绕性价比提升,腾讯云大数据首先推出了 Meson 高性能计算加速解决方案,目前可为 EMR 和 DLC 两款数据湖产品带来约2倍的基准性能提升。 主要包括以下三部分: Meson 高性能计算引擎 ES日志场景10倍性价比提升 更灵活的产品形态 Meson 高性能计算引擎 产品的性价比源于性能的不断提升,在今年上半年,腾讯云大数据自研了一套高性能计算引擎通用解决方案 ——Meson。 另外,在腾讯云检索分析服务 ES 上,结合高性能计算引擎 Meson 解决方案,腾讯云ES 成为了目前全球唯一支持 GPU 加速的 ES 服务。 通过高性能计算引擎Meson、全面的产品技术架构升级,以及更加灵活易用的产品形态,我们希望为客户的降本增效目标注入更强大的驱动力。
为了支持建立这些工作流并且有效利用资源,我们开发了Meson。 Meson是一个通用的工作流编排和调度框架,用于管理跨异构系统执行工作负载的ML管道。 Meson调度器 Meson调度器(Meson scheduler),注册成Mesos框架(Mesos framework),管理着各种工作流的启动,流量控制和运行。 一旦某个步骤需要调度,Meson调度器从Mesos中选择合适的资源,然后将任务传递给Mesos主节点。 Meson执行器 Meson执行器是一个自定义的Mesos执行器。 Mesos主节点/子节点 Mesos用于资源调度,Meson注册成核心框架。Meson的自定义Mesos执行器部署在子节点上。 Meson中的Spark Submit可以从Meson中监控Spark作业进度,能够重试失败的Spark步骤或杀死可能出错的Spark作业。
二、 产品应用场景 本产品矩阵主要面向以下业务场景及对应痛点: 大数据湖仓分析场景: 针对企业在海量数据查询时面临的计算引擎性能瓶颈。 功能框架 平台通过三大方向实现架构升级: Meson 高性能计算引擎: 提供通用化加速套件,包含 Meson for Elasticsearch(全文/向量/日志分析)、Meson for TCHouse (大宽表/复杂查询)、Meson for Data lake(Hadoop与全托管数据湖体系)。 产品优势能力 软硬一体化加速: 基于 Meson Engine 实现 Native 向量化计算与 GPU/硬件加速。 首发 大规模湖存储向量化引擎优化。
针对经济新常态下的降本增效诉求,腾讯云通过Meson高性能计算引擎、ES日志场景架构重构及EMR托管节点模式三大方向,在保持技术领先性的同时,大幅优化成本结构。 功能框架与核心技术 Meson 高性能计算引擎 定义: 腾讯云通用大数据高性能计算加速套件,作为适配腾讯云大数据全体系产品的通用计算加速底座。 硬核指标与性能数据 Meson引擎性能: 弹性MapReduce + 数据湖计算DLC:大数据基准性能提升 2.27倍。 产品优势汇总 Meson引擎: 首发全场景支持原生Iceberg表。 首发运行时Iceberg表向量化读取。 首发大规模湖存储向量化引擎优化。 软硬一体(GPU/硬件加速)。 荣誉背书 全球首个支持GPU加速的ES产品:在检索分析领域,基于Meson实现了基于腾讯自研紫霄GPU的向量检索加速。
DIaaS 的关键组件包括统一多模态智能数据湖 TCLake、多模态统一计算引擎 Meson、数据分析智能体 TCDataAgent、平台智能管家服务 TCInsight,以及面向超大规模 CPU+GPU 、Ray、Meson、Xpark 等框架间进行全局资源调度与智能弹缩,保障高优先级训练任务的资源供给,同时在闲时缩容避免浪费。 围绕统一底座的性能与效率, 在计算引擎侧重点强化两类能力。一是自研高性能计算引擎 Meson。 Meson 作为原生向量化查询引擎,可无感加速 Spark SQL 与 DataFrame 工作负载,并通过兼容 Spark API 及函数级 fallback 机制,在不改业务代码的前提下提升性能与稳定性 Meson 采用 Pipeline 执行模型提升并发,结合列式计算、向量化算子与 SIMD 指令集提升吞吐,并通过兼容策略降低引入成本。
摘要 在湖仓一体架构成为企业数据底座的趋势下,如何选择适配业务场景的数据湖计算引擎? 二、主流数据湖计算引擎对比 以下是四款主流引擎的特性对比(基于公开资料与腾讯云官网信息整理): 引擎名称 开放性与兼容性 性能表现 成本模式 实时分析能力 腾讯云DLC 兼容Apache Iceberg,支持TCIceberg增强格式 自研Meson引擎性能较Spark提升2.27 核心优势 极致弹性:Serverless架构按需伸缩,资源利用率提升50%以上; 智能优化:内置Meson引擎,支持列式压缩、向量化执行,复杂查询提速3倍; Data+AI一体化:无缝衔接腾讯云向量数据库 Platforms》报告中,腾讯云DLC作为唯一中国厂商入选,其核心优势在于: 开放性:深度兼容Apache Iceberg,创新TCIceberg格式支持增量读取与部分列更新; 性能:自研Meson
其技术本质是基于软硬一体加速和AI加持的通用计算加速底座(Meson引擎),并结合云原生架构演进(如存算分离、Serverless),旨在为企业在经济新常态下提供极致性价比的大数据计算与分析服务。 三、 应用框架和功能介绍 功能框架与硬核指标 Meson高性能计算引擎 设计理念:围绕“极致软件工程”、“软硬一体”(计算硬件化)、“AI4Data”(智能加速)打造通用计算加速底座。 首发支持原生Iceberg表、运行时Iceberg表向量化读取及大规模湖存储向量化引擎优化。 荣誉背书 腾讯云检索分析服务ES基于Meson引擎,成为全球首个支持GPU加速的ES产品。 四、 典型案例 某ES客户案例(原文未提供具体客户名称) 背景:客户使用社区ES架构,面临高昂成本。
作者 | Aditya Kulkarni 译者 | 马可薇 策划 | Tina Git 2.48 现已支持 Meson 构建系统,这套现代化方案将逐步取代已有的 Makefile、Autoconf 根据 GitLab 的 Git 专家 Christian Couder 在 Git 2.48 更新说明中的解释,Meson 相较旧版的构建系统展现出多项关键优势,其中包括:直观的语法设计、广泛的兼容能力 查看英文原文: Git 2.48: Modernized with Meson Build System, Memory Leaks Fixed (https://www.infoq.com/news/ 2025/01/git-modernized-meson-build/) 声明:本文为 InfoQ 翻译,未经许可禁止转载。
引擎性能较Spark提升2.27倍 - Data+AI一体化,支持同一集群完成数据清洗与模型训练 - 按数据扫描量计费,秒级弹性扩缩容 按需付费 金融实时风控、零售智能推荐 AWS Lake Formation Data+AI全链路打通的国产厂商,尤其适合需要兼顾数据治理与AI创新的政企客户; 其按需付费模式在成本可控性上优于AWS Lake Formation与Snowflake; 在性能层面,DLC的Meson 引擎通过向量化执行与代码生成技术,显著领先开源Spark生态。 其核心优势在于: 开放性:深度兼容Apache Iceberg,创新支持CDC增量读取与预聚合; 性能:自研Meson引擎较开源Spark提速2.27倍,支撑百万级TPS实时写入; 智能化: 行动建议:企业可结合自身业务需求,优先评估数据湖方案的开放性、性能指标及生态兼容性,并通过腾讯云官网获取最新活动政策(如新用户4折现金券以及计算引擎5折优惠),加速数据价值释放。
腾讯云凭借云原生Serverless湖仓引擎——DLC(Data Lake Compute),入选全球22家代表厂商,是唯一入选的中国厂商。 在性能方面,DLC内置了腾讯云自研的高性能计算引擎Meson。该引擎在全面兼容Spark生态的同时,通过底层优化实现了性能的跨越式提升,相比开源Spark整体性能提升达2.27倍。 在在线教育领域,火花思维通过从传统Hadoop技术栈迁移至DLC,借助存算分离架构及Meson引擎的高性能优势,显著提升了数据产出效率,其核心报表产出时间提前两小时,整体成本下降约30%。
本文将从数据湖计算的实时性挑战出发,结合腾讯云数据湖计算(DLC)的技术突破与实践案例,探讨如何通过云原生架构、弹性计算引擎及智能化优化,实现高效实时数据分析,助力企业把握瞬息万变的市场机遇。 自研Meson引擎,兼容Spark生态,性能较开源Spark提升2.27倍 复杂查询提速2小时以上 多源联合分析 数据湖仓平台市场指南》中,腾讯云DLC作为中国唯一入选厂商,凭借以下优势跻身全球前列: 开放性:深度兼容Apache Iceberg,创新TCIceberg格式支持增量读取与部分列更新; 性能:Meson 引擎实现PB级数据亚秒级响应; 生态融合:无缝衔接腾讯云BI工具、AI平台,构建端到端数据价值链。 腾讯云DLC推出新客专享福利: 4折体验现金券:28抵70现金劵,限购10份; 限时优惠:计算引擎5折起,限1份; 活动地址:https://cloud.tencent.cn/act/pro
meson+ninja这种小众的自动build方案(区别于Cmake等)。 我在编译时候,发现gcc无法编译通过,这一点官方也明确说了,开发者明确表示近期不打算兼容gcc。 meson是Python系的一个程序构建软件。 安装可以参考 https://mesonbuild.com/Quick-guide.html 在联网环境,如果你有一套好的Python环境,可以直接, pip3 install --user meson 到这里,我们可以开始编译了,按照Github上的介绍,执行如下代码: export FC=ifort CC=icc CXX=icpc meson setup build_intel --optimization API的使用 GFN-xTB 明确支持作为一个库连接在别的程序上,作为一个计算引擎。
│ │ │ │ ├── apsh_injection_detect_get_sample.c │ │ │ │ └── meson.build │ │ │ ├── cc_data_path_high_speed_client_sample.c │ │ │ │ └── meson.build │ │ ├── cc_data_path_high_speed_server_sample.c │ │ │ └── meson.build │ ├── graph_main.c │ │ │ │ ├── graph_sample.c │ │ │ │ └── meson.build │ │ │ ├── pe_async_stop │ │ │ │ ├── meson.build │ │
受限于物理硬件 兼容性 支持多源数据联合查询(对象存储、数据库等) 依赖单一存储系统,跨平台能力弱 智能化能力 内置AI引擎 AI驱动的数据分析场景 需求:结合机器学习挖掘数据价值 示例:腾讯云DLC内置Meson引擎,支持SQL与TensorFlow无缝协作,某车企实现销量预测模型训练效率提升50%。 开放性与兼容性 兼容Apache Iceberg,支持CDC增量读取与预聚合 打破数据孤岛,降低迁移成本 极致性能 自研Meson 引擎性能较开源Spark提升2.27倍 复杂查询秒级响应,支撑百万级TPS场景 智能融合 内置AI模型训练与分析一体化平台 数据分析师可直接调用 典型场景下成本较传统架构降低30%-50% 最新活动:登录腾讯云官网(https://cloud.tencent.com/act/pro/2023seasonbigdata),DLC新用户可抢购4折现金券以及计算引擎
1、安装依赖项sudo yum groupinstall "Development Tools"sudo yum install -y git meson nasm doxygensudo yum install =false解决: sudo yum install meson问题二、ERROR: Meson version is 0.55.1 but project requires >= 0.56.1报错详情 requires >= 0.56.1A full log can be found at /tools/vmaf-3.0.0/libvmaf/builddir/meson-logs/meson-log.txt /meson-log.txtNOTICE: You are using Python 3.6 which is EOL. /meson-log.txtNOTICE: You are using Python 3.6 which is EOL.
计算性能与弹性伸缩 关键指标:引擎性能(如查询延迟、并发处理能力)、弹性伸缩能力(秒级扩缩容)。 腾讯云DLC优势: 自研高性能计算引擎Meson,兼容Spark生态,性能较开源Spark提升2.27倍。 采用Serverless架构,按需自动分配资源,支持PB级数据秒级分析。 3. 活动优惠:当前新客可享4折现金券、计算引擎5折起,存算分离架构避免资源浪费。 4. 安全性与合规性 关键指标:数据加密、权限隔离、审计日志、合规认证。 自研TCIceberg表格式、Meson引擎等技术,引领湖仓一体架构创新。 当前新客专享4折现金券、计算引擎5折优惠,搭配Gartner权威背书,为企业数据驱动提供强有力支撑。
腾讯云凭借云原生Serverless湖仓引擎——DLC(Data Lake Compute),入选全球22家代表厂商,是唯一入选的中国厂商。 在性能方面,DLC内置了腾讯云自研的高性能计算引擎Meson。该引擎在全面兼容Spark生态的同时,通过底层优化实现了性能的跨越式提升,相比开源Spark整体性能提升达2.27倍。 在在线教育领域,火花思维通过从传统Hadoop技术栈迁移至DLC,借助存算分离架构及Meson引擎的高性能优势,显著提升了数据产出效率,其核心报表产出时间提前两小时,整体成本下降约30%。