首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Impala查询性能

Impala查询性能
EN

Stack Overflow用户
提问于 2017-03-31 09:07:05
回答 1查看 906关注 0票数 1

我正在POC环境中运行,其中只有一个名称节点和一个数据节点正在运行。Impala守护进程正在数据节点上运行。这两个节点都有128 of内存。我已经将mem_limit设置为60 to。

我在黑帕拉有两张大桌子。第一个表约有6.35亿个记录,第二个表约有250000个记录。我使用一个公共参数将这两个表连接起来。SQL语句如下所示:

代码语言:javascript
复制
select a.*, b.* from table_a a inner join table_b b on a.param=b.param order by a.t_date desc

当我使用解释时,它显示了估计的每个主机的需求: Memory=992.03MB VCores=2.当我运行这个查询时,花了一个多小时,结果还没有返回。我想知道为什么要花这么长时间。这与mem_limit设置有关吗?我怎样才能调优这种查询?

EN

回答 1

Stack Overflow用户

发布于 2017-04-21 03:39:16

尝试以黑斑羚性能的形式进行调优

一些理想

  • 尝试big_table连接small_table
  • param列上的分区
  • 如果同时执行多个查询,则应启用接纳控制(2)和动态资源库(3)。
  • 在黑斑羚中执行查询后,尝试执行summary,以查看哪些步骤需要很长时间。
  • 并请张贴所有解释声明的结果

P/S:对不起,因为我的声誉不足以发布超过两个链接。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43136727

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档