hadoop - 在我们的发现集群中提高 yarn 容器利用率的建议

当前设置

  • ,我们有10个节点发现集群。
  • 该集群的每个节点都有24个核心和264 GB内存,为后台进程保留一些内存和CPU,我们计划使用240 GB内存。
  • 现在,在谈到容器设置时,由于每个容器可能需要1个核心,因此
  • 最多可以有24个容器,每个容器具有10GB内存。
  • 通常,群集的容器具有1-2 GB的内存,但是我们受到可用的内核的限制,或者我可能缺少

  • 问题陈述
  • 作为我们的集群已被数据科学家和分析师广泛使用,仅拥有24个容器是不够的。这导致大量的资源争用。
  • 有什么方法可以增加容器数量?

  • 我们正在考虑的选项
  • 如果我们要求团队运行多个tez查询(不单独进行),而是在一个文件中运行,那么我们最多将保留一个容器。

  • 请求
  • 还有其他方法可以管理我们的发现集群。
  • 是否有可能减小容器大小。
  • vcore(因为这是一个逻辑概念)可以被多个容器共享吗?
  • 最佳答案

    除非您使用YARN with CGroups并启用了yarn.nodemanager.resource.percentage-physical-cpu-limit,否则Vcore只是一个逻辑单元,与CPU内核无关。大多数任务很少受CPU约束,而更常见的是受网络I / O约束。因此,如果要查看群集的总体CPU使用率和内存使用率,则应该能够根据浪费的(备用)容量来调整容器的大小。

    您可以使用许多工具来衡量利用率,但是sargangliagrafana是显而易见的工具,但是您也可以查看Brendan Gregg的Linux Performance tools了解更多想法。

    https://stackoverflow.com/questions/55255515/

    相关文章:

    docker - docker 错误FATA [0000]获取http:///var/run/doc

    hadoop - 如何在Hortonworks Sandbox中编译WordCount.java?

    hadoop - 从 View 创建表存储为文本文件时出错

    macos - 从其他物理机访问Docker容器IP

    hadoop - 更改表列名称拼写格式Hadoop

    docker - 权限被拒绝:docker-machine create

    docker - ssh进入boot2docker-您可以从boot2docker vm中看到-v文

    java - 无法从 PHP 执行 Hadoop Jar

    docker - 我必须创建一个隧道来访问另一台主机上的 docker 容器吗?

    installation - fedora 20(32位)上的Docker无法正常工作