K8S 部署 Hadoop 好吗？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 2014 天前的主题，其中的信息可能已经有所发展或是发生改变。

公司最近的新应用，后台本来是微服务架构，现在领导看到了 docker 和 k8s，要把现有服务器全交给 k8s 来管理编排，其实后台服务还好，不管是现在的微服务还是以前的应用，都可以用 k8s 和 docker 很好的部署应用，不过现在要把所有服务都用 k8s 来管理，我这边现有的 cdh 集群，ES 集群，spark 工程和 flink 工程全部要容器化，想问这样真的好吗？感觉会出问题，现在运维懂点 k8s，但不懂大数据的东西，我知道大数据的东西，但对 k8s 不太了解，现在领导要全员学 k8s，我只知道一些常用命令，但感觉远远不够，如果后面出问题，解决起来感觉很麻烦，请问有这样用 k8s 和 docker 来管理所有包括大数据服务的吗？

k8s

Docker

大数据

服务

13 条回复 • 2020-04-30 18:34:03 +08:00

xdays

2020-04-30 10:32:15 +08:00

用 k8s 管理有状态的服务，现在有 statefulset，但是我还是觉得比较激进。

rrfeng

2020-04-30 10:34:07 +08:00

最简单的办法，去 hadoop 官方看有无解决方案。没有就别搞。

因为 hadoop 是一个生态，包含很多组件的，要解决大量的配置问题，不是说不能，而是一般场景下你们搞不定。

TinyKube

2020-04-30 10:53:46 +08:00 via Android

用 Helm 装一下，看看需要什么依赖，有状态服务对存储卷要求比较高

buliugu

2020-04-30 11:18:45 +08:00

知乎有人测评大约有 30%的性能损失 https://zhuanlan.zhihu.com/p/52556754

hantsy

2020-04-30 11:22:50 +08:00

不用 Docker，K8s 还叫微服务？容器化基本是微服务不可缺少一部分。

zcl0621

2020-04-30 12:17:13 +08:00

hadoop 上 k8s 坑比较多, 之前弄过一个 30 个节点的 hadoop,前前后后接近 1 一个月时间服务才稳定

artandlol

2020-04-30 12:18:55 +08:00 via Android

一年前就想搞了，但是，不想踩坑

p2pCoder

2020-04-30 14:07:25 +08:00

大数数据存储计算引擎调度，这些东西有很多底层的东西，上容器坑很多，没有完善的开源解决方案
大数据存储直接上容器，没了解业内大厂有这样做过的
但是计算引擎比如 spark flink tensorflow openmpi 转向 k8s 已经是很多大厂再做的了，不过都是挺大的团队一路踩坑过来的
容器还是有很多坑的，之前推荐引擎服务上 k8s+docker，前后搞了好几个月，目前仍有一些 NN 模型在容器中跑有问题

luckyrayyy

2020-04-30 14:14:16 +08:00

计算存储好分离吗？

CoderGeek

2020-04-30 14:18:11 +08:00

只能说坑不少除非有玩的明白的运维人员要不维护头大

Beebird

2020-04-30 14:44:03 +08:00

存储很重的服务，上 kubernetes 还是不太好。我觉得首先得破除一个迷思，就是认为容器化程度越高越好。就算一定要容器化，也不一定非要放进 k8s 里。对 hadoop 来说，无论是 k8s 的 HostPath 还是 PersistentVolume，都“太灵活”了，反而增加了管理维护的成本。

kebyn

2020-04-30 17:52:13 +08:00

除了 hadoop 暂时没有原生的解决方案以外，但是官方出了另外的云原生替代器 hadoop-ozone
spark2.3 后已经有官方支持，处于 experimental 阶段 https://spark.apache.org/docs/latest/running-on-kubernetes.html
flink1.10 也已经有官方支持，也处于 experimental 阶段 https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/deployment/native_kubernetes.html
ES 有生产级别官方支持方案

pmx1990

2020-04-30 18:34:03 +08:00 via iPad

存储不太好解决，除此之外都 OK