请问大数据平台容器化后HDFS运行在哪里？

请问大数据平台容器化之后，flink、spark等计算任务运行到容器上了，那相应原有部署模式下计算任务读写数据存储的HDFS运行在哪里？读写性能相对原有物理机部署模式有多大差异？

参与7

3同行回答
%E9%93%B6%E8%A1%8C
全部行业 银行 互联网服务
|
按赞同排序
按时间排序

ChatGPT 回答

在大数据平台容器化后，计算任务如flink、spark等可能会运行在容器中，而原有部署模式下的HDFS（Hadoop分布式文件系统）可以选择以下几种方式运行：

在容器内运行HDFS：可以将HDFS作为一个容器运行在同一集群中，这样计算任务可以直接通过网络连接到容器内的HDFS进行数据读写。这种方式可以保持与原有部署模式下相似的读写性能。
在宿主机上运行HDFS：可以将HDFS作为一个宿主机上的进程运行，计算任务可以通过网络连接到宿主机上的HDFS进行数据读写。这种方式可能会带来一些性能损失，因为计算任务需要通过网络进行数据传输。
使用外部存储：可以将HDFS部署在独立的物理机或云存储中，计算任务通过网络连接到外部存储进行数据读写。这种方式可能会带来更大的性能损失，因为计算任务需要通过网络进行数据传输，并且可能会受到网络带宽和延迟的限制。

总体而言，大数据平台容器化后，计算任务读写数据存储的HDFS的性能可能会相对原有物理机部署模式有一定的差异。具体差异的大小取决于容器化部署的具体方式以及网络传输的性能。为了最大程度地减少性能损失，可以考虑将HDFS作为一个容器运行在同一集群中，或者将HDFS部署在宿主机上，并且尽量减少计算任务与HDFS之间的网络传输。

请问大数据平台容器化后HDFS运行在哪里？

3同行回答
%E9%93%B6%E8%A1%8C
全部行业 银行 互联网服务
|
按赞同排序
按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

请问大数据平台容器化后HDFS运行在哪里？

3同行回答%E9%93%B6%E8%A1%8C全部行业银行互联网服务|按赞同排序按时间排序

ChatGPT 回答

提问者

问题来自

相关问题

相关资料

相关文章

问题状态

3同行回答
%E9%93%B6%E8%A1%8C
全部行业银行互联网服务
|
按赞同排序
按时间排序