Spark集群
Apache Spark(简称Spark)是专为大规模数据处理而设计的快速通用的计算引擎。GIS云套件中提供了一套已搭建好的内置Spark集群,一键开启即可使用;同时也支持外接已搭建的Spark集群,需手动配置并添加。
在GIS云套件中,Spark集群可以在以下几个场景发挥重要作用:
- Spark集群可以为分布式分析服务提供所需的计算集群服务,支撑分布式分析相关功能;
- Spark集群可以支撑将制作好的流处理模型发布为流数据服务;
- Spark集群可以支撑处理自动化服务中空间大数据分布式分析工具的运行,在运行前需在处理建模器中提前连接Spark集群。