教程

空间数据科学环境创建

站点创建

SuperMap iManager可一键空间数据科学环境站点,请参照以下步骤:

  1. 打开iManager左侧导航栏站点管理
  2. 点击+ 创建
  3. 对空间数据科学环境进行命名,并选择站点类型为空间数据科学环境

    高级选项:

    • 命名空间:为创建的站点指定命名空间,不指定则由系统分配命名空间。若指定的命名空间不存在时,将自动创建,并在删除站点时一并删除;已存在的命名空间不会被删除。
    • 数据科学服务代理外部端口:设置访问服务代理的端口号,不设置则使用随机端口。
    • Spark block manager外部端口:设置访问Spark的分布式存储系统BlockManager的端口号,不设置则使用随机端口。
    • Spark driver外部端口:设置访问Spark中的Driver的端口号,不设置则使用随机端口。
    • Spark executor外部端口:设置访问Spark中的Executor的端口号,不设置则使用随机端口。
    • Spark web ui外部端口:设置访问Spark的Web页面客户端的端口号,不设置则使用随机端口。
    • 启用服务网格:开启服务网格相关功能,可实现服务追踪、服务度量功能。启用服务网格需先将iManager部署包values.yaml文件中deploy_istio_enabled的值改为true,请参见入门->安装部署->安装iManager
    • 资源配额:设置站点可使用的CPU与内存上限。此处的CPU/内存与硬件设施CPU/内存不同,此处CPU/内存为服务节点在Kubernetes环境中占用的CPU/内存,站点总CPU/内存的计算方法为站点内所有服务节点所占CPU/内存的总和。

      • CPU(必填):设置该站点可使用的最大CPU核数。
      • 内存(必填):设置该站点可使用的最大内存。
      • Pod数量:设置该站点可容纳的最大Pod数,Pod为Kubernetes中的最小运行单位,一个Pod可由多个容器组成。
      • 默认容器CPU限制:设置单个容器创建时可用的最大CPU核数。
      • 默认容器内存限制:设置单个容器创建时可用的最大内存。

    注意:
    若站点启用了服务网格,每个服务都会自动创建istio-proxy,一个istio-proxy占用2核CPU、1GB内存,站点总CPU/内存的计算方法为站点内所有服务节点所占CPU/内存的总和加上istio-proxy占用的资源。

  4. 点击确定
  5. 在空间数据科学环境页面查看状态,当状态由正在创建变为正常,则空间数据科学环境创建成功。

初始化向导配置

访问空间数据科学环境的站点地址,首次启动时,您会进入初始化向导页面。您需配置数据科学服务的用户系统和管理员账户,当前支持两种用户系统:使用KeyCloak用户或使用操作系统用户;还需配置Notebook的运行模式,当前支持运行在本地进程中、运行在本地的Docker容器中以及运行在K8s中的Docker容器中三种方式。

initialsetupconfig

配置流程如下:

  1. 选择认证方式

用于配置数据科学服务的用户系统和管理员账户,目前支持以下两种用户系统,配置完成后点击“下一步”。

  • 使用KeyCloak用户。使用KeyCloak用户前,需有可用的KeyCloak服务。

    • KeyCloak用户到操作系统用户的映射:设置两种用户的映射关系。格式为:“keycloak用户1”:“操作系统用户1”,“keycloak用户2”:“操作系统用户2”。
    • KeyCloak地址:KeyCloak服务地址,格式为:http://ip:port
    • KeyCloak域:KeyCloak中设置的域名。例如:“jupyterhub”。
    • KeyCloak定义的客户端ID:KeyCloak中设置的客户端ID。例如:“jupyterhub”。
    • KeyCloak定义的客户端秘钥:KeyCloak中设置的客户端密钥。
    • 管理员账户:可使用KeyCloak服务中的用户。
  • 使用操作系统用户

    • 管理员账户:可使用当前操作系统中已有的含有非root权限的用户。

备注: 当前的Docker镜像中,已创建了“iserver”、“guest”两个非root权限的用户,且用户名与密码相同。

  1. 设置 Notebook 运行模式

目前提供以下三种Notebook运行模式:

  • 运行在本地进程中:在本地操作系统运行。
  • 运行在本地Docker容器:

    • 在本地的 Docker 容器中运行。
    • 数据科学服务镜像名称:所启动数据科学服务的镜像名称,默认:registry.cn-beijing.aliyuncs.com/supermap/iserver-datascience:latest。注:所填镜像必须在本地Docker环境中存在。
  • 运行在K8s中的Docker容器中:在K8s集群中运行。

设置完后,点击“下一步”。

  1. 确认初始化信息。 以上步骤配置完成后,点击“初始化”;如需修改配置,请点击“上一步”进行修改。
  2. 初始化完毕。 初始化完毕后,如果数据科学服务运行在非K8s集群的Docker容器中,需要手动重新启动,命令如下:

    docker start <containerID>
    
    参数说明:
    <containerID>是Docker容器ID。
  3. 登录数据科学服务。 根据第一步中所选的用户系统,使用该用户系统中的用户的账户密码进行登录即可。

用户创建

SuperMap iManager创建的空间数据科学环境站点,支持多用户并发访问,每个登录的用户会在站点中生成临时Pod,用户间互不干扰。站点中默认拥有两个用户,可在空间数据科学环境详情页面,点击proxy的账户进行查看。若需要更多的用户,可参照以下步骤创建:

  1. 在空间数据科学环境站点主页,点击列表中hub服务的服务名称进入容器详情页面。
  2. 打开命令行
  3. 执行以下命令添加用户(命令中的newuser为用户名,可自定义):

    adduser newuser
  4. 输入并确认用户密码。
  5. 输入新用户信息,也可点击回车键保持默认设置。
  6. 确认用户信息。

完成创建后,可直接登录使用空间数据科学环境。