添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

在 Google Compute Engine 上的 Docker 容器中安装并运行

本节介绍如何在 Google Compute 环境中使用 Docker 容器来 从头开始 安装并运行 Driverless AI。

此安装假设您已有 Google Cloud Platform 帐户。如果您还没有帐户,可前往 https://console.cloud.google.com/getting-started 创建帐户。此外,请参阅 Google 的 机器类型文档 ,了解关于 Google Compute 机器类型的信息。

点击 此处 观看安装视频 。请注意,此视频中的某些图像可能因版本而异,但安装步骤仍相同。

开始前

如果您是首次尝试使用 GCP 并且刚刚创建了帐户,请检查您的 Google Compute Engine (GCE) 资源配额限制。默认情况下,GCP 最多分配 8 个 GPU,也可不分配 GPU。您可以更改这些设置以匹配配额限制,或者您可以从 GCP 请求更多资源。请参阅 https://cloud.google.com/compute/quotas ,了解更多信息,包括关于如何检查配额及请求额外配额的信息。

安装步骤

  • 在浏览器中,前往 https://console.cloud.google.com/ 登录至 Google Compute Engine 控制台。

  • 在左侧导航面板中,选择 Compute Engine > 虚拟机实例

  • 此实例的唯一名称。

  • 所需的 区域 。请注意,并非所有区域和用户帐户均能选择带有 GPU 实例的区域。请参阅以下内容,了解如何添加 GPU: https://cloud.google.com/compute/docs/gpus/

  • 受支持的操作系统,例如 Ubuntu 16.04。务必也并将操作系统映像的磁盘大小增加至 64 GB。

  • 完成后,在表单底部点击 创建 。此操作将创建新的虚拟机实例。

  • 目标 下拉框更改为 此网络中的所有实例

  • 源 IP 范围 指定为 0.0.0.0/0

  • 协议和端口 下,选择 指定的协议和端口 并输入以下内容: tcp:12345 .

  • 完成后,在表单底部点击 创建

  • 在虚拟机实例页面,通过在 SSH 下拉框中选择 在浏览器窗口打开 ,以使用 SSH 连接至新建虚拟机实例。

  • H2O 为您提供可在虚拟机实例中运行的脚本。在虚拟机实例中打开一个编辑器(例如,vi)。复制下方脚本之一(取决于是运行 GPU 还是 CPU)。将脚本保存为 install.sh

  • # SCRIPT FOR GPUs ONLY
    apt-get -y update
    apt-get -y --no-install-recommends install \
      curl \
      apt-utils \
      python-software-properties \
      software-properties-common
    add-apt-repository -y ppa:graphics-drivers/ppa
    add-apt-repository -y "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
    curl -fsSL https://download.docker.com/linux/ubuntu/gpg | apt-key add -
    apt-get update
    apt-get install -y \
      nvidia-384 \
      nvidia-modprobe \
      docker-ce
    curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
      sudo apt-key add -
    distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
    curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
      sudo tee /etc/apt/sources.list.d/nvidia-docker.list
    sudo apt-get update
    # Install nvidia-docker2 and reload the Docker daemon configuration
    sudo apt-get install -y nvidia-docker2
    
    # SCRIPT FOR CPUs ONLY
    apt-get -y update
    apt-get -y --no-install-recommends install \
      curl \
      apt-utils \
      python-software-properties \
      software-properties-common
    add-apt-repository -y "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
    curl -fsSL https://download.docker.com/linux/ubuntu/gpg | apt-key add -
    apt-get update
    apt-get install -y docker-ce
    
  • https://www.h2o.ai/download/ 检索 Driverless AI Docker 映像。

  • 加载 Driverless AI Docker 映像。以下示例展示如何加载 Driverless AI。将 VERSION 替换为您的映像。

  • sudo docker load < dai-docker-centos7-x86_64-1.10.1.2.tar.gz
    
  • 如果您是运行 CPU,则可跳过此步骤。否则,您必须启用 GPU 的持久模式。请注意,每次重启后需执行此操作。更多信息,请参阅:http://docs.nvidia.com/deploy/driver-persistence/index.html

  • sudo nvidia-smi -pm 1
    
  • 启动 Driverless AI Docker 映像,并将下方标签替换为映像标签。根据您所安装的版本,使用 docker run --runtime=nvidia (>= Docker 19.03) 或 nvidia-docker (< Docker 19.03) 命令。请参阅 数据连接器,了解如何将 GCS 和 GBQ 数据连接器添加至您的 Driverless AI 实例。

  • 请注意:可使用 docker version 来检查您使用的 Docker 版本。

     # Start the Driverless AI Docker image
     docker run --runtime=nvidia \
       --pid=host \
       --init \
       --rm \
       --shm-size=256m \
       -u `id -u`:`id -g` \
       -p 12345:12345 \
       -v `pwd`/data:/data \
       -v `pwd`/log:/log \
       -v `pwd`/license:/license \
       -v `pwd`/tmp:/tmp \
       h2oai/dai-centos7-x86_64:1.10.1-cuda11.2.2.xx