Перейти к содержимому

Начало работы с GPU

Виртуальные машины с графическими процессорами (GPU) позволяют быстро решать задачи, связанные с машинным обучением и обработкой видео.

Важно

Для ВМ с GPU по ресурсам GPU производятся списания согласно тарифу в течение всего времени существования ВМ. Выключение виртуальной машины останавливает списания только по ресурсам vCPU и RAM.

Изначально виртуальные машины с GPU создаются без предустановленного ПО. Для использования GPU:

  1. Отключите возможность использования драйверов nouveau.

    shell
    sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf > /dev/null <<-EOF
    blacklist nouveau
    options nouveau modeset=0
    EOF
  2. Выполните обновление образа initramfs для корректной работы GPU-устройств, подключенных к ВМ.

    shell
    sudo update-initramfs -u
    shell
    sudo dracut -f
  3. Для вступления изменений в силу выполните перезагрузку ВМ — через UI либо при помощи команды reboot.

    shell
    sudo reboot
  4. Установите пакет dkms, который позволит избежать переустановки драйверов при смене версии ядра Linux.

    shell
    sudo apt-get install -y dkms
    shell
    sudo yum install -y epel-release
    sudo yum install -y dkms
  5. Скачайте и установите проприетарный NVIDIA® Driver последней версии. Версию последнего релиза можно проверить здесь.

    shell
    curl http://international.download.nvidia.com/XFree86/Linux-x86_64/535.43.02/NVIDIA-Linux-x86_64-535.43.02.run -o /tmp/NVIDIA-driver.run
    chmod +x /tmp/NVIDIA-driver.run
    sudo /tmp/NVIDIA-driver.run --dkms --no-cc-version-check --ui=none --no-questions
  6. Для проверки установки выполните команду:

    shell
    nvidia-smi

    Результат выполнения команды (пример):

    shell
    Thu May 4 07:35:45 2023
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 515.105.01 Driver Version: 515.105.01 CUDA Version: 11.7 |
    |-------------------------------+----------------------+----------------------+
    | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
    | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
    | | | MIG M. |
    |===============================+======================+======================|
    | 0 NVIDIA A100 80G... Off | 00000000:0B:00.0 Off | 0 |
    | N/A 47C P0 71W / 300W | 0MiB / 81920MiB | 22% Default |
    | | | Disabled |
    +-------------------------------+----------------------+----------------------+
    +-----------------------------------------------------------------------------+
    | Processes: |
    | GPU GI CI PID Type Process name GPU Memory |
    | ID ID Usage |
    |=============================================================================|
    | No running processes found |
    +-----------------------------------------------------------------------------+