在 python docker 镜像上使用 GPU

2024-04-12

我正在使用一个python:3.7.4-slim-busterdocker 镜像，我无法更改它。我想知道如何使用我的英伟达 GPU on it.

我通常用一个tensorflow/tensorflow:1.14.0-gpu-py3并用一个简单的--runtime=nvidia整数docker run命令一切正常，但现在我有这个限制。

我认为这种类型的图像不存在快捷方式，因此我遵循了本指南https://towardsdatascience.com/how-to-properly-use-the-gpu-within-a-docker-container-4c699c78c6d1 https://towardsdatascience.com/how-to-properly-use-the-gpu-within-a-docker-container-4c699c78c6d1，构建它建议的 Dockerfile：

FROM python:3.7.4-slim-buster

RUN apt-get update && apt-get install -y build-essential
RUN apt-get --purge remove -y nvidia*
ADD ./Downloads/nvidia_installers /tmp/nvidia                             > Get the install files you used to install CUDA and the NVIDIA drivers on your host
RUN /tmp/nvidia/NVIDIA-Linux-x86_64-331.62.run -s -N --no-kernel-module   > Install the driver.
RUN rm -rf /tmp/selfgz7                                                   > For some reason the driver installer left temp files when used during a docker build (i dont have any explanation why) and the CUDA installer will fail if there still there so we delete them.
RUN /tmp/nvidia/cuda-linux64-rel-6.0.37-18176142.run -noprompt            > CUDA driver installer.
RUN /tmp/nvidia/cuda-samples-linux-6.0.37-18176142.run -noprompt -cudaprefix=/usr/local/cuda-6.0   > CUDA samples comment if you dont want them.
RUN export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64         > Add CUDA library into your PATH
RUN touch /etc/ld.so.conf.d/cuda.conf                                     > Update the ld.so.conf.d directory
RUN rm -rf /temp/*  > Delete installer files.

但它会引发一个错误：

ADD failed: stat /var/lib/docker/tmp/docker-builder080208872/Downloads/nvidia_installers: no such file or directory

我可以更改什么才能轻松让 docker 映像看到我的 GPU？

TensorFlow 图像分为几个“部分”Dockerfile。其中之一 https://github.com/tensorflow/tensorflow/blob/v2.3.0/tensorflow/tools/dockerfiles/partials/ubuntu/nvidia.partial.Dockerfile包含 TensorFlow 在 GPU 上运行所需的所有依赖项。使用它你可以轻松创建自定义图像，你只需要将默认的 python 更改为你需要的任何版本。在我看来，这比将 NVIDIA 的东西引入 Debian 映像（据我所知，CUDA 和/或 cuDNN 并未正式支持）要容易得多。

这是 Dockerfile：

# TensorFlow image base written by TensorFlow authors.
# Source: https://github.com/tensorflow/tensorflow/blob/v2.3.0/tensorflow/tools/dockerfiles/partials/ubuntu/nvidia.partial.Dockerfile
# -------------------------------------------------------------------------
ARG ARCH=
ARG CUDA=10.1
FROM nvidia/cuda${ARCH:+-$ARCH}:${CUDA}-base-ubuntu${UBUNTU_VERSION} as base
# ARCH and CUDA are specified again because the FROM directive resets ARGs
# (but their default value is retained if set previously)
ARG ARCH
ARG CUDA
ARG CUDNN=7.6.4.38-1
ARG CUDNN_MAJOR_VERSION=7
ARG LIB_DIR_PREFIX=x86_64
ARG LIBNVINFER=6.0.1-1
ARG LIBNVINFER_MAJOR_VERSION=6

# Needed for string substitution
SHELL ["/bin/bash", "-c"]
# Pick up some TF dependencies
RUN apt-get update && apt-get install -y --no-install-recommends \
        build-essential \
        cuda-command-line-tools-${CUDA/./-} \
        # There appears to be a regression in libcublas10=10.2.2.89-1 which
        # prevents cublas from initializing in TF. See
        # https://github.com/tensorflow/tensorflow/issues/9489#issuecomment-562394257
        libcublas10=10.2.1.243-1 \ 
        cuda-nvrtc-${CUDA/./-} \
        cuda-cufft-${CUDA/./-} \
        cuda-curand-${CUDA/./-} \
        cuda-cusolver-${CUDA/./-} \
        cuda-cusparse-${CUDA/./-} \
        curl \
        libcudnn7=${CUDNN}+cuda${CUDA} \
        libfreetype6-dev \
        libhdf5-serial-dev \
        libzmq3-dev \
        pkg-config \
        software-properties-common \
        unzip

# Install TensorRT if not building for PowerPC
RUN [[ "${ARCH}" = "ppc64le" ]] || { apt-get update && \
        apt-get install -y --no-install-recommends libnvinfer${LIBNVINFER_MAJOR_VERSION}=${LIBNVINFER}+cuda${CUDA} \
        libnvinfer-plugin${LIBNVINFER_MAJOR_VERSION}=${LIBNVINFER}+cuda${CUDA} \
        && apt-get clean \
        && rm -rf /var/lib/apt/lists/*; }

# For CUDA profiling, TensorFlow requires CUPTI.
ENV LD_LIBRARY_PATH /usr/local/cuda/extras/CUPTI/lib64:/usr/local/cuda/lib64:$LD_LIBRARY_PATH

# Link the libcuda stub to the location where tensorflow is searching for it and reconfigure
# dynamic linker run-time bindings
RUN ln -s /usr/local/cuda/lib64/stubs/libcuda.so /usr/local/cuda/lib64/stubs/libcuda.so.1 \
    && echo "/usr/local/cuda/lib64/stubs" > /etc/ld.so.conf.d/z-cuda-stubs.conf \
    && ldconfig
# -------------------------------------------------------------------------
#
# Custom part
FROM base
ARG PYTHON_VERSION=3.7

RUN apt-get update && apt-get install -y --no-install-recommends --no-install-suggests \
          python${PYTHON_VERSION} \
          python3-pip \
          python${PYTHON_VERSION}-dev \
# Change default python
    && cd /usr/bin \
    && ln -sf python${PYTHON_VERSION}         python3 \
    && ln -sf python${PYTHON_VERSION}m        python3m \
    && ln -sf python${PYTHON_VERSION}-config  python3-config \
    && ln -sf python${PYTHON_VERSION}m-config python3m-config \
    && ln -sf python3                         /usr/bin/python \
# Update pip and add common packages
    && python -m pip install --upgrade pip \
    && python -m pip install --upgrade \
        setuptools \
        wheel \
        six \
# Cleanup
    && apt-get clean \
    && rm -rf $HOME/.cache/pip

您可以从这里获取：将 python 版本更改为您需要的版本（Ubuntu 存储库中提供），添加软件包、代码等。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 python docker 镜像上使用 GPU 的相关文章

Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
在python中查找文件

我有一个文件可能位于每个用户计算机上的不同位置有没有办法实现文件的搜索我可以传递文件名和目录树进行搜索的方法吗 os walk http docs python org library os html os walk就是答案这将找到第
如何使用Python内置的map和reduce函数计算字符串中的字母频率

我想使用Python的map和reduce内置函数来计算字符串中字母的频率谁能提供一些关于我如何做到这一点的见解到目前为止我所得到的 s the quick brown fox jumped over the lazy dog Map
Python套接字模块：Recv()数据响应被切断

解释我目前正在尝试使用 python 脚本控制智能电源板为了实现这一点我使用了带有套接字模块的 TCP 连接大约 75 的情况下我会得到我正在寻找的响应数据并且一切都运行良好然而大约 25 的情况下响应会以完全相同的长度
ConfigParser 从 INI 文件中获取值，如下所示

我有以下类型的 INI 文件 section1 subsection1 port 989 section1 subsection2 somethign somethign 我正在使用 Python 的 ConfigParser 来解析 IN
Python：将字典转换为字节

我正在尝试将字典转换为字节但在将其转换为正确的格式时遇到问题首先我尝试使用自定义架构映射字典模式定义如下 class User def init self name None code None self name name sel
在 pyspark 中实现递归算法以查找数据帧中的配对

我有一个火花数据框 prof student df 列出了时间戳的学生教授对每个时间戳有 4 位教授和 4 位学生每个教授学生对都有一个分数因此每个时间范围有 16 行对于每个时间范围我需要找到教授学生之间的一对一配对以
隐藏控制台窗口

problem 我开始使用 Python 和 Tkinter 设计 GUI 应用程序当我使用 cxFreeze 冻结脚本时然后当我在计算机上运行该 EXE 文件时然后首先打开控制台窗口在 Windows XP 中为黑色 DOS sh
绘制顶部有函数线的直方图

我正在尝试使用 SciPy 进行统计使用 matplotlib 进行绘图在 Python 中进行一些分布绘图和拟合我在创建直方图等方面运气很好 seed 2 alpha 5 loc 100 beta 22 data ss gamma
请求库在 HTTPS 代理 CONNECT 上强制使用 HTTP/1.1

我遇到了 HTTP 代理服务器行为异常的问题不幸的是我无法控制代理服务器它是 IBM 的企业产品代理服务器是用于软件测试的服务虚拟化解决方案的一部分根本问题我认为是代理服务器发回 HTTP 1 0 响应我可以从 SOAP
python 正则表达式：匹配空格字符或字符串结尾

我想匹配文本中的空格字符或字符串结尾 import re uname abc assert re findall s s uname uname assert re findall s s uname uname aa assert not
scikit-learn：SVC 和 SGD 有什么区别？

SVM http scikit learn org stable modules svm html classification http scikit learn org stable modules svm html classific
从一个 numpy 数组中删除另一个 numpy 数组中的元素的有效方法

从一个 numpy 数组中删除另一个数组中的元素的最佳方法是什么本质上我是在追求np delete 其中数组的顺序并不重要 import numpy as np a np array 2 1 3 print a b np array 4
是否可以通过 MX 查找获取端口？

我正在了解什么是的旅程从 Python 代码发送电子邮件的正确方法 https stackoverflow com questions 50695188 what is the proper way to actually send mai
在包含一些通配符的大型列表中进行成员资格测试

当列表包含特殊类别时如何测试某个短语是否在大型 650k 短语列表中例如我想测试这个短语是否 he had the nerve 在列表中确实如此但是在 he had DETERMINER nerve where DETERMINE
如何组合多个 TUI 表单来编写更复杂的应用程序？

我想写一个程序T基于外部的User I界面 TUI https en wikipedia org wiki Text based user interface 由多种形式组成第一种形式包含一个列表每个列表元素代表一个按钮如果按下相应
Python opencv排序轮廓[重复]

这个问题在这里已经有答案了我正在关注这个问题如何从左到右从上到下对轮廓进行排序 https stackoverflow com questions 38654302 how can i sort contours from left
带有 unicode 键的字典

Python 中是否可以使用 Unicode 字符作为字典的键我使用 Unicode 中的西里尔字母作为键当尝试通过键获取值时我得到以下回溯 Traceback most recent call last File baseCreat
yum update / apk update / apt-get update 在代理后面不起作用

我使用代理无法构建 Docker 映像我尝试过FROM ubuntu FROM centos and FROM alpine but apt get update yum update apk update failed 我的主机操作系
如何使用 Python 将表格从 CSV 写入 PDF [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个CSV文件包含下表 users passwords company Admin test psw test cmp test

随机推荐

请告诉我如何打开4d数据库？

我尝试打开使用 4d v12 扩展名为 4dc 的数据库此外还有扩展名为 4dd 和 4dr 的文件结果是错误您无法转换已编译的数据库也许这是数据库的旧版本但我找不到任何可以将其转换为新版本的内容我的目标是从数据库中获取信息
Android 应用无法获取位置权限

我的清单中有以下内容
哪种 Java 集合认为排列是相等的？

我想创建可能包含重复值的集合没有特定的顺序换句话说 1 1 2 2 1 1 1 2 1 事实上我想要一组这些集合所以如果我尝试添加这两个集合 1 1 2 and 2 1 1 第二 add 实际上不会做任何事情是否有一个标准集合已经
按最高值对字典进行排序？ [复制]

这个问题在这里已经有答案了我有一个带有字符串键和整数值的字典有什么方法可以获取这个字典并使用它来获取从最高值到最低值的键列表 Example gt gt gt myDict seven 7 four 4 one 1 two 2 five
无法绑定到“routerLink”，因为它不是“a”的已知属性[重复]

这个问题在这里已经有答案了我正在将我们的一个应用程序从 rc4 更新到 angular2 0 0 但在运行时出现模板解析错误这是我的视图模板 div class col xs 3 quick link a div class tile
为什么打印 int[] 时会得到垃圾输出？

我的程序应该计算文件中每个字符的出现次数忽略大小写我写的方法是 public int getCharTimes File textFile throws FileNotFoundException Scanner inFile new
HBase Java 客户端 - 未知主机：localhost.localdomain

版本 Hadoop 2 0 0 cdh4 3 1 HBase 0 94 6 cdh4 3 1 我正在运行cloudera快速启动vm 一切都在172 16 144 150上运行这是我的小HBase Java客户端 HbaseClient
C 链接错误：未定义对“main”的引用

我试图将多个 C 程序链接在一起但收到错误响应 gcc o runexp o scd o data proc o lm fopenmp usr lib gcc x86 64 linux gnu 4 6 x86 64 linux gnu c
MySQL 错误代码：1005

我正在尝试将外键添加到我的表中但收到此错误错误代码 1005 无法创建表 william sql 88c 3 errno 150 我有3张桌子员工客户和合同员工 employee no PK 客户 customer id PK 合
opencv误差乘以2 Mat的

我在 opencv 中将 2 个矩阵 Mat 对象相乘以下是第一个 Mat 的生成方式 cv Mat R m k CV 8UC1 rm generateRandomMatrix m k 255 R 第二个是如何生成的 for int i
在 __init__ word=self.search_box.text AttributeError: 'NoneType' 对象没有属性 'text'

我正在制作一个应用程序据我所知我做得正确但仍然收到此错误字 self search box text AttributeError NoneType 对象没有属性 text 我已经检查了拼写错误和其他常见错误但它仍然不起作用这是
将单列转换为多列

我有这个功能 function renderListSelecoes data JAX RS serializes an empty list as null and a collection of one as an object not
rxjs asapscheduler 的执行顺序

考虑到我有以下代码 let Rx window rxjs const of queueScheduler asapScheduler asyncScheduler animationFrameScheduler Rx const obser
React / React-DOM 包依赖冲突

每次尝试运行时我都会遇到此错误消息npm 更新 npm ERR code ERESOLVE npm ERR ERESOLVE unable to resolve dependency tree npm ERR npm ERR While r
生成较大数字的概率较小的随机数

我想实现一个随机数生成器它可以让我设置我想要的最大数字但也可以让我调整概率以使其更难获得更大的数字使用此选项会将相同的概率分配给 100 范围内的任何值 Math floor Math random 100 当数字接近极限 100 时
Java GAE 任务队列 CallNotFoundException

当尝试实现推送队列时我收到以下错误 com google apphosting api ApiProxy CallNotFoundException Can t make API call taskqueue BulkAdd in a t
如何解决“Web 编译器在compilerconfig.json 中发现错误”的问题？

在尝试使用 Visual Studio 2017 重新编译解决方案中的所有文件时我收到以下无信息的错误消息 Web 编译器在compilerconfig json 中发现错误首先解决方案中存在多个compilerconfig json
Java Netbeans 错误找不到符号，符号：类输出，位置：类系统，预期，类型开始非法

我的驱动程序类中的 Netbeans 中出现错误 System out print Time waited is serializedTime System currentTimeMillis 1000 secs 错误是找不到符号符号
基于 R 中的分组变量创建序列[重复]

这个问题在这里已经有答案了我正在寻找一种方法来创建一个数字序列 C 每次字符串在 A 中发生变化时该序列都会升序这取决于分组变量 B 例子 A B C a1 1 1 a1 1 1 a1 1 1 a10 1 2 a10 1 2 a2 1
在 python docker 镜像上使用 GPU

我正在使用一个python 3 7 4 slim busterdocker 镜像我无法更改它我想知道如何使用我的英伟达 GPU on it 我通常用一个tensorflow tensorflow 1 14 0 gpu py3并用一个简单

在 python docker 镜像上使用 GPU

在 python docker 镜像上使用 GPU 的相关文章

随机推荐

热门标签