Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Anaconda下pip离线安装Pytorch(亲测可用)
win10 Anaconda3 python3 7 CUDA10 进入pytorch官网https pytorch org 根据自己情况选择安装 注意 我并没有在Anaconda Prompt下直接输入Run this Comman的内容
Pytorch
pip
CUDA
VSCode之C++ & CUDA极简环境配置
背景 想要了解CUDA并行计算原理 同时针对深度学习中出现一些 不支持算子 可能需要手写的需要 配置一个简单的CUDA编译环境 探索CUDA编程的范式 注 CUDA环境配置略 结果展示 示例代码 include cuda runtime h
VSCode
c
CUDA
Jetson tx2刷机过程中的坑
暑假各种事忙得差不多后 终于有时间拿出早就申请到的tx2 开始刷机教程 这两天几乎踩边了所有的坑 第一个坑 虚拟机 一般在安装VMware虚拟机时 建议的安装空间20GB 但是我从英伟达官网上下载下来的Jetpack3 1的刷机程序只有30
CUDA
VMware
3g
虚拟机
英伟达
2011年终总结——思路
By Alpha G wu 又是一年的尽头 对于本人来说 不是老了一岁 而是又长大了一岁 每一天的自己都是一个fresh的自己 更别说一年的变化有多大 大到甚至连你自己都察觉不出来 每一份年终总结似乎都差不多 2012 终结之年 的前一年也
工作
感悟
生活
思想
CUDA
解决win10下TensorFlow2.0/2.1出错:Loaded runtime CuDNN library: 7.5.0 but source was compiled with: 7.6.0
解决TensorFlow2 0 2 1出现问题 Loaded runtime CuDNN library 7 5 0 but source was compiled with 7 6 0 电脑系统及CUDA版本 本人电脑win10系统 早前
tensorflow
CUDA
GPU
cpu与gpu实现矩阵相乘对比
1 完成矩阵相乘的并行程序的实现 要求 实现2个矩阵 1024 1024 的相乘 数据类型设置为float 1 使用CPU计算 include
CUDA
CPU
GPU
并行计算
Ubuntu20.04 中已经安装 Pytorch 但 Import 报错 - 解决记录
01 问题描述 笔者使用的是 Ubuntu 20 04 3 LTS 在使用 PyTorch 训练模型的时候 torch 模块引用失败 报错信息是 OSError home wang local lib python3 8 site pack
Debug
Pytorch
深度学习
python
CUDA
gprmax3.0安装、GPU加速(cuda)配置、通过python使用gprmax的问题
gprmax3 0安装 GPU加速 cuda 配置 通过python使用gprmax的问题 一 安装过程 二 通过NVIDIA CUDA使用GPU加速功能 三 通过VS2019或VScode操纵gprmax 鉴于网上其他教程版本较低 本篇记
python
CUDA
CUDA小白 - NPP(6) 图像处理 Geometry Transforms (2)
cuda小白 原始API链接 NPP GPU架构近些年也有不少的变化 具体的可以参考别的博主的介绍 都比较详细 还有一些cuda中的专有名词的含义 可以参考 详解CUDA的Context Stream Warp SM SP Kernel B
c
CUDA
NPP
第一个CUDA程序-addVector
本文主要通过对两个浮点数组中的数据进行相加 并将其结果放入第三个数组中 其算法分别在CPU GPU上分别执行 并比较了所需时间 强烈感受到GPU的并行计算能力 这里 每个数组的元素大小为30000000个 一 实现代码 cpp view p
CUDA
三种基于CUDA的归约计算
归约在并行计算中很常见 并且在实现上具有一定的套路 本文分别基于三种机制 Intrinsic 共享内存 atomic 实现三个版本的归约操作 完成一个warp 32 大小的整数数组的归约求和计算 Intrinsic版本 基于Intrinsi
CUDA
reduce
并行计算
cuda-gdb 调试方法:cuda gdb中的可调参数
cuda gdb 中存在一些可调的参数 可以通过 set cuda lt tunable name gt
CUDA
cuda gdb
Cuda——cudaGetDeviceProperties函数及cudaDeviceProp结构体的调用
首先介绍下 cudaGetDeviceCount函数 cudaError t err cudaGetDeviceCount count 获取当前支持cuda编程的设备数目 通过count值返回 若count值为0 则初始化失败 当前设备不支
CUDA
c
开发语言
ubuntu20.4安装NVIDIA驱动,cuda
安装NVIDIA驱动准备工作 下载NVIDIA地址 xff1a https www nvidia cn Download index aspx lang 61 cn 查看是否安装好驱动命令 xff1a nvidia span class t
Ubuntu20
NVIDIA
CUDA
安装Nvidia显卡驱动和CUDA
原链接 http community bwbot org topic 152 网上看到的 xff0c 但是原链接 不过这里安装的是CUDA7 5 xff0c 现在最新的是8 0 可以到官网进行下载 xff0c 记住一定不要选择deb方式 x
NVIDIA
CUDA
显卡驱动
一文掌握Ubuntu20.04深度学习环境搭建(显卡驱动、CUDA、CUDNN、NCCL、Pytorch、PaddlePaddle)
目录 一 Ubuntu系统安装1 1 制作U盘镜像并安装1 2 安装make g 43 43 cmake1 3 安装中文输入法1 4 安装VS Code 二 深度学习环境安装2 1 切换Python版本2 2 安装英伟达显卡驱动2 3 明确
Ubuntu20
CUDA
cuDNN
NCCL
Pytorch
vscode远程调试Linux CUDA程序
参考了 xff1a CUDA 01 第一个程序 知乎 zhihu com 1 本地安装插件 xff1a remote ssh xff0c Microsoft C C 43 43 与NVIDIA Nsight Visual Studio Co
VSCode
Linux
CUDA
远程调试
一文彻底搞懂为什么OpenCV用GPU/cuda跑得比用CPU慢?
一 原因总结 最近项目需要 xff0c 发现了这个问题 网上找原因 xff0c 汇总起来 xff0c 有以下几点原因 xff1a 1 首先对于任何一个CUDA程序 xff0c 在调用它的第一个CUDA API时后都要花费秒级的时间去初始化运
opencv
GPU
CUDA
CPU
一文彻底搞懂为什么
«
1 ...
46
47
48
49
50
51
52
...54
»