CLIP跨语言多模态模型 pytorch下安装

2023-11-14

github地址

GitHub - openai/CLIP: Contrastive Language-Image Pretraining

创建python环境

conda create -n CLIP python=3.8

安装pytorch和torchvision

conda install --yes -c pytorch pytorch=1.7.1 torchvision cudatoolkit=11.0

下载包：ftfy regex tqdm 和CLIP

pip install ftfy regex tqdm
pip install git+https://github.com/openai/CLIP.git

应用举例

import torch
import clip
from PIL import Image

device = "cuda" if torch.cuda.is_available() else "cpu"
model, preprocess = clip.load("ViT-B/32", device=device)

image = preprocess(Image.open("clip.jpg")).unsqueeze(0).to(device)
text = clip.tokenize(["two dogs", "this is a dog", "two dogs on grass", "there are two dogs"]).to(device)
with torch.no_grad():
    image_features = model.encode_image(image)
    text_features = model.encode_text(text)

    logits_per_image, logits_per_text = model(image, text)
    probs = logits_per_image.softmax(dim=-1).cpu().numpy()

print("Label probs:", probs)

比如输入一张狗的照片

输出结果：

Label probs: [[0.2998 0.102  0.4163 0.1819]]

即这张图片属于每个描述的概率

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能

语言模型

多模态

Pytorch

CLIP跨语言多模态模型 pytorch下安装的相关文章

检查 PyTorch 张量在 epsilon 内是否相等

如何检查两个 PyTorch 张量在语义上是否相等考虑到浮点错误我想知道元素是否仅相差一个小的 epsilon 值在撰写本文时这是最新稳定版本 0 4 1 中的一个未记录的函数但文档位于master unstable branch
PyTorch 中的截断反向传播（代码检查）

我正在尝试在 PyTorch 中实现随时间截断的反向传播对于以下简单情况K1 K2 我下面有一个实现可以产生合理的输出但我只是想确保它是正确的当我在网上查找 TBTT 的 PyTorch 示例时它们在分离隐藏状态将梯度归零以及这些
PyTorch - 参数不变

为了了解 pytorch 的工作原理我尝试对多元正态分布中的一些参数进行最大似然估计然而它似乎不适用于任何协方差相关的参数所以我的问题是为什么这段代码不起作用 import torch def make covariance ma
Cuda和pytorch内存使用情况

我在用Cuda and Pytorch 1 4 0 当我尝试增加batch size 我遇到以下错误 CUDA out of memory Tried to allocate 20 00 MiB GPU 0 4 00 GiB total c
如何使用 torch.stack？

我该如何使用torch stack将两个张量与形状堆叠a shape 2 3 4 and b shape 2 3 没有就地操作堆叠需要相同数量的维度一种方法是松开并堆叠例如 a size 2 3 4 b size 2 3 b torc
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
通过 Conda 安装 PyTorch

目标使用 pytorch 和 torchvision 创建 conda 环境 Anaconda 导航器 1 8 3 python 3 6 MacOS 10 13 4 我尝试过的在Navigator中创建了一个新环境尝试安装 pyto
为什么测试时一定要用DataParallel？

在GPU上训练 num gpus设置为1 device ids list range num gpus model NestedUNet opt num channel 2 to device model nn DataParallel m
运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
PyTorch 中复数矩阵的行列式

有没有办法在 PyTorch 中计算复矩阵的行列式 torch det未针对 ComplexFloat 实现不幸的是目前尚未实施一种方法是实现您自己的版本或简单地使用np linalg det 这是一个简短的函数它计算我使用 LU
为什么 pytorch matmul 在 cpu 和 gpu 上执行时得到不同的结果？

我试图找出 numpy pytorch gpu cpu float16 float32 数字之间的舍入差异而我发现的内容让我感到困惑基本版本是 a torch rand 3 4 dtype torch float32 b torch r
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
pytorch 的 IDE 自动完成

我正在使用 Visual Studio 代码最近尝试了风筝这两者似乎都没有 pytorch 的自动完成功能这些工具可以吗如果没有有人可以推荐一个可以的编辑器吗谢谢你使用Pycharmhttps www jetbrains co
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
Fine-Tuning DistilBertForSequenceClassification：不是学习，为什么loss没有变化？权重没有更新？

我对 PyTorch 和 Huggingface transformers 比较陌生并对此尝试了 DistillBertForSequenceClassificationKaggle 数据集 https www kaggle com c
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
PyTorch：如何批量进行推理（并行推理）

如何在PyTorch中批量进行推理如何并行进行推理以加快这部分代码的速度我从进行推理的标准方法开始 with torch no grad for inputs labels in dataloader predict inputs in

随机推荐

【软件测试】自动化测试战零基础教程——Python自动化从入门到实战(五)

整理不易希望对各位学习软件测试能带来帮助第四章自动化测试模型一个自动化测试框架就是一个集成体系在这一体系中包含测试功能的函数库测试数据源测试对象识别标准以及种可重用的模块自动化测试框架在发展的过程中经历了几个阶段模块驱动
求第N个丑数

原问题描述把只包含质因子2 3和5的数称作丑数 Ugly Number 例如6 8都是丑数但14不是因为它包含质因子7 习惯上我们把1当做是第一个丑数求按从小到大的顺序的第N个丑数这个题不是很难基本上看完题就能想出解法但是要想
微信小程序连接本地服务器（在本地服务器上进行真机测试-微信开发者工具）

1 前言最近做小程序一直用的是本地服务器接口在用真机测试的时候发现动态数据并不能同步研究了一下发现操作很简单 2 配置步骤 1 首先打开微信开发者工具打开右上角的详情点击本地设置勾选下面的不校验合法域名 2 打开手机的热点
vue应用vue-pdf打包多出一个worker.js文件

项目要用到pdf预览功能因为是vue项目就是直接导入了vue pdf组件但是在进行打包的时候在dist文件夹下面多个worker js文件导致项目部署后预览pdf直接报了404 后来尝试了很多办法去解决但是都是不太好用目前有两种解
ASP.NET Core WebAPI学习-1

Web API学习 ASP NET Core WebAPI学习 1 ASP NET Core WebAPI学习 2 ASP NET Core WebAPI学习 3 ASP NET Core WebAPI学习 4 ASP NET Core W
xshell + xmanager 图形化工具使用

这里使用 Xshell6 0 Xmananger6 0工具注意很多资料说在root下 export DISPLAY 0 0 然后xhost 就可以直接连接但是在操作中始出现不了图形后来使用下面的xshell xmanager工具时
python离散事件仿真库SimPy官方教程

参考 SimPy Discrete event simulation for Python 建议先简单了解仿真原理离散事件仿真原理DES 简单介绍 simpy的实现关键在于生成器的使用通过例子说明一下生成器function use y
Python 爬虫 NO.4 HTTP 响应状态码

1 HTTP 响应状态码响应状态码即 Response Status Code 表示服务器的响应状态如 200 代表服务器正常响应 404 代表页面未找到 500 代表服务器内部发生错误在爬虫中我们可以根据状态码来判断服务器响应状
SIGIR'22

1 背景近年来因果推断在推荐广告用户增长等领域得到越来越多的关注和应用如在用户客户增长领域的消息发送和权益分发方面为了兼顾用户体验和平台效率不仅需要预估用户在接受不同权益下的转化概率还需要预估用户自然情况下未接收干预的转化
cocos2d-x屏幕适配原理分析

转自 https www 2cto com kf 201212 175527 html https blog csdn net u012861978 article details 53233892 分析 designResolutionS
QT5.11下载与安装教程

一 QT软件下载 Qt 5 9 之后的安装包与之前相比不再区分 VS 版本和 MinGW 版本而是全都整合到了一个安装包中因此与之前的安装包相比体积也是大了不少以前是 1G 多现在是 2G 多 QT5 9 0安装包 QT5 8
电商打折套路解析

1 分析出各个品牌都有多少商品参加了双十一活动这里面有个问题最后在设置分类是设置错了应该有4个类少量少打折少量大打折大量小打折大量大打折分析思路可以参考下面的思维导图 import numpy as np import p
使用Matplotlib画心形函数图

函数如下代码如下 import numpy as np import matplotlib pyplot as plt 导入模块 t np arange 6 6 0 1 x 16 np power np sin t 3 y 13 np c
labview与三菱PLC通讯研究

labview 与三菱 PLC 通讯研究一介绍Labview Labvie是实验室虚拟仪器工程工作台 Labview Virtual Instruments Engineering Workbench 的简称是美国国家仪器公司开发的虚
Spring 日志框架

Spring5 日志使用 Spring jcl 模块测试一下spring5 的默认日志实现 public class LogDemo public static void main String args Log logger LogFa
第十五届全国大学生信息安全竞赛(ciscn初赛) 部分writeup

杂项的附件地址 https share weiyun com BZyngGSZ CISCN web Ezpop misc everlasting night ez usb 问卷调查 pwn login nomal crypto 签到电台基
ICDE2020

Improving Neural Relation Extraction with Implicit Mutual Relations Jun Kuang Yixin Cao Jianbing Zheng Xiangnan He Ming
Centos虚拟机使用virt-manager创建虚拟机

目录使用virt manager 主机与centos7虚拟机的共享文件夹设置将共享文件夹中的iso文件复制到上个home iso目录下使用virt manager创建虚拟机上篇文章链接 VM下安装Ubuntu CentOS并安装配置
C#两种进程暂停和继续的方法 2021-02-16

C 两种进程暂停和继续的方法方法一方法二方法一可以使用Thread Suspend和Thread Resume这两个方法 namespace ThreadSuspended public partial class Form1 Fo
CLIP跨语言多模态模型 pytorch下安装

github地址 GitHub openai CLIP Contrastive Language Image Pretraining 创建python环境 conda create n CLIP python 3 8 安装pytorch和t

CLIP跨语言多模态模型 pytorch下安装

CLIP跨语言多模态模型 pytorch下安装 的相关文章

随机推荐

热门标签

CLIP跨语言多模态模型 pytorch下安装的相关文章