pytorch:把图片数据转化成tensor |
您所在的位置:网站首页 › jpegimagefile › pytorch:把图片数据转化成tensor |
摘要: 在图像识别当中,一般步骤是先读取图片,然后把图片数据转化成tensor格式,再输送到网络中去。本文将介绍如何把图片转换成tensor。 一、数据转换把图片转成成torch的tensor数据,一般采用函数:torchvision.transforms。通过一个例子说明,先用opencv读取一张图片,然后在转换;注意一点是:opencv储存图片的格式和torch的储存方式不一样,opencv储存图片格式是(H,W,C),而torch储存的格式是(C,H,W)。 import torchvision.transforms as transforms import cv2 as cv img = cv.imread('image/000001.jpg') print(img.shape) # numpy数组格式为(H,W,C) transf = transforms.ToTensor() img_tensor = transf(img) # tensor数据格式是torch(C,H,W) print(img_tensor.size())注意:使用torchvision.transforms时要注意一下,其子函数 ToTensor() 是没有参数输入的,以下用法是会报错的 img_tensor = transforms.ToTensor(img)必须是先定义和赋值转换函数,再调用并输入参数,正确用法: img = cv.imread('image/000001.jpg') transf = transforms.ToTensor() img_tensor = transf(img) 再转换过程中正则化在使用 transforms.ToTensor() 进行图片数据转换过程中会对图像的像素值进行正则化,即一般读取的图片像素值都是8 bit 的二进制,那么它的十进制的范围为 [0, 255],而正则化会对每个像素值除以255,也就是把像素值正则化成 [0.0, 1.0]的范围。通过例子理解一下: import torchvision.transforms as transforms import cv2 as cv img = cv.imread('image/000001.jpg') transf = transforms.ToTensor() img_tensor = transf(img) print('opencv', img) print('torch', img_tensor)
使用transforms.Compose函数可以自行修改正则化的范围,下面举个例子正则化成 [-1.0, 1.0] transf2 = transforms.Compose( [ transforms.ToTensor(), transforms.Normalize(mean=(0.5, 0.5, 0.5), std=(0.5, 0.5, 0.5)) ] ) img_tensor2 = transf2(img) print(img_tensor2)
|
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |