tensorflow中的图片读取和裁剪常用的方式有哪些

2025-01-17 技术教程

小编给大家分享一下tensorflow中的图片读取和裁剪常用的方式有哪些，希望大家阅读完这篇文章后大所收获，下面让我们一起去探讨方法吧！

一方式1: skimage

from skimage import data, io, transform, color import matplotlib.pyplot as plt # io.imread 读出的图片格式是uint8，value是numpy array 类型。image = data.coffee()image = io.imread(dir) plt.imshow(image)plt.show() io.save('1.jpg',image) #保存图像 image_gray = color.rgb2gray(image) #转换为灰度图像io.save('2.jpg',image_gray) # 通过transform.resize()裁剪后的图片是以 float64的格式存储的，数值的取值范围是（0~1）image_ = transform.resize(image,(200,200))img = image_ * 255 #将图片的取值范围改成（0~255）img = img.astype(np.uint8) img = image_ * 255 #将图片的取值范围改成（0~255）img = img.astype(np.uint8)

二、方式2：cv2

import cv2import matplotlib.pyplot as plt # cv2.imread读出的图片格式是uint8,value也是numpy array 类型。# 图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。image=cv2.imread(dir) b,g,r = cv2.split(image) #将图像通道分离开 rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 plt.imshow(rgb_image) # 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）image_cv2 = cv2.resize(rgb_image) image=cv2.imread(dir) b,g,r = cv2.split(image) #将图像通道分离开 rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式 plt.imshow(rgb_image) # 通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）image_cv2 = cv2.resize(rgb_image)

补充知识：tensorflow中两种读图及裁剪图片的区别（io.imread和cv2.imread）以及（transform.resize和cv2.resize）

Tensorflow中，在训练图片数据之前，需要先对图片进行预处理，读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式，这里小编将和大家分享下这几种方式的实现以及他们之间的区别。

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8，value是numpy array 类型。对于RGB 图片，图像数据是以RGB 的格式进行存储的。

2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是，图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时，需要将图片通道改成RGB，具体代码如下。

import cv2import matplotlib.pyplot as pltfrom skimage import transform import numpy as npimport skimage.io as io train_dir = 'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg' '''以cv2方式读取图片'''image=cv2.imread(train_dir)b,g,r = cv2.split(image) #将图像通道分离开rgb_image = cv2.merge([r,g,b]) #以RGB的形式重新组合 #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) 也可以使用这个函数直接转换成RGB 形式plt.imshow(rgb_image) '''以io.imread方式读取图片'''#image = io.imread(train_dir) #读图并显示 #plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）

2.通过transform.resize()裁剪后的图片是以 float64的格式存储的，数值的取值范围是（0~1）。通常在制作tfrecord 数据集的过程中，我们需要将其转换成numpy array的形式，具体代码如下

'''以io.imread方式读取图片并使用transform形式裁剪图片'''image = io.imread(train_dir) #读图并显示 plt.imshow(image)image =transform.resize(image, (208, 208))img = image * 255 #将图片的取值范围改成（0~255）img = img.astype(np.uint8) plt.imshow(img)

看完了这篇文章，相信你对tensorflow中的图片读取和裁剪常用的方式有哪些有了一定的了解，想了解更多相关知识，欢迎关注亿速云行业资讯频道，感谢各位的阅读！