Pytorch之深入torchvision.transforms.ToTensor与ToPILImage

目录

torchvision.transforms.ToTensor

torchvision.transforms.ToPILImage


 

torchvision.transforms.ToTensor

对于一个图片img,调用ToTensor转化成张量的形式,发生的不是将图片的RGB三维信道矩阵变成tensor

图片在内存中以bytes的形式存储,转化过程的步骤是:

  1. img.tobytes()  将图片转化成内存中的存储格式
  2. torch.BytesStorage.frombuffer(img.tobytes() )  将字节以流的形式输入,转化成一维的张量
  3. 对张量进行reshape
  4. 对张量进行permute(2,0,1)
  5. 将当前张量的每个元素除以255
  6. 输出张量

 

torchvision.transforms.ToPILImage

对于一个Tensor的转化过程是:

  1. 将张量的每个元素乘上255
  2. 将张量的数据类型有FloatTensor转化成Uint8
  3. 将张量转化成numpy的ndarray类型
  4. 对ndarray对象做permute (1, 2, 0)的操作
  5. 利用Image下的fromarray函数,将ndarray对象转化成PILImage形式
  6. 输出PILImage

版权声明:本文为qq_37385726原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。