Pytorch技巧篇：

本篇将整理一些深度学习常用的trick。

1. Image Augmentation：

AlexNet中使用了图像增广（Image Augmentation）来获得更好的训练结果，该方法是通过使训练图像进行一系列的随机变化后，生成相似而不同的训练数据，从而增大训练集。此外，通过随即改变训练样本，还可以提高模型泛化能力。

下面就总结Pytorch中几个常用的方法：

import torch
from torch import nn
import torchvision
from PIL import Image
# 读取一张图片
image = Image.open("file_name.jpg")
toTensor = torchvision.transforms.ToTensor()
image = toTensor(image)
# GPU加载图像
device = 'cuda' if torch.cuda.is_available() else 'cpu'
img = image.to(device)

1.1 图像翻转：

# 被翻转的概率，默认为50%
# 1. 上下翻转
flip_aug = torchvision.transforms.RandomHorizontalFlip(p=0.8)
flip_aug(img)
# 2. 左右翻转
flip_aug = torchvision.transforms.RandomVerticalFlip(p=0.8)
flip_aug(img)

1.2 图像裁剪：

# 参数含义：
# size：裁剪后的高宽被缩放到固定像素值
# scale：裁剪一个区域，面积为原始[0.1,1]倍
# ratio：上述区域的宽高比为[0.5,2]之间
shape_aug = torchvision.transforms.RandomResizedCrop(
    		(200, 200), scale=(0.1, 1), ratio=(0.5, 2))
shape_aug(img)

1.3 图像颜色：

# 1. 亮度：[1-0.5,1+0.5]

color_aug = torchvision.transforms.ColorJitter(
    		brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5)
color_aug(img)

# 2. 对比度：[1-0.5,1+0.5]
color_aug = torchvision.transforms.ColorJitter(
    		brightness=0.5, contrast=0, saturation=0, hue=0)
color_aug(img)

# 3. 饱和度：[1-0.5,1+0.5]
color_aug = torchvision.transforms.ColorJitter(
    		brightness=0.5, contrast=0, saturation=0, hue=0)
color_aug(img)

# 4. 色调：[-0.5,0.5]
color_aug = torchvision.transforms.ColorJitter(
    		brightness=0.5, contrast=0, saturation=0, hue=0)
color_aug(img)

1.4 混合使用：

augs = torchvision.transforms.Compose([
    flip_aug, color_aug, shape_aug])
augs(img)

1.5 训练模型时使用：

#  这里以cifar10作为例子
import torch
from torch import nn
import torchvision

all_images = torchvision.datasets.CIFAR10(train=True, root="../data",
                                          download=True)

def load_cifar10(is_train, augs, batch_size):
    dataset = torchvision.datasets.CIFAR10(root="../data", train=is_train,
                                           transform=augs, download=True)
    dataloader = torch.utils.data.DataLoader(dataset, batch_size=batch_size,
                    shuffle=is_train, num_workers=4)
    return dataloader

train_augs = torchvision.transforms.Compose([
     torchvision.transforms.RandomHorizontalFlip(),
     torchvision.transforms.ToTensor()])

test_augs = torchvision.transforms.Compose([
     torchvision.transforms.ToTensor()])

train_iter = load_cifar10(True, train_augs, batch_size)
test_iter = load_cifar10(False, test_augs, batch_size)

文档信息

本文作者：Guoziyu
本文链接：https://mateguo1.github.io/2020/08/08/Pytorch%E6%8A%80%E5%B7%A7%E7%AF%87/
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）

GZY_Blog

Pytorch技巧篇

Pytorch技巧篇：

1. Image Augmentation：

1.1 图像翻转：

1.2 图像裁剪：

1.3 图像颜色：

1.4 混合使用：

1.5 训练模型时使用：

文档信息

Search

Table of Contents