VGGNet Implementation¶

�� 길 �� ¿�� VGG�� ٷ� ��ϰ� ¥�⿡�� ֽ��ϴ�.
�� ٽ� ��ŵ� �� ʽ��ϴ�.
2014 ILSVRC 2nd place
VGG-16
Convolution layer
Maxpooling layer
Fully connected layer

��ü �ؽ�Ʈ

In [1]:

# ��Ÿ�� ���� GPU ���� ����
!pip install torch torchvision

Requirement already satisfied: torch in /usr/local/lib/python3.6/dist-packages (1.1.0)
Requirement already satisfied: torchvision in /usr/local/lib/python3.6/dist-packages (0.3.0)
Requirement already satisfied: numpy in /usr/local/lib/python3.6/dist-packages (from torch) (1.16.4)
Requirement already satisfied: pillow>=4.1.1 in /usr/local/lib/python3.6/dist-packages (from torchvision) (4.3.0)
Requirement already satisfied: six in /usr/local/lib/python3.6/dist-packages (from torchvision) (1.12.0)
Requirement already satisfied: olefile in /usr/local/lib/python3.6/dist-packages (from pillow>=4.1.1->torchvision) (0.46)

Prepare Data¶

�� н�� Ǵ�� Ȯ�� ְ� �� ͸� �ٿ�ε� �մϴ�.

In [2]:

!rm -r images
import os 

# �̹��� ������ ������ ������ �����մϴ�.
try:
  os.mkdir("images")
  os.mkdir("images/dogs")
  os.mkdir("images/cats")
except:
  pass

# �̹������� ������ ��ġ�� �ٿ�ε��մϴ�.
# images/dogs �ؿ� 2��
!wget https://i.kinja-img.com/gawker-media/image/upload/s--WFkXeene--/c_scale,f_auto,fl_progressive,q_80,w_800/ol9ceoqxidudap8owlwn.jpg -P images/dogs
!wget https://www.rspcansw.org.au/wp-content/uploads/2017/08/50_a-feature_dogs-and-puppies_mobile.jpg -P images/dogs

# images/cats �ؿ� 2��
!wget https://www.catster.com/wp-content/uploads/2018/05/A-gray-cat-crying-looking-upset.jpg -P images/cats
!wget https://www.scarymommy.com/wp-content/uploads/2018/01/c1.jpg?w=700 -P images/cats

rm: cannot remove 'images': No such file or directory
--2019-08-26 07:56:09--  https://i.kinja-img.com/gawker-media/image/upload/s--WFkXeene--/c_scale,f_auto,fl_progressive,q_80,w_800/ol9ceoqxidudap8owlwn.jpg
Resolving i.kinja-img.com (i.kinja-img.com)... 151.101.194.166, 151.101.130.166, 151.101.2.166, ...
Connecting to i.kinja-img.com (i.kinja-img.com)|151.101.194.166|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 32099 (31K) [image/jpeg]
Saving to: ��images/dogs/ol9ceoqxidudap8owlwn.jpg��

ol9ceoqxidudap8owlw 100%[===================>]  31.35K  --.-KB/s    in 0.005s  

2019-08-26 07:56:10 (5.82 MB/s) - ��images/dogs/ol9ceoqxidudap8owlwn.jpg�� saved [32099/32099]

--2019-08-26 07:56:15--  https://www.rspcansw.org.au/wp-content/uploads/2017/08/50_a-feature_dogs-and-puppies_mobile.jpg
Resolving www.rspcansw.org.au (www.rspcansw.org.au)... 101.0.77.122
Connecting to www.rspcansw.org.au (www.rspcansw.org.au)|101.0.77.122|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 130940 (128K) [image/jpeg]
Saving to: ��images/dogs/50_a-feature_dogs-and-puppies_mobile.jpg��

50_a-feature_dogs-a 100%[===================>] 127.87K   157KB/s    in 0.8s    

2019-08-26 07:56:17 (157 KB/s) - ��images/dogs/50_a-feature_dogs-and-puppies_mobile.jpg�� saved [130940/130940]

--2019-08-26 07:56:19--  https://www.catster.com/wp-content/uploads/2018/05/A-gray-cat-crying-looking-upset.jpg
Resolving www.catster.com (www.catster.com)... 192.124.249.102
Connecting to www.catster.com (www.catster.com)|192.124.249.102|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 165145 (161K) [image/jpeg]
Saving to: ��images/cats/A-gray-cat-crying-looking-upset.jpg��

A-gray-cat-crying-l 100%[===================>] 161.27K  --.-KB/s    in 0.03s   

2019-08-26 07:56:19 (5.12 MB/s) - ��images/cats/A-gray-cat-crying-looking-upset.jpg�� saved [165145/165145]

--2019-08-26 07:56:22--  https://www.scarymommy.com/wp-content/uploads/2018/01/c1.jpg?w=700
Resolving www.scarymommy.com (www.scarymommy.com)... 104.18.166.96, 104.18.164.96, 104.18.168.96, ...
Connecting to www.scarymommy.com (www.scarymommy.com)|104.18.166.96|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 2169547 (2.1M) [image/jpeg]
Saving to: ��images/cats/c1.jpg?w=700��

c1.jpg?w=700        100%[===================>]   2.07M  --.-KB/s    in 0.03s   

2019-08-26 07:56:23 (67.4 MB/s) - ��images/cats/c1.jpg?w=700�� saved [2169547/2169547]

1. Settings¶

1) Import required libraries¶

In [0]:

import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.init as init
import torch.utils.data as data
import torchvision.datasets as dset
import torchvision.transforms as transforms
from torch.utils.data import DataLoader

2) Hyperparameter¶

In [0]:

batch_size= 1
learning_rate = 0.0002
num_epoch = 100

2. Data Loader¶

https://pytorch.org/docs/stable/torchvision/datasets.html?highlight=imagefolder#torchvision.datasets.ImageFolder
ImageFolder�� Լ�� ̿�� ̹��-�� ʰ� �� ϴ°͸�� ̹��-�� ֽ��ϴ�.

ex)

root/dog/xxx.png

root/dog/xxy.png

root/cat/123.png

root/cat/nsdf3.png

In [0]:

# ��(Ȥ�� Ŭ����) ���� ������ ����Ǿ� �ִ� ��Ʈ ���丮�� �����մϴ�.
img_dir = "./images"

# �ش� ��Ʈ ���丮�� ImageFolder �Լ��� �����մϴ�.
# �̶� �̹����鿡 ���� ������ ���� �������ݴϴ�.
img_data = dset.ImageFolder(img_dir, transforms.Compose([
                                      transforms.Resize(256),                   # �̹��� ũ�⸦ 256x256���� �ٲ��ݴϴ�.
                                      transforms.RandomResizedCrop(224),        # 256x256 �̹����� ������ ��ġ���� 224x224 ũ�⸸ŭ ���ø� �մϴ�.
                                      transforms.RandomHorizontalFlip(),        # ������ Ȯ���� �̹����� �¿���� �մϴ�.
                                      transforms.ToTensor(),                    # �̹��� �����͸� �ټ��� �����մϴ�.
            ]))

train_loader = data.DataLoader(img_data, batch_size=batch_size,
                            shuffle=True, num_workers=2)

3. Model¶

1) Basic Blocks¶

�𵨿� �ݺ��Ǵ� �κ�� ̸� �Լ�� ܼ�ȭ �մϴ�.
�� ̹�� 2�� ϴ� �� 3�� ϴ� ��찡 �ִµ� �̸� �� ݴϴ�.
�Ʒ�� ڵ�� ̶�� ٴ� �׸�� ڵ��Դϴ�.

In [0]:

# ������� ������ 2�� �����ϴ� ���
# �������-Ȱ��ȭ�Լ�-�������-Ȱ��ȭ�Լ�-Ǯ��
def conv_2_block(in_dim,out_dim):
    model = nn.Sequential(
        nn.Conv2d(in_dim,out_dim,kernel_size=3,padding=1),
        nn.ReLU(),
        nn.Conv2d(out_dim,out_dim,kernel_size=3,padding=1),
        nn.ReLU(),
        nn.MaxPool2d(2,2)
    )
    return model

  
# ������� ������ 3�� �����ϴ� ���
# �������-Ȱ��ȭ�Լ�-�������-Ȱ��ȭ�Լ�-�������-Ȱ��ȭ�Լ�-Ǯ��
def conv_3_block(in_dim,out_dim):
    model = nn.Sequential(
        nn.Conv2d(in_dim,out_dim,kernel_size=3,padding=1),
        nn.ReLU(),
        nn.Conv2d(out_dim,out_dim,kernel_size=3,padding=1),
        nn.ReLU(),
        nn.Conv2d(out_dim,out_dim,kernel_size=3,padding=1),
        nn.ReLU(),
        nn.MaxPool2d(2,2)
    )
    return model

2) VGG Model¶

In [0]:

# ������ ������ ���ϵ��� �̿��� VGG ��Ʈ��ũ�� �����ڽ��ϴ�.
# ������ ������ 2�� n���� ���� ������ ������ base_dim�̶� ������ �߰��ؼ� �ܼ�ȭ �߽��ϴ�.
# ���� dog, cat �� ���� Ŭ������ �����Ϸ��� �ϱ� ������ num_classes=2�� �����߽��ϴ�.

class VGG(nn.Module):
    def __init__(self, base_dim, num_classes=2):
        super(VGG, self).__init__()
        self.feature = nn.Sequential(
            conv_2_block(3,base_dim),
            conv_2_block(base_dim,2*base_dim),
            conv_3_block(2*base_dim,4*base_dim),
            conv_3_block(4*base_dim,8*base_dim),
            conv_3_block(8*base_dim,8*base_dim),            
        )
        self.fc_layer = nn.Sequential(
            nn.Linear(8*base_dim * 7 * 7, 100),
            nn.ReLU(True),                                                      # True �� inplace ������ �ϰڴٴ� �ǹ̸� �����ϴ�. inplace ������ ������� ���ο� ������ ���� �����ϴ� ��� ������ �����͸� ��ü�ϴ°��� �ǹ��մϴ�.
            #nn.Dropout(),
            nn.Linear(100, 20),
            nn.ReLU(True),
            #nn.Dropout(),
            nn.Linear(20, num_classes),
        )

    def forward(self, x):
        x = self.feature(x)
        x = x.view(x.size(0), -1)                                               # x.size(0)�� batch size�� �ٲ㵵 ���� ���Դϴ�.
        x = self.fc_layer(x)
        return x

4. Optimizer & Loss¶

In [8]:

# gpu�� ��� ������ ��쿡�� device�� 0�� gpu�� �����ϰ� �Ұ����ϸ� cpu�� �����մϴ�.
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)

# �ռ� �����Ѵ�� vGG Ŭ������ �ν��Ͻ�ȭ �ϰ� ������ ��ġ�� �ø��ϴ�.
model = VGG(base_dim=16).to(device)

# �ս��Լ� �� ����ȭ�Լ��� �����մϴ�.
loss_func = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# �� �ڳ� ����� �̸��� ����� ����մϴ�.
for i in model.named_children():
    print(i)

cuda:0
('feature', Sequential(
  (0): Sequential(
    (0): Conv2d(3, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU()
    (2): Conv2d(16, 16, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU()
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (1): Sequential(
    (0): Conv2d(16, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU()
    (2): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU()
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (2): Sequential(
    (0): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU()
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU()
    (4): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (5): ReLU()
    (6): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (3): Sequential(
    (0): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU()
    (2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU()
    (4): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (5): ReLU()
    (6): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (4): Sequential(
    (0): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU()
    (2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU()
    (4): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (5): ReLU()
    (6): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
))
('fc_layer', Sequential(
  (0): Linear(in_features=6272, out_features=100, bias=True)
  (1): ReLU(inplace)
  (2): Linear(in_features=100, out_features=20, bias=True)
  (3): ReLU(inplace)
  (4): Linear(in_features=20, out_features=2, bias=True)
))

5. Train¶

In [9]:

for i in range(num_epoch):
    for j,[image,label] in enumerate(train_loader):
        x = image.to(device)
        y_= label.to(device)
        
        optimizer.zero_grad()
        output = model.forward(x)
        loss = loss_func(output,y_)
        loss.backward()
        optimizer.step()

    if i % 10 ==0:
        print(loss)

tensor(0.6225, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.6045, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.5143, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.4301, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.4345, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.4101, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.4734, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.4204, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.6140, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(1.0608, device='cuda:0', grad_fn=<NllLossBackward>)

In [0]: