컨볼루션 인공신경망 Convolutional Neural Network¶

MNIST ��
�ռ�� (CNN)
�ƽ�Ǯ��(Max Pooling)
�� Ű��(Fully Connected Network)

In [1]:

# ������ġ �� ��ġ���� ��ġ
# ��Ÿ���� GPU ���� �ٲ㼭 �����ϼ���
!pip install torch torchvision

Requirement already satisfied: torch in /usr/local/lib/python3.6/dist-packages (1.1.0)
Requirement already satisfied: torchvision in /usr/local/lib/python3.6/dist-packages (0.3.0)
Requirement already satisfied: numpy in /usr/local/lib/python3.6/dist-packages (from torch) (1.16.4)
Requirement already satisfied: six in /usr/local/lib/python3.6/dist-packages (from torchvision) (1.12.0)
Requirement already satisfied: pillow>=4.1.1 in /usr/local/lib/python3.6/dist-packages (from torchvision) (4.3.0)
Requirement already satisfied: olefile in /usr/local/lib/python3.6/dist-packages (from pillow>=4.1.1->torchvision) (0.46)

1. 학습전 세팅¶

1) 필요한 라이브러리 불러오기¶

In [2]:

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.init as init

# https://pytorch.org/docs/stable/torchvision/datasets.html
# ������ġ������ torchvision.datasets�� MNIST ���� �پ��� �����͸� ����ϱ� �����ϰ� �����س����ϴ�.
# �̸� ����ϸ� �����͸� ���� �н��� �°� �����ϰų� ���� �ʾƵ� �ٷ� ����� �����մϴ�.
import torchvision.datasets as dset

# https://pytorch.org/docs/stable/torchvision/transforms.html?highlight=transforms
# torchvision.transforms���� �̹��� �����͸� �ڸ��ų� Ȯ�� �� �پ��ϰ� ������Ű�� �Լ����� �����Ǿ� �ֽ��ϴ�. 
import torchvision.transforms as transforms

# https://pytorch.org/docs/stable/data.html?highlight=dataloader#torch.utils.data.DataLoader
# DataLoader�� ��ó���� ���� �����͵��� ������ ��ġ ũ�⿡ �°� ��Ƽ� �������ִ� ������ �մϴ�.
from torch.utils.data import DataLoader

import numpy as np
import matplotlib.pyplot as plt

print(torch.__version__)

1.1.0

2) 하이퍼파라미터 지정¶

In [0]:

batch_size = 256
learning_rate = 0.0002
num_epoch = 10

2. 데이터¶

1) 데이터 다운로드¶

In [0]:

# https://pytorch.org/docs/stable/torchvision/datasets.html?highlight=mnist#torchvision.datasets.MNIST
# ù��° ���� root�� �����͸� ������ ��ġ, train�� �н��� ���������� �׽�Ʈ�� ������������ ���θ� �ǹ��մϴ�.

# MNIST �����ʹ� ���� �ձ۾� �̹����� �̿� ���� ���� ������ �̷���� �ֽ��ϴ�. 
# transform�� �̹����� ���� ����, target_transform�� ���� �󺧿� ���� ������ �ǹ��մϴ�.
# transform.ToTensor()�� PIL �̹����� Numpy �迭�� ��ġ �ټ��� �ٲ��ݴϴ�.

# download�� �����Ͱ� ������ ��ġ�� ���� ��� ���� �ٿ������ �����Դϴ�.
mnist_train = dset.MNIST(root="../", train=True, transform=transforms.ToTensor(), target_transform=None, download=True)
mnist_test = dset.MNIST(root="../", train=False, transform=transforms.ToTensor(), target_transform=None, download=True)

2) 데이터셋 체크¶

getitem�� ص� �ǰ�
�ε��ε� ��͸� Ȯ�� ֽ��ϴ�.

In [6]:

print(mnist_train.__getitem__(0)[0].size(), mnist_train.__len__())
print(mnist_test.__getitem__(0)[0].size(), mnist_test.__len__())

print(len(mnist_train),len(mnist_test))
#print(mnist_train[0])

torch.Size([1, 28, 28]) 60000
torch.Size([1, 28, 28]) 10000
60000 10000

3) DataLoader 설정¶

��
��ġ �� (batch_size)
�� (shuffle)
�� μ�� (num_workers)
�� ó�� (drop_last)

In [0]:

# https://pytorch.org/docs/stable/data.html?highlight=dataloader#torch.utils.data.DataLoader

train_loader = DataLoader(mnist_train,batch_size=batch_size, shuffle=True,num_workers=2,drop_last=True)
test_loader = DataLoader(mnist_test,batch_size=batch_size, shuffle=False,num_workers=2,drop_last=True)

3. 모델, 손실함수, 최적화함수¶

1) CNN 모델¶

Sequential �� 4�忡 �ֽ��ϴ�.

In [0]:

# https://pytorch.org/docs/stable/nn.html?highlight=conv2d#torch.nn.Conv2d
# https://pytorch.org/docs/stable/tensors.html?highlight=view#torch.Tensor.view


class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
        self.layer = nn.Sequential(
            nn.Conv2d(in_channels=1,out_channels=16,kernel_size=5),             # [batch_size,1,28,28] -> [batch_size,16,24,24]
            nn.ReLU(),                                                          # ������ ������ 1��(����̹���)���� 16���� �þ���� ���Ƿ� �����߽��ϴ�. 
            nn.Conv2d(in_channels=16,out_channels=32,kernel_size=5),            # [batch_size,16,24,24] -> [batch_size,32,20,20]
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2,stride=2),                               # [batch_size,32,20,20] -> [batch_size,32,10,10]
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=5),          # [batch_size,32,10,10] -> [batch_size,64,6,6]
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2,stride=2)                                # [batch_size,64,6,6] -> [batch_size,64,3,3]
        )
        self.fc_layer = nn.Sequential(                                          
            nn.Linear(64*3*3,100),                                              # [batch_size,64*3*3] -> [batch_size,100]
            nn.ReLU(),
            nn.Linear(100,10)                                                   # [batch_size,100] -> [batch_size,10]
        )       
        
    def forward(self,x):
        out = self.layer(x)                                                     # self.layer�� ������ Sequential�� ������ ���ʴ�� �� �����մϴ�.
        out = out.view(batch_size,-1)                                           # view �Լ��� �̿��� �ټ��� ���¸� [batch_size,������]�� �ٲ��ݴϴ�. 
                                                                                # ex) 2x3 ���¿��� �ټ��� .view(1,-1) ���ָ� 1x6�� ���·� �ٲ�ϴ�. .view(3,-1)�̸� 3x2�� �ٲ�.
                                                                                # ���� ��ü �ټ��� ũ�Ⱑ batch_size�� ������ �������� ������ ������ ���ϴ�.
        out = self.fc_layer(out)
        return out

2) 손실함수 & 최적화함수¶

In [9]:

# gpu�� ��� ������ ��쿡�� device�� gpu�� �����ϰ� �Ұ����ϸ� cpu�� �����մϴ�.
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)

# ���� ������ ��ġ�� �ø��ϴ�.
model = CNN().to(device)

# �ս��Լ��δ� ũ�ν���Ʈ���Ǹ� ����մϴ�.
loss_func = nn.CrossEntropyLoss()

# ����ȭ�Լ��δ� Adam�� ����մϴ�.
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

cuda:0

4. 학습¶

In [10]:

loss_arr =[]
for i in range(num_epoch):
    for j,[image,label] in enumerate(train_loader):
        x = image.to(device)
        y_= label.to(device)
        
        optimizer.zero_grad()
        output = model.forward(x)
        loss = loss_func(output,y_)
        loss.backward()
        optimizer.step()
        
        if j % 1000 == 0:
            print(loss)
            loss_arr.append(loss.cpu().detach().numpy())

tensor(2.3095, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.3788, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.1181, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.0681, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.0678, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.0645, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.0901, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.0389, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.0385, device='cuda:0', grad_fn=<NllLossBackward>)
tensor(0.0481, device='cuda:0', grad_fn=<NllLossBackward>)

In [0]:

#param_list = list(model.parameters())
#print(param_list)

5. 학습시 손실 시각화¶

In [11]:

plt.plot(loss_arr)
plt.show()

6. 테스트 데이터 정확도 측정¶

In [13]:

# ���� ����, ��ü ������ ������ ������ �����մϴ�.
correct = 0
total = 0

# ���۷��� ��带 ���� no_grad ���ݴϴ�.
with torch.no_grad():
    # �׽�Ʈ�δ����� �̹����� ������ �ҷ��ɴϴ�.
    for image,label in test_loader:
        
        # �� ������ ��� ��ġ�� �ø��ϴ�.
        x = image.to(device)
        y_= label.to(device)

        # �𵨿� �����͸� �ְ� ������� ����ϴ�.
        output = model.forward(x)
        
        # https://pytorch.org/docs/stable/torch.html?highlight=max#torch.max
        # torch.max�� �̿��� �ִ� �� �� �ִ밪 �ε����� �̾Ƴ��ϴ�.
        # ���⼭�� �ִ밪�� �ʿ���� ������ �ε����� ����մϴ�.
        _,output_index = torch.max(output,1)
        
        # ��ü ������ ���� ������ �����ݴϴ�.
        # ��ü ������ �˰� �������� �̷��� �ϴ� ������ batch_size, drop_last�� �������� ��� �����Ͱ� �߸����� �ֱ� �����Դϴ�.
        total += label.size(0)
        
        # ���� ����� �ִ밪 �ε����� ���� ��ġ�ϴ� ������ correct�� �����ݴϴ�.
        correct += (output_index == y_).sum().float()
    
    # �׽�Ʈ ������ ��ü�� ���� ���� �۾��� ������ �� ��Ȯ���� �����ݴϴ�.
    print("Accuracy of Test Data: {}%".format(100*correct/total))

Accuracy of Test Data: 98.74800109863281%

In [0]: