: 이미지 분류에 사용되는 파이썬 라이브러리 로딩
# '__future__' : python 2에서 python 3 문법 사용 가능
from __future__ import absolute_import, division, print_function, unicode_literals, unicode_literals
# 텐서플로우 및 케라스 라이브러리 임포트
import tensorflow as tf
from tensorflow import keras
# 넘파이 및 matplotlib 라이브러리 임포트
import numpy as np
import matplotlib.pyplot as plt
# 텐서플로우 버전 확인
print(tf.__version__)
2.0.0
2. Fashion MNIST 데이터셋
: 이미지 분류의 재료가 되는 Fashion MNIST 데이터셋
ㄱ) 10개 카테고리와 7만개의 흑백 이미지로 구성
ㄴ) 각 이미지는 낮는 해상도로 개별 옷 품목을 나타냄
: 이미지 분류 뉴럴 네트워크 모델링에 6만개의 이미지를 사용
: 만들어진 네트워크의 이미지 분류 정확도를 평가하기 위해, 나머지 1만개 이미지 사용

# Fashion MNIST 데이터셋은 텐서플로우에서 쉽게 로딩 가능
# load_data() 함수로 넘파이 배열을 반환
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
#train_images, train_labels 배열은 모델 학습에 사용될 Training set
#test_images, test_labels 배열은 모델 테스트에 사용될 Test set
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
26427392/26421880 [==============================] - 1s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
4423680/4422102 [==============================] - 0s 0us/step
: 모든 이미지는 28x28 픽셀의 넘파이 배열 (픽셀 값은 0~255)
: Label은 0~9의 정수 배열 (옷 이미지의 클래스를 나타냄, 각 이미지는 1개 Label에 매핑됨)
# 데이터셋에 클래스 이름이 없으므로, 나중에 이미지를 출력하기 위해 별도의 변수를 생성
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
3. 데이터 점검
: 모델 훈련 전, Training/Test 데이터셋 구조 확인하기
# Traning set 확인 (60000개 이미지, 28x28 픽셀)
train_images
(60000, 28, 28)
# Training set의 각 Label은 0~9 정수
train_labels
array([9, 0, 0, ..., 3, 0, 5], dtype=uint8)
# Test set 확인 (10000개 이미지, 28x28 픽셀)
test_images.shape
(60000, 28, 28)
# Test set의 각 Label은 0~9 정수
test_labels
array([9, 2, 1, ..., 8, 1, 5], dtype=uint8)
4. 데이터 전처리
: 모델 훈련 전, 정확한 모델링을 위한 데이터셋 전처리
# 픽셀 값의 범위가 0~255 라는 것을 확인
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

# Training/Test set 모두 255로 나누어, 범위값을 0~1 사이로 표준화
train_images = train_images / 255.0
test_images = test_images / 255.0
# 데이터 포맷 확인을 위해, Training set에서 처음 25개 이미지 및 클래스를 출력
plt.figure(figsize=(10,10))
for i in range(25):
plt.subplot(5,5,i+1)
plt.xticks([])
plt.yticks([])
plt.grid(False)
plt.imshow(train_images[i], cmap=plt.cm.binary)
plt.xlabel(class_names[train_labels[i]])
plt.show()

5. 모델 층(Layer) 설정
: 신경망 기본 구성 요소인 층(Layer)을 생성하고 연결
# keras.layers.Flatten로 첫번째 층 생성 후, 두 개의 keras.layers.Dense 층에 연결
model = keras.Sequential([
keras.layers.Flatten(input_shape=(28, 28)),
keras.layers.Dense(128, activation='relu'),
keras.layers.Dense(10, activation='softmax')
])
#keras.layers.Flatten - 이미지에 있는 픽셀의 행을 펼쳐서 일렬로 배열(28*28=784 픽셀의 1차원 배열 변환)
#keras.layers.Dense - 마지막 층은 10개 노드의 Softmax 층으로 10개 클라스 중 하나에 속할 확률을 출력(전체 합=1)
6. 모델 컴파일(Compile)
ㄱ) Optimizer - 데이터와 손실 함수 기반으로 모델 업데이트 방법을 결정
ㄴ) Loss function - 훈련 동안의 모델 오차를 측정 (모델이 올바른 학습을 하도록 이 함수를 최소화)
ㄷ) Metrics - 훈련 단계와 테스트 단계를 모니터링 (아래는 올바르게 분류된 이미지 비율인 정확도를 사용)
# 모델 훈련에 필요한 설정을 컴파일 과정에서 추가
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
7. 모델 훈련
1) Training set을 모델에 주입 (train_images 및 train_labels 배열)
2) 모델이 이미지와 레이블을 매핑하는 방법을 학습
3) Test set에 대한 모델의 예측 생성 (test_images 및 test_labels 배열)
# model.fit 함수로 모델이 학습되면서 손실과 정확도 지표 출력
model.fit(train_images, train_labels, epochs=5)
Train on 60000 samples
Epoch 1/5
60000/60000 [==============================] - 5s 85us/sample - loss: 0.6054 - accuracy: 0.8128
Epoch 2/5
60000/60000 [==============================] - 5s 85us/sample - loss: 0.5179 - accuracy: 0.8242
Epoch 3/5
60000/60000 [==============================] - 5s 85us/sample - loss: 0.5379 - accuracy: 0.8268
Epoch 4/5
60000/60000 [==============================] - 5s 84us/sample - loss: 0.5429 - accuracy: 0.8281
Epoch 5/5
60000/60000 [==============================] - 5s 86us/sample - loss: 0.5362 - accuracy: 0.8312
<tensorflow.python.keras.callbacks.History at 0x7f59c40b9668>
8. 정확도(Accuracy) 평가
: Test set으로 모델의 성능을 비교
: 과적합(Overfitting)으로 인해, Test set이 Training set보다 정확도가 낮음
# model.evaludate 함수로 Test set 정확도 평가
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print('\n테스트 정확도:', test_acc)
10000/1 - 0s - loss: 0.5376 - accuracy: 0.7879
테스트 정확도: 0.7879
9. 예측(Prediction) 실행
: 학습된 모델을 사용하여, 이미지에 대한 예측이 가능
: Test set에 있는 각 이미지의 Label 예측
# 첫번째 예측으로 10개의 옷 품목에 상응하는 모델의 신뢰도가 배열로 보여짐
predictions = model.predict(test_images)
predictions[0]
array([0. , 0. , 0. , 0. , 0. ,
0.1025838 , 0. , 0.10969254, 0. , 0.78772366],
dtype=float32)
# 가장 높은 신뢰도를 가진 레이블 확인
np.argmax(predictions[0])
9 #모델은 해당 이미지를 앵클 부츠(class_name[9])로 예측
# 예측이 정확한지 테스트 레이블 확인
test_labels[0]
9 #정답
# 이미지 클래스를 예측하여 그래프/신뢰도를 출력하는 함수 정의
def plot_image(i, predictions_array, true_label, img):
predictions_array, true_label, img = predictions_array[i], true_label[i], img[i]
plt.grid(False)
plt.xticks([])
plt.yticks([])
plt.imshow(img, cmap=plt.cm.binary)
predicted_label = np.argmax(predictions_array)
if predicted_label == true_label:
color = 'blue'
else:
color = 'red'
plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
100*np.max(predictions_array),
class_names[true_label]),
color=color)
def plot_value_array(i, predictions_array, true_label):
predictions_array, true_label = predictions_array[i], true_label[i]
plt.grid(False)
plt.xticks([])
plt.yticks([])
thisplot = plt.bar(range(10), predictions_array, color="#777777")
plt.ylim([0, 1])
predicted_label = np.argmax(predictions_array)
thisplot[predicted_label].set_color('red')
thisplot[true_label].set_color('blue')
# 올바른 예측은 파란색, 잘못 예측은 빨강색
# 숫자는 예측 레이블의 신뢰도 퍼센트
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
plt.subplot(num_rows, 2*num_cols, 2*i+1)
plot_image(i, predictions, test_labels, test_images)
plt.subplot(num_rows, 2*num_cols, 2*i+2)
plot_value_array(i, predictions, test_labels)
plt.show()

# 한 개의 이미지 예측을 테스트하기 위해, Test set에서 이미지 선택
img = test_images[0]
# tf.keras 모델은 한 개의 이미지만 사용할 때에도 배치 추가
img = (np.expand_dims(img,0))
# 입력된 이미지에 대한 예측 실행
predictions_single = model.predict(img)
plot_value_array(0, predictions_single, test_labels)
_ = plt.xticks(range(10), class_names, rotation=45)

# model.predict 함수는 2차원 넘파이 배열을 반환하므로 첫 번째 이미지 예측을 선택
np.argmax(predictions_single[0])
9 #모델은 해당 이미지를 앵클 부츠(class_name[9])로 예측