[TensorFlow] 이미지 분류 신경망 Start

BioinformaticsAndMe










[TensorFlow] 케라스를 이용한 이미지 분류


: TensorFlow 2.0 에서 수행되는 기본적인 이미지 분류 신경망 학습 과정

: 티셔츠/바지/운동화 등의 10개 카테고리 이미지(Fashion MNIST 데이터셋)를 분류하기 위한 뉴럴 네트워크 모델

: 고수준 API인 케라스(tf.keras) 사용 




1. 파이썬 라이브러리 로딩


: 이미지 분류에 사용되는 파이썬 라이브러리 로딩

# '__future__' : python 2에서 python 3 문법 사용 가능 from __future__ import absolute_import, division, print_function, unicode_literals, unicode_literals # 텐서플로우 및 케라스 라이브러리 임포트 import tensorflow as tf from tensorflow import keras # 넘파이 및 matplotlib 라이브러리 임포트 import numpy as np import matplotlib.pyplot as plt

# 텐서플로우 버전 확인 print(tf.__version__)

2.0.0




2. Fashion MNIST 데이터셋


: 이미지 분류의 재료가 되는 Fashion MNIST 데이터셋

ㄱ) 10개 카테고리와 7만개의 흑백 이미지로 구성

ㄴ) 각 이미지는 낮는 해상도로 개별 옷 품목을 나타냄

: 이미지 분류 뉴럴 네트워크 모델링에 6만개의 이미지를 사용

: 만들어진 네트워크의 이미지 분류 정확도를 평가하기 위해, 나머지 1만개 이미지 사용

# Fashion MNIST 데이터셋은 텐서플로우에서 쉽게 로딩 가능

# load_data() 함수로 넘파이 배열을 반환 fashion_mnist = keras.datasets.fashion_mnist (train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

#train_images, train_labels 배열은 모델 학습에 사용될 Training set #test_images, test_labels 배열은 모델 테스트에 사용될 Test set

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz 32768/29515 [=================================] - 0s 0us/step Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz 26427392/26421880 [==============================] - 1s 0us/step Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz 8192/5148 [===============================================] - 0s 0us/step Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz 4423680/4422102 [==============================] - 0s 0us/step

: 모든 이미지는 28x28 픽셀의 넘파이 배열 (픽셀 값은 0~255)

: Label은 0~9의 정수 배열 (옷 이미지의 클래스를 나타냄, 각 이미지는 1개 Label에 매핑됨)

# 데이터셋에 클래스 이름이 없으므로, 나중에 이미지를 출력하기 위해 별도의 변수를 생성

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']




3. 데이터 점검


: 모델 훈련 전, Training/Test 데이터셋 구조 확인하기

# Traning set 확인 (60000개 이미지, 28x28 픽셀)

train_images

(60000, 28, 28)

# Training set의 각 Label은 0~9 정수

train_labels

array([9, 0, 0, ..., 3, 0, 5], dtype=uint8)

# Test set 확인 (10000개 이미지, 28x28 픽셀)

test_images.shape

(60000, 28, 28)

# Test set의 각 Label은 0~9 정수

test_labels

array([9, 2, 1, ..., 8, 1, 5], dtype=uint8)




4. 데이터 전처리


: 모델 훈련 전, 정확한 모델링을 위한 데이터셋 전처리

# 픽셀 값의 범위가 0~255 라는 것을 확인

plt.figure() plt.imshow(train_images[0]) plt.colorbar() plt.grid(False) plt.show()

# Training/Test set 모두 255로 나누어, 범위값을 0~1 사이로 표준화

train_images = train_images / 255.0

test_images = test_images / 255.0

# 데이터 포맷 확인을 위해, Training set에서 처음 25개 이미지 및 클래스를 출력

plt.figure(figsize=(10,10)) for i in range(25): plt.subplot(5,5,i+1) plt.xticks([]) plt.yticks([]) plt.grid(False) plt.imshow(train_images[i], cmap=plt.cm.binary) plt.xlabel(class_names[train_labels[i]])

plt.show()




5. 모델 층(Layer) 설정


: 신경망 기본 구성 요소인 층(Layer)을 생성하고 연결

# keras.layers.Flatten로 첫번째 층 생성 후, 두 개의 keras.layers.Dense 층에 연결

model = keras.Sequential([ keras.layers.Flatten(input_shape=(28, 28)), keras.layers.Dense(128, activation='relu'), keras.layers.Dense(10, activation='softmax') ])

#keras.layers.Flatten - 이미지에 있는 픽셀의 행을 펼쳐서 일렬로 배열(28*28=784 픽셀의 1차원 배열 변환) #keras.layers.Dense - 마지막 층은 10개 노드의 Softmax 층으로 10개 클라스 중 하나에 속할 확률을 출력(전체 합=1)




6. 모델 컴파일(Compile)


ㄱ) Optimizer - 데이터와 손실 함수 기반으로 모델 업데이트 방법을 결정

ㄴ) Loss function - 훈련 동안의 모델 오차를 측정 (모델이 올바른 학습을 하도록 이 함수를 최소화)

ㄷ) Metrics - 훈련 단계와 테스트 단계를 모니터링 (아래는 올바르게 분류된 이미지 비율인 정확도를 사용)

# 모델 훈련에 필요한 설정을 컴파일 과정에서 추가

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])




7. 모델 훈련


1) Training set을 모델에 주입 (train_images 및 train_labels 배열)

2) 모델이 이미지와 레이블을 매핑하는 방법을 학습

3) Test set에 대한 모델의 예측 생성 (test_images 및 test_labels 배열)

# model.fit 함수로 모델이 학습되면서 손실과 정확도 지표 출력 model.fit(train_images, train_labels, epochs=5)

Train on 60000 samples Epoch 1/5 60000/60000 [==============================] - 5s 85us/sample - loss: 0.6054 - accuracy: 0.8128 Epoch 2/5 60000/60000 [==============================] - 5s 85us/sample - loss: 0.5179 - accuracy: 0.8242 Epoch 3/5 60000/60000 [==============================] - 5s 85us/sample - loss: 0.5379 - accuracy: 0.8268 Epoch 4/5 60000/60000 [==============================] - 5s 84us/sample - loss: 0.5429 - accuracy: 0.8281 Epoch 5/5 60000/60000 [==============================] - 5s 86us/sample - loss: 0.5362 - accuracy: 0.8312 <tensorflow.python.keras.callbacks.History at 0x7f59c40b9668>




8. 정확도(Accuracy) 평가


: Test set으로 모델의 성능을 비교

: 과적합(Overfitting)으로 인해, Test set이 Training set보다 정확도가 낮음

# model.evaludate 함수로 Test set 정확도 평가 test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2) print('\n테스트 정확도:', test_acc)

10000/1 - 0s - loss: 0.5376 - accuracy: 0.7879 테스트 정확도: 0.7879




9. 예측(Prediction) 실행


학습된 모델을 사용하여, 이미지에 대한 예측이 가능

: Test set에 있는 각 이미지의 Label 예측

# 첫번째 예측으로 10개의 옷 품목에 상응하는 모델의 신뢰도가 배열로 보여짐 predictions = model.predict(test_images)

predictions[0]

array([0. , 0. , 0. , 0. , 0. , 0.1025838 , 0. , 0.10969254, 0. , 0.78772366], dtype=float32)

# 가장 높은 신뢰도를 가진 레이블 확인 np.argmax(predictions[0])

9    #모델은 해당 이미지를 앵클 부츠(class_name[9])로 예측

# 예측이 정확한지 테스트 레이블 확인 test_labels[0]

9    #정답

# 이미지 클래스를 예측하여 그래프/신뢰도를 출력하는 함수 정의 def plot_image(i, predictions_array, true_label, img): predictions_array, true_label, img = predictions_array[i], true_label[i], img[i] plt.grid(False) plt.xticks([]) plt.yticks([]) plt.imshow(img, cmap=plt.cm.binary) predicted_label = np.argmax(predictions_array) if predicted_label == true_label: color = 'blue' else: color = 'red' plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label], 100*np.max(predictions_array), class_names[true_label]), color=color) def plot_value_array(i, predictions_array, true_label): predictions_array, true_label = predictions_array[i], true_label[i] plt.grid(False) plt.xticks([]) plt.yticks([]) thisplot = plt.bar(range(10), predictions_array, color="#777777") plt.ylim([0, 1]) predicted_label = np.argmax(predictions_array) thisplot[predicted_label].set_color('red') thisplot[true_label].set_color('blue')

# 올바른 예측은 파란색, 잘못 예측은 빨강색

# 숫자는 예측 레이블의 신뢰도 퍼센트 num_rows = 5 num_cols = 3 num_images = num_rows*num_cols plt.figure(figsize=(2*2*num_cols, 2*num_rows)) for i in range(num_images): plt.subplot(num_rows, 2*num_cols, 2*i+1) plot_image(i, predictions, test_labels, test_images) plt.subplot(num_rows, 2*num_cols, 2*i+2) plot_value_array(i, predictions, test_labels) plt.show()

# 한 개의 이미지 예측을 테스트하기 위해, Test set에서 이미지 선택 img = test_images[0] # tf.keras 모델은 한 개의 이미지만 사용할 때에도 배치 추가 img = (np.expand_dims(img,0)) # 입력된 이미지에 대한 예측 실행 predictions_single = model.predict(img) plot_value_array(0, predictions_single, test_labels) _ = plt.xticks(range(10), class_names, rotation=45)

# model.predict 함수는 2차원 넘파이 배열을 반환하므로 첫 번째 이미지 예측을 선택 np.argmax(predictions_single[0])

9    #모델은 해당 이미지를 앵클 부츠(class_name[9])로 예측






#Reference

1) https://www.tensorflow.org/tutorials/keras/classification

2) https://colab.research.google.com/github/tensorflow/docs/blob/master/site/ko/tutorials/keras/classification.ipynb#scrollTo=2tRmdq_8CaXb

3) https://towardsdatascience.com/multi-label-classification-and-class-activation-map-on-fashion-mnist-1454f09f5925





[TensorFlow] 이미지 분류 신경망 End

BioinformaticsAndMe

+ Recent posts