본문 바로가기
공부자료/Deep Learning

전이학습

by mogazi 2022. 9. 26.
  •   전이학습이란? (transfer learning)

 

일반적으로 합성곱 신경망 기반의 딥러닝 모델을 제대로 훈련시키려면 많은 양의 데이터가 필요하다.

하지만 충분히 큰 데이터셋을 얻는 것은 쉽지 않다.

 

이러한 현실적인 어려움을 해결한 것이 전이 학습이다.

 

 

 

 

 

이미지넷 (ImageNet) 처럼 아주 데이터셋을 써서 훈련된 모델의 가중치를 가져와 해결하려는 과제에 맞게 보정해서 사용하는 것을 의미

 

 

 

 

이때 아주 큰 데이터셋을 사용하여 훈련된 모델을 사전 훈련된 모델 (네트워크) 라고한다.

결과적으로 비교적 적은 수의 데이터를 가지고도 원하는 과제를 해결할 수 있다.

 

 

 

전이 학습을 위한 방법으로는 특성 추출과 미세 조정 기법이 있다.

 

 

 

 

 

 

 

 

 

 

 

 

  특성 추출 기법 (feature extractor)

 

 

 

특성 추출은 ImageNet 데이터셋으로 사전 훈련된 모델을 가져온 후 마지막에 완전연결층 부분만 새로 만든다.

즉, 학습할 때는 마지막 완전연결층(이미지의 카테고리를 결정하는 부분) 만 학습하고 나머지 계층들은 학습되지 않도록 한다.

 

 

특성 추출은 이미지 분류를 위해 두 부분으로 구성된다.

 

 

합성곱층 : 합성곱층과 풀링층으로 구성

데이터 분류기(완전연결층) : 추출된 특성을 입력받아 최종적으로 이미지에 대한 클래스를 분류하는 부분

 

 

 

 

사전 훈련된 네트워크의 합성곱층(가중치 고정) 에 새로운 데이터를 통과시키고, 그 출력을 데이터 분류기에서 훈련시킨다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  미세 조정 기법 (fine-tuning) 

 

 

 

 

미세 조정기법은 특성 추출 기법에서 더 나아가 사전 훈련된 모델과 합성곱층, 데이터 분류기의 가중치를 업데이트하여 훈련시키는 방식. 

특성 추출은 목표 특성을 잘 추출했다는 전제하에 좋은 성능을 낼 수 있다. 

 

 

 

특성이 잘못 추출되었다면(예를 들어 ImageNet 데이터셋의 이미지 특징과 전자상거래 물품의 이미지 특징이 다르다면) 

미세 조정 기법으로 새로운 (전자상거래) 이미지 데이터를 사용하여 네트워크의 가중치를 업데이트해서 특성을 다시 추출할 수 있다. 

 

 

 

즉, 사전 학습된 모델을 목적에 맞게 재학습시키거나 학습된 가중치의 일부를 재학습시키는 것이다.

미세 조정 기법은 사전 훈련된 네트워크를 미세 조정하여 분석하려는 데이터셋에 잘 맞도록 모델의 파라미터를 조정하는 기법이다.

 

 

 

 

 

 

 

 

미세 조정은 파라미터 업데이트 과정에서 파라미터에 큰 변화를 주게 되면 과적합 문제가 발생할 수 있기 때문에 

정교하고 미세한 파라미터 업데이트가 필요

 

'공부자료 > Deep Learning' 카테고리의 다른 글

분류 신경망 유형  (0) 2022.09.26
그래프 합성곱 네트워크  (0) 2022.09.26
1D, 2D, 3D 합성곱  (0) 2022.09.26
합성곱 신경망 (2)  (0) 2022.09.26
합성곱 신경망 (1)  (0) 2022.09.26