본문 바로가기

명사 美 비격식 (무리 중에서) 아주 뛰어난[눈에 띄는] 사람[것]

이론

초기이미지 인식 신경망, AlexNet: 딥러닝의 가능성을 깨닫기 시작한 순간

AlexNet

초기이미지 인식 신경망

2012년 이전까지의 이미지 인식분야에서는 사람이 특징을 설계하고 머신러닝이 분류하는 구조였다. 

2012년 ILSVRC에서 발표해 큰 격차로 우승, 상위 5위 테스트에서 15.4의 오차율. 2위는 심층 신경망을 사용하지않는 모델로 26.2 오차율을 기록. 기록적인 순간이자 커뮤니티의 모든 이가 딥러닝의 가능성을 깨닫기 시작한 순간이다.

당시 CPU로 학습했지만 ALexNet은 GPU를 활용해 학습했고 ReLU로 sigmoid와 Tanh보다 훨씬 빠르게 학습되었으며 Dropout을 사용해 과적합을 줄이고 이미지를 회전/반전/자르기 등을 해 학습했다. 

https://standout.tistory.com/1770

 

ILSVRC이란? : ImageNet 데이터를 이용한 이미지 인식 대회

ILSVRC이란? ImageNet Large Scale Visual Recognition Challenge ImageNet 전체는 2만 개 이상의 카테고리가 있지만, ILSVRC에서는 계산량과 평가의 편의를 위해 약 120만 장의 학습 이미지, 1000개 클래스를 선택하여

standout.tistory.com

https://standout.tistory.com/1772

 

머신러닝/딥러닝에서의 활성화/데이터전처리: Softmax, Sigmoid, MinMaxScaler, StandardScaler

문득 머신러닝/딥러닝을 공부하는데아래의 내용이 반복해서 나오기 시작했다. 뭔가 정리가 필요하다 .0~1 사이 숫자확률정규화스케일링SigmoidSoftmaxMinMaxScaler Softmax활성화 함수(Activation Function)Sigmo

standout.tistory.com

 

 

이후 개선된 아키텍처와 훈련방법을 통해 상위 5위 테스트 오차율은 3%까지 줄어들었다. 

오늘날 기준 최신모델대비 알렉스넷은 소규모 신경망.

오늘 기준에서 VGG, ResNet, EfficientNet, Vision Transformer 당연히 최신 모델보다 성능이 낮다. 

 

AlexNet은 현재 기준으로 실무활용보다는 상징적인 의미가 있다. AlexNet 등장 이후 이미지 - CNN - 결과 방식이 압도적으로 좋아졌고 컴퓨터 비전의 패러다임을 바꾼 모델이라고 평가받는다. 최초의 자동차, 증기기관차, 최초 스마트폰같은 존재랄까.

 

실무에서는 더이상 활용하지않으나 CNN 기본 구조를 이해하기 구조가 비교적 단순해 가장 쉽다.

즉 실제로 살펴보고 새 이미지를 사전 훈련된 모델에 넣어보기 최적인 상징적인 신경망.