AlexNet
초기이미지 인식 신경망
2012년 이전까지의 이미지 인식분야에서는 사람이 특징을 설계하고 머신러닝이 분류하는 구조였다.
2012년 ILSVRC에서 발표해 큰 격차로 우승, 상위 5위 테스트에서 15.4의 오차율. 2위는 심층 신경망을 사용하지않는 모델로 26.2 오차율을 기록. 기록적인 순간이자 커뮤니티의 모든 이가 딥러닝의 가능성을 깨닫기 시작한 순간이다.
당시 CPU로 학습했지만 ALexNet은 GPU를 활용해 학습했고 ReLU로 sigmoid와 Tanh보다 훨씬 빠르게 학습되었으며 Dropout을 사용해 과적합을 줄이고 이미지를 회전/반전/자르기 등을 해 학습했다.
https://standout.tistory.com/1770
ILSVRC이란? : ImageNet 데이터를 이용한 이미지 인식 대회
ILSVRC이란? ImageNet Large Scale Visual Recognition Challenge ImageNet 전체는 2만 개 이상의 카테고리가 있지만, ILSVRC에서는 계산량과 평가의 편의를 위해 약 120만 장의 학습 이미지, 1000개 클래스를 선택하여
standout.tistory.com
https://standout.tistory.com/1772
머신러닝/딥러닝에서의 활성화/데이터전처리: Softmax, Sigmoid, MinMaxScaler, StandardScaler
문득 머신러닝/딥러닝을 공부하는데아래의 내용이 반복해서 나오기 시작했다. 뭔가 정리가 필요하다 .0~1 사이 숫자확률정규화스케일링SigmoidSoftmaxMinMaxScaler Softmax활성화 함수(Activation Function)Sigmo
standout.tistory.com
이후 개선된 아키텍처와 훈련방법을 통해 상위 5위 테스트 오차율은 3%까지 줄어들었다.
오늘날 기준 최신모델대비 알렉스넷은 소규모 신경망.
오늘 기준에서 VGG, ResNet, EfficientNet, Vision Transformer 당연히 최신 모델보다 성능이 낮다.
AlexNet은 현재 기준으로 실무활용보다는 상징적인 의미가 있다. AlexNet 등장 이후 이미지 - CNN - 결과 방식이 압도적으로 좋아졌고 컴퓨터 비전의 패러다임을 바꾼 모델이라고 평가받는다. 최초의 자동차, 증기기관차, 최초 스마트폰같은 존재랄까.
실무에서는 더이상 활용하지않으나 CNN 기본 구조를 이해하기 구조가 비교적 단순해 가장 쉽다.
즉 실제로 살펴보고 새 이미지를 사전 훈련된 모델에 넣어보기 최적인 상징적인 신경망.
'이론' 카테고리의 다른 글
| 입력변수의 개수 차원 Dimension, 차원의 저주 Curse of Dimensionality 와 차원축소 Dimensionality Reduction하는 이유 (0) | 2026.06.05 |
|---|---|
| Diagram 다이어그램 종류별 용어정리: Graph, Chart, Tree, Dendrogram (0) | 2026.06.05 |
| TorchVision : PyTorch 공식 홈페이지에서 제공하는 컴퓨터 비전 전용 라이브러리 (0) | 2026.06.04 |
| ResNet, 역전파를 그대로 사용하되 Residual Connection을 추가한 CNN (0) | 2026.06.04 |
| 머신러닝/딥러닝에서의 활성화/데이터전처리: Softmax, Sigmoid, MinMaxScaler, StandardScaler (0) | 2026.06.04 |