본문 바로가기

전체 글45

Assignment Python Tutorial 강의상으로 중간고사 범위까지 공부를 하였다. cs231n은 과제 3개가 있다고 해서 오늘부터 해보려고 한다. https://cs231n.github.io/ 사이트에 들어가서 Assignment#1 부터 할 것이다. python은 1학년 때 해보고 안 해봐서 복습을 먼저 했다. https://cs231n.github.io/python-numpy-tutorial/ 참고 Slicing nums = list(range(5)) print(nums) #[0,1,2,3,4] 출력 print(nums[2:4]) #[2,3] 출력 print(nums[:2]) #[0,1] 출력 print(nums[2:]) #[2,3,4] 출력 Enumerate animals = ['cat', 'dog', 'monkey'] for idx,.. 2024. 3. 14.
CS231n(10) Recurrent Neural Networks 지난시간) - gradient flow를 적절히 manage해야 한다. 이를 위해 Densenet과 Fractalnet이 등장했다. - parameter: 모델이 학습하는 가중치(weight)와 편향(bias)을 가리킨다. 이들은 입력 이미지를 특정 클래스로 분류하거나 원하는 작업을 수행하는 데 사용된다. 각 계층(layer)에는 여러 개의 필터(filter)가 있고, 이러한 필터는 입력 이미지의 특징을 감지하기 위해 사용된다. 예를 들어 CNN 모델에서 첫 번째 합성곱 계층에서는 필터마다 가중치와 하나의 편향이 있다. 이 가중치와 편향은 입력 이미지와 필터를 합성곱하여 특징 맵(feature map)을 생성하는 데 사용된다. Recurrent Neural Networks - network가 handle.. 2024. 3. 13.
CS231n(9) CNN Architectures CNN Architecture 9강은 최신 CNN 아키텍처에 대한 강의이다. 모두 imageNet 챌린지에서 우승하였다. 복습) 이미지를 입력으로 받아 stride = 1 인 5x5 필터를 통해 몇 개의 Conv Layer와 pooling layer를 거치고, 마지막으로 FC Layer를 통과한다. 간단한 모델이지만 필기체 숫자 인식에서 성공하여 우편번호(zip code) 인식에 사용되었다. 1) AlexNet -최초의 거대한 convolutional neural network였다. Input: 227 x 227 x3 images FirstLayer(CONV1): 96개의 11x11 filters applied at stride 4 Q1) Output Volume?: (227-11)/4 + 1 =55 답.. 2024. 3. 12.
C231n(8) DeepLearning Software 지난시간 요약) -optimization을 위한 fancier한 algorithm들에 대해 배움 ex) SGD+Momentum, Nesterov, RMSProp, Adam ... -Regularization ex) dropout: network를 무작위로 0으로 설정한 다음 테스트 시 뒤쪽의 noise를 무시한다 -Transfer Learning: 일부 데이터 세트에 대해 사전 훈련된 대규모 network를 다운로드하고 자신의 문제에 맞게 미세조정하는 방법 DeepLearning Software CPU VS GPU CPU: Central Processing Unit ; 코어가 4-6개 있고 하이퍼스레딩 기술을 사용하면 물리적으로 8-20개 스레드를 사용한다 GPU: Graphics Processing .. 2024. 3. 10.