Matrix-1주차 스터디

matrix

민지기il 2024. 3. 21. 17:27

Q1 머신러닝이 뭔가요?

1. 인공지능, 머신러닝, 딥러닝의 차이는?

: 인공지능 > 머신러닝 > 딥러닝

2. 머신 러닝(Machine Learning) : “기계 학습”

- 머신이란? : 인간이 제공한 데이터를 표현할 수 모델(함수)

- 학습이란? : 데이터를 가장 잘 표현할 수 있는 모델을 찾는 것(모델의 파라미터 최적화)

- 어떻게 하나요? : 통계적인 방법 혹은 경사하강법을 이용해 최적의 파라미터를 찾음

-> 파라미터: 기계가 스스로 학습하는 값

-> 하이퍼파라미터: 인간이 정해야 하는 변수

3. 머신러닝이 아닌 인공지능은 무엇이 있을까?

- 규칙기반 알고리즘과 머신러닝의 차이점은?

규칙 기반 알고리즘은 사람이 직접 규칙을 정의하고, 이러한 규칙을 사용하여 입력 데이터를 처리하고 문제를 해결한다.

머신 러닝은 데이터에서 패턴을 학습하여 문제를 해결하는 방법이다. 데이터로부터 통계적 패턴이나 특성을 추출하여 모델을 구축하고, 이를 사용하여 예측이나 결정을 수행한다.

Q2 머신러닝의 종류

머신러닝에는 지도학습, 비지도학습, 자기지도학습, 강화학습으로 크게 네가지 종류가 있습니다.

1. 구분하는 기준이 뭔가요?

훈련지도를 하는지, 실시간으로 훈련하는지, 예측 모델을 사용하는지에 따라 구분한다.

즉 주어진 데이터와 모델이 상호 작용하는 방식에 따라 구분됩니다.

2. 지도(supervise)가 뭐죠?

사람이 입력 값과 출력 값(그에 해당하는 정답)을 제공하는 것이다. 따라서 지도 학습이란 사람이 입력 값과 출력 값을 제공하여 학습을 시키는 것을 의미한다. 즉, 문제와 정답이 있는 데이터를 기계가 학습하여 나중에 이런 문제가 주어지면 정답을 예측해 주는 것입니다.

3. 지도학습은 뭔가요?

- 지도학습에는 회귀와 분류가 있습니다. 두 개념에는 어떤 차이가 있을까요?

-> 분류: 데이터가 범주형 변수를 예측하기 위해 사용될 때 == 이산적
이미지에 강아지나 고양이와 같은 레이블을 할당하는 경우에 해당한다.

Ex) 스팸 필터 – 여러가지 메일과 발송 기관 등을 샘플로 훈련하여 스팸메일인지 아닌지를 분류

-> 회귀: 연속 값을 예측할 때 == 연속적

트레이닝 데이터를 이용하여 연속적인 값을 예측하는 것

Ex) 중고차 가격 예측 – 대량의 중고차 판매 데이터에서 주행거리, 연식, 브랜드 등을 사용하여 중고차 가격 예측

- segmentation이란? (선택)

이미지 처리 분야에서 주어진 이미지를 픽셀 또는 영역으로 분할하는 작업을 의미한다.

각 픽셀 또는 영역은 특정 클래스 또는 레이블에 할당되며, 일반적으로 각 픽셀 또는 영역이 속한 클래스를 예측하기 위해 지도 학습 알고리즘이 사용된다.

4. 비지도 학습: 정답 없이 데이터를 학습한다. 이것의 목적은 인간의 개입이 없는 데이터를 스스로 학습하여 그 속의 패턴(pattern) 또는 각 데이터 간의 유사도(similarity)를 학습한다.

- 차원축소란?: 매우 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것

5. 알파고는 뭘 기반으로 할까요?

: 강화학습-알파고가 학습을 진행하며 얻은 보상과 벌점을 통해 가장 큰 보상을 얻기 위해 최상의 정책(policy)을 스스로 학습하는 것

6. 자기지도학습: 여기서 지도학습은 레이블이 존재하는 특정 태스크에 대해 수행하는 학습이고, 비지도학습은 레이블이 존재하지 않는 데이터에 대해 데이터 내의 패턴을 파악하는 알고리즘이다.

레이블링 된 데이터셋으로 모델을 학습하는 지도학습과 달리, 다량의 레이블이 없는 원데이터로부터 데이터 부분들의 관계를 통해 레이블을 자동으로 생성하여 지도학습에 이용한다. (비지도학습 기법 중 하나)

데이터의 일부분을 은닉하여 모델이 그 부분을 예측하도록 학습한다.

프리텍스트 태스크(pretext task): 딥러닝 네트워크가 어떤 문제를 해결하는 과정에서 데이터 내의 semantic한 정보를 이해할 수 있도록 학습하게 하는 임의의 태스크이다. (사용자 임의대로 정의)

레이블이 없는 데이터를 이해하도록 pretext task를 위한 레이블을 직접 생성하여 모델을 학습하거나 데이터 간의 관계를 이용하여 학습

이렇게 사전학습된 모델을 데이터셋을 representation learning하여 다른 태스크로 전이 시켜 사용한다.

⇒ 새로운 태스크에서 소량의 데이터만으로 semantic representation을 찾게 하여 좋은 성능을 내는 전이학습(transfer learning)

 메타코드 강의 참고