AI 이론/Machine Learning

[머신러닝] 입문

jasonshin 2021. 11. 23. 13:21

머신러닝으로 할 수 있는 것

편지봉투에 손으로 쓴 우편번호 숫자 자동 판별
의료 영상 이미지에 기반한, 종양 판단
의심되는 신용카드 거래 감지
블로그 글의 주제 분류
고객들을 취향이 비슷한 그룹으로 묶기

문제와 데이터 이해하기

가지고 이는 데이터가 내가 원하는 문제의 답을 가지고 있는가?
내 문제를 가장 잘 해결할 수 있는 머신러닝 방법은 무엇인가
문제를 풀기에 충분한 데이터를 모았는가?
머신러닝의 성과를 어떻게 측정할 것인가

용어 및 설명

레퍼런스 : https://www.youtube.com/watch?v=KDrys0OnVho

Tensorflow 텐서플로(구글), Pytorch 파이토치(페이스북)

머신러닝 : Supervised , Unsupervised

Supervised Learning

우리는 Iris꽃의 꽃잎의 길이와 넓이, 꽃받침의 길이와 넓이 데이터를 가지고 있다. 이 데이터들을 가지고, Iris 꽃 (붓꽃) 의 품종을 분류할 수 있는 분류기를 만든다.

따라서, 새로운 꽃잎의 길이와 넓이, 꽃받침의 길이와 넓이에 대한 데이터를 입력하면, 이 붓꽃이 어떤 품종인지 분석이 가능하다.

이렇게 분류할 수 있는 분류기(classifier) 를 만들기 위해서는 데이터가 필요하며,

학습을 하기 위해서는, 데이터 뿐만 아니라, 품종이라는 결과를 학습 시키기 위해서, 데이터와 매핑된 품종 데이터도 함께 필요하다.

즉, 품종에 대한 데이터를 Lable 이라고 한다. 즉 이러한 레이블이 있는 데이터를 학습시키는 것이 지도학습이다.

레이블을 가지고 학습시키는 방법을 지도 학습 (Supervised Learning) 라고 한다.

Regression(회귀) 과 Classification(분류)

Regression

예 ) 어떤 사람의 교육수준, 나이, 주거지를 바탕으로 연간 소득을 예측하는 것
예 ) 옥수수 농장에서 전년도 수확량과 날씨, 고용 인원수 등으로 올해 수확량을 예측하는 것

Classifiation

예) 웹사이트가 어떤 언어로 되어있는가
예) 사진을 보고, 고양이 인지 강아지 인지, 소인지 분류

Training 과 Test

훈련 : 데이터를 입력하고, 그 결과인 레이블이 나오도록 만드는 과정. 즉, 데이터와 레이블을 통해 학습을 시키는 과정

테스트 : 학습이 완료된 분류기에, 학습에 사용하지 않은 데이터를 넣어서, 정답을 맞추는지 확인하는 작업

Generalization (일반화)

모델이 처음 보는 데이터에 대해 정확하게 예측할 수 있으면 이를 훈련 세트에서 테스트 세트로 일반화되었다고 함.

Overfiting (과대적합) / Underfitting (과소적합)

오버핏팅이란 학습한 결과과, 학습에 사용된 데이터와 거의 일치하여, 새로운 데이터가 들어왔을 때, 예측이 틀려 버리는 상태

새로운 데이터에 일반화되기 어렵다.

언더핏팅은, 그 반대다.

저작자표시 (새창열림)

'AI 이론 > Machine Learning' 카테고리의 다른 글

빅데이터 관련 홈페이지 모음 (0)	2021.11.29
[머신러닝] 타임시리즈 : Facebook의 Prophet() 활용 (0)	2021.11.29
[머신러닝] COUNT VECTORIZER (0)	2021.11.26
Feature Scaling (StandardScaler, MinMaxScaler) (0)	2021.11.23
[머신러닝, 딥러닝] 레이블인코딩 or 원핫인코딩, Training & Test (0)	2021.11.23

현재글[머신러닝] 입문

AI, API, Data Dev에 대해 다룹니다. | pfshin.dev@gmail.com

serverless, OpenCV, git, 깃, Computer Vision, CICD, AWS, EC2, github, python, 티스토리챌린지, ComputerVision, vscode, 판다스, API, 오블완, streamlit, pandas, 파이썬, severless,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

심플&스무스코딩

[머신러닝] 입문

문제와 데이터 이해하기

용어 및 설명

머신러닝 : Supervised , Unsupervised

Supervised Learning

Regression(회귀) 과 Classification(분류)

Training 과 Test

Generalization (일반화)

Overfiting (과대적합) / Underfitting (과소적합)

'AI 이론 > Machine Learning' 카테고리의 다른 글

'AI 이론/Machine Learning'의 다른글

티스토리툴바

[머신러닝] 입문

문제와 데이터 이해하기

용어 및 설명

머신러닝 : Supervised , Unsupervised

Supervised Learning

Regression(회귀) 과 Classification(분류)

Training 과 Test

Generalization (일반화)

Overfiting (과대적합) / Underfitting (과소적합)

'AI 이론 > Machine Learning' 카테고리의 다른 글

'AI 이론/Machine Learning'의 다른글

관련글

티스토리툴바