가장 직관적이고 간단한 모델인 선을 구하고 분석하는 방법을 선형 회귀 분석이라고 한다. - 머신러닝에서는 크게 2가지로 나눠서 분석을 하게 된다.
1. Regression (회귀)
예측하고 싶은 종속변수가 숫자일 경우 사용하는 방식으로 특정 수를 예측하고 싶을 때 많이 쓰이는 방법이다.
2. Classification (분류)
예측하고 싶은 변수가 문자또는 이름일 경우 사용하는 방식으로 대표적으로 정상, 비정상처럼 분류를 하여 예측할 때 많이 사용하는 방법이다.
모델 설정에 기준이 되는 가장 기초적이면서 직관적이고 최소한의 성능을 나타내는 모델이다.
보통은 평균값을 기준으로 사용하여 평균 기준모델이라고도 불린다.
다중 선형회귀로 분류할 때, 가장 큰 차이점은 독립 변수의 개수이다.
말 그대로 단순 선형 회귀는 독립 변수가 X가 하나뿐인 단순한 선형 회귀를 말한다.
상관계수로 두 변량 X, Y 사이의 상관관계의 정도를 나타내는 수치를 말한다.
상관관계는 반드시 -1과 1 사이에 위치하며, -1에 가까울수록 음의 상관관계, 1에 가까울 수록 양의 상관관계를 의미한다.