● 데이터 분석 (data analysis)
데이터 분석의 의미를 다시 살펴보면 ‘데이터’란 어떤 사건이나 현상에 대한 과거의 기록이다.
실시간에 가깝다 하더라도 데이터로 만들어진 순간 ‘과거’의 기록이 되는데, 이 데이터를 분석한다면 주요 사건이나 현상의 ‘과거’를 이해할 수 있다.
그리고 과거에 대한 이해를 바탕으로 앞으로 일어날 일도 예측할 수 있을 것이다.
이처럼 데이터 분석에서는 추론과 예측이 매우 중요하다.
먼저, 딥러닝은 예측에 강하다.
반면 셸로우 러닝(Shallow Learning)이라고도 불리는 유형의 기법들, 특히 선형 회귀 분석은 추론에 강하다.
데이터를 분석하는 목적이 무엇인지에 따라 어떤 방식의 기법을 선택하는지가 정해진다.
추론과 예측을 위한 분석의 궁극적인 목적은 X로부터 Y를 아는 것이다.
Y는 알고 싶은 대상(target) 값이며, X는 데이터에서 Y를 설명하고 예측하기 위해 사용되는 값이다.
X에 어떤 계산을 적용하면 Y가 나오는 것을 아는 것이 추론이고, 그 과정을 통해 X만 알고 Y는 모르는 상태에서 Y를 미리 계산하는 것이 예측이다.
X에 적용되는 계산은 단순하게 숫자를 곱하거나 더하는 것도 있고, 특정한 규칙을 적용할 수도 있으며, 심지어는 이런 계산을 여러 번 깊게 반복할 수도 있다.
여러 X에 계산이나 규칙을 한 번만 적용하면 그 과정을 이해하기 수월할 수 있지만,
딥러닝처럼 계산이나 규칙을 여러 번 적용하면 X와 Y의 관계를 이해하기는 무척이나 어렵다.
'수학 > 기초 이산 수학' 카테고리의 다른 글
7-3 . 선형 회귀 분석의 주요 개념 (0) | 2022.10.21 |
---|---|
7-2 . 선형 회귀 분석 (0) | 2022.10.21 |
6-3 . 분산 분석 (0) | 2022.10.20 |
6-2 . 분산 분석 (0) | 2022.10.20 |
6-1 . 상관 분석 (0) | 2022.10.20 |