1.4 데이터의 정의와 DIKW 피라미드

학습목표

본 장에서는 막연하게 느껴지는 ‘데이터(Data)’의 정확한 개념을 다잡고, 이 원시 데이터가 전처리 과정을 거쳐 궁극적으로 비즈니스의 ‘지혜(Wisdom)’로 승화되는 DIKW 피라미드의 전체 구조를 뼈대부터 학습합니다. 또한 데이터의 고유한 성질(정성적/정량적, 연속형/범주형)에 따른 올바른 분류법을 익힙니다.

목차

이 장에서는 다음의 주제들을 학습합니다:

1.4.1 데이터의 정의와 DIKW 피라미드

데이터(Data)의 본질적인 어원과 의미, 그리고 분석의 가장 밑바탕이 되는 날것의 가공 전 상태를 요리 재료에 빗대어 직관적으로 이해합니다.

1.4.2 DIKW 피라미드란?

수집된 흩어진 흔적(원시 데이터)이 가공을 거쳐 정보(Information)와 지식(Knowledge)이 되고, 마침내 최종적인 의사결정 방식인 지혜(Wisdom)로 진화하는 4단계의 상승 구조를 학습합니다.

1.4.3 데이터종류

통계적으로 계산 가능한 ‘정량적(수치형) 데이터’와 문맥/감정이 듬뿍 담긴 ‘정성적(텍스트형) 데이터’의 뚜렷한 차이점을 구분하고 적재적소의 분석 도구를 매칭합니다.

1.4.4 데이터의 중요성과 세분화

수치형(연속형/이산형)과 범주형(명목형) 데이터의 디테일한 세분화 규칙과 이름표를 익혀, 컴퓨터에게 올바른 명령(기계학습)을 내리기 위한 절대적인 전제 조건을 확립합니다.

정리

데이터 분석은 단순한 숫자 놀음이 아니라, 무의미하게 흩어진 발자국(Data)에서 가치 있는 통찰과 반짝이는 지혜(Wisdom)를 조각해 내는 현대 융합 예술입니다.

데이터를 다루기 전, 내 앞에 놓인 재료가 숫자로 연산 가능한 ‘수치형’인지 특정 그룹을 나누는 ‘범주형’인지 완벽하게 꿰뚫어 보는 통찰력과 시력이 바로 이 장에서 다루는 뼈대 구조를 견고하게 조립하는 것에서 출발합니다.

서브목차