1.4.1 데이터의 정의
학습목표
본 장에서는 ‘데이터(Data)’가 단순히 컴퓨터 속의 복잡한 숫자나 엑셀 표라는 좁은 편견에서 벗어나, 우리가 보고 듣고 행동하는 세상의 모든 흔적과 기록임을 깨닫습니다. 또한 이러한 원시 데이터가 가공되기 전 요리의 날것(순수한 식재료)과 같다는 점을 직관적으로 이해하여 데이터 분석의 첫 출발점을 단단히 다집니다.
데이터의 진짜 모습
“데이터가 무엇인가요?”라고 질문하면 대부분의 사람들은 엑셀표나 복잡한 숫자, 0과 1로 이루어진 컴퓨터 코드를 떠올립니다.
하지만 데이터는 숫자에만 국한되지 않습니다.
여러분이 말하는 목소리, 방금 찍은 셀카 사진, 오늘 아침의 공기 온도까지 세상의 모든 흔적이 데이터입니다.

데이터(Data)의 사전적 정의
데이터(Data)의 어원은 라틴어 ‘Dare(주다)’의 과거분사형인 ‘Datum(주어진 것)’의 복수형입니다.
즉, 세상에 이미 존재하고 관찰되었으나 아직 가공되지 않은 ‘있는 그대로의 순수한 사실(Fact)’ 덩어리들을 의미합니다.
비유: 요리 재료 앞의 요리사
밀가루 1kg, 계란 3개, 우유 1리터. 이것들은 그 자체로는 ‘아직 먹을 수 없는 날것의 재료’입니다. 데이터 분석의 세계에서 이것들은 ‘순수 데이터(Data)’에 속합니다. 이 재료를 어떻게 굽고 튀길지 결정하기 전, 이 뼈대를 이해하는 것이 가장 중요합니다.

정리
데이터는 아직 가공되지 않은 순수한 ‘사실(Fact)’ 그 자체입니다.
- 데이터의 무한한 확장: 컴퓨터 화면 속 0과 1뿐만 아니라 스마트폰의 터치, 오늘 아침의 온도, 방금 찍은 셀카까지 세상에 존재하는 모든 흔적이 곧 데이터입니다.
- 날것의 재료: 밀가루 1kg과 계란 3개만으로는 당장 케이크를 맛볼 수 없듯이, 가공되지 않은 순수 데이터는 그 자체로는 의미결정을 내릴 수 없는 요리의 가장 기본적인 뼈대 재료에 불과합니다.
우리는 이제 거대한 식재료 창고의 문턱에 섰습니다. 이 거친 날것의 재료들이 어떻게 세상을 바꾸는 가치 있는 요리(지혜)로 변해가는지 다음 장에서 본격적으로 살펴보겠습니다.
서브목차