과목 소개 및 데이터 분석의 이해
이 장에서는 ‘데이터 분석 및 학습 기술’ 과목을 본격적으로 수강하기에 앞서, 우리가 알아야 할 필수적인 배경 지식과 분석의 전체 흐름을 개괄적으로 살펴봅니다. 데이터가 왜 중요한지 깨닫고 분석의 기초 개념을 튼튼히 다지는 오리엔테이션 공간입니다.
학습목표
- 시대적 요구에 따른 데이터 분석의 필요성과 다양한 산업군에서의 응용 사례를 파악합니다.
- 데이터가 가치를 지니게 되는 DIKW 피라미드와, 데이터의 형태(정형/비정형)를 명확히 구분할 수 있습니다.
- 실무에서 반복되는 데이터 분석의 6단계 전체 프로세스를 이해하고, 본 강의의 14주차 학습 로드맵과 연결할 수 있습니다.
과목 핵심 목차
1.1 데이터 분석 학습 개요
데이터의 시대적 의미와 필요성, 정형/비정형 데이터의 구분, 그리고 분석가로서의 학습 로드맵을 구축합니다.
1.2 산업 현장 실전 활용 사례
로보어드바이저, 이커머스 예측, 스마트 팩토리 등 다양한 산업에서 데이터가 실제로 어떻게 가치를 창출하는지 실제 사례를 살펴봅니다.
1.3 데이터 분석의 완성과 통찰력
코딩 기법을 넘어 자신의 도메인 지식과 결합하여 비즈니스의 ‘통찰(Insight)’을 이끌어 내는 진정한 데이터 분석의 목적을 다집니다.
1.4 데이터의 정의와 DIKW 피라미드
원시 데이터가 지혜(Wisdom)로 승화되는 DIKW 피라미드 구조와, 정량적/정성적, 수치형/범주형 등 데이터의 기본 성질을 학습합니다.
1.5 데이터의 세분화와 구조
가공되지 않은 원시 데이터를 연속형, 이산형, 명목형 등 세부적으로 구분하고 컴퓨터에게 올바르게 지시하기 위한 뼈대와 구조화 방법을 익힙니다.
1.6 빅데이터의 3V 특성
기존의 한계를 무너뜨린 빅데이터 3대 특성(크기, 속도, 다양성)을 파악하고, 이를 정보로 가공하는 시각화 기술과 통계 오류의 함정을 꿰뚫어 봅니다.
1.7 데이터 분석의 과정 (6단계) 및 로드맵
기획에서부터 전처리(Cleaning), 탐색적 분석(EDA), 모델링, 시각화에 이르는 비즈니스 실전 데이터 분석의 6단계 파이프라인 흐름을 조망합니다.
1.8 클라우드 컴퓨팅과 빅데이터
거대한 빅데이터 처리를 가능하게 만든 핵심 인프라인 ‘클라우드 컴퓨팅’과 막강한 병렬 연산 능력을 제공하는 ‘GPU 칩셋’의 혁명을 이해합니다.
1.9 인공지능과 거대언어모델(LLM)
데이터라는 밥(연료)을 바탕으로 탄생한 생성형 AI의 진화 과정과, 세상을 놀라게 한 챗GPT(LLM)의 확률적/원리적 작동 방식을 파헤칩니다.
1.10 AI 시대의 생존 무기와 직업 윤리
AI의 편향성과 윤리적 딜레마를 경계하며, 도메인 지식, 프롬프트 엔지니어링, 그리고 파이썬이라는 마스터키로 미래 융합 생태계에서 살아남는 생존 무기를 갈무리합니다.
정리
이번 오리엔테이션 장(Intro)을 통해 우리는 데이터 리터러시의 중요성을 깨닫고, 단순한 타이핑 코딩을 넘어 “무엇을 위해 데이터를 분석하는가?”라는 숲을 바라볼 수 있게 되었습니다. 데이터 전처리부터 모델링, 시각화에 이르는 6단계 분석 흐름을 기억해 두면, 앞으로 여러분이 수강할 복잡한 테크닉(Numpy, Pandas, Scikit-learn)들이 전체 과정에서 어느 부분을 담당하는지 결코 길을 잃지 않을 것입니다.