카테고리 없음
데이터 과학 이란?
best2253
2025. 9. 4. 13:16

📊 데이터 과학(Data Science) 정리
1. 데이터 과학의 정의
- 데이터 과학은 방대한 데이터를 수집·분석하여 **유의미한 인사이트(통찰)**를 도출하고, 이를 기반으로 의사결정과 문제 해결을 지원하는 학문 및 기술 분야.
- 통계학, 컴퓨터 과학, 인공지능, 수학, 도메인 지식을 융합한 학제적 분야.
2. 데이터 과학의 주요 단계 (프로세스)
- 문제 정의
- 해결해야 할 비즈니스 문제 또는 연구 목표 설정
- 데이터 수집
- 데이터베이스, 웹 크롤링, 센서, 로그 등 다양한 출처에서 데이터 확보
- 데이터 전처리 (Data Preprocessing)
- 결측치 처리, 이상치 제거, 정규화, 데이터 정제
- 탐색적 데이터 분석 (EDA: Exploratory Data Analysis)
- 통계적 요약, 시각화, 상관관계 파악
- 모델링 및 알고리즘 적용
- 머신러닝, 딥러닝, 통계적 모델을 활용하여 예측/분류/군집화
- 평가 및 해석
- 성능 지표(정확도, F1 score, RMSE 등)를 이용해 모델 성능 평가
- 결과 활용 및 배포
- 인사이트 도출, 비즈니스 적용, 서비스 배포
3. 데이터 과학의 핵심 기술
- 프로그래밍 언어: Python, R, SQL
- 수학·통계학: 확률, 회귀분석, 가설검정
- 머신러닝/딥러닝: Scikit-learn, TensorFlow, PyTorch
- 데이터 처리: Pandas, NumPy, Spark
- 데이터 시각화: Matplotlib, Seaborn, Plotly, Tableau
- 클라우드/빅데이터: AWS, GCP, Hadoop
4. 데이터 과학의 활용 분야
- 비즈니스 분석: 고객 행동 분석, 매출 예측
- 금융: 신용평가, 이상 거래 탐지
- 헬스케어: 질병 예측, 신약 개발
- 제조업: 불량 예측, 생산 공정 최적화
- 자율주행/스마트시티: 센서 데이터 분석
- 추천 시스템: 유튜브, 넷플릭스, 쇼핑몰 추천
5. 데이터 과학 vs 인접 개념
구분데이터 과학인공지능(AI)빅데이터
| 관점 | 데이터에서 인사이트 도출 | 인간 지능 모방 | 대규모 데이터 처리 |
| 중점 | 분석 & 의사결정 | 자동화 & 학습 | 저장 & 관리 |
| 관계 | AI·빅데이터와 상호 연계 | 데이터 과학에 활용됨 | 데이터 과학 기반 제공 |
6. 데이터 과학자의 역할
- 데이터 수집 및 정제 전문가
- 머신러닝 모델 개발 및 최적화
- 데이터 기반 의사결정 지원
- 데이터 엔지니어 ↔ 데이터 분석가 ↔ 머신러닝 엔지니어 사이의 연결자 역할 수행

이러한 데이터 과학을 이용해서 어떻게 자료를 분석해 가는지 실제 사례를 이용해서
확인해 봅시당~~~

반응형