데어터웨어하우징및데이터마이닝(125028)

2016학년도 1학기

 

교재

(1) Data Smart, 엑셀로 이해하는 데이터 과학 입문, 포먼 지음, 고석범 옮김, 에이콘출판사, 2015 07 28일 출간

(2) 통계학(3), 저자 류근관, 법문사, 2013 2 20일 출간

(3) http://tutorials.istudy.psu.edu/basicstatistics/index.html

(4) http://stattrek.com/tutorials/statistics-tutorial.aspx

 

매주 쪽지시험 or 과제 발표

 

강의일정표

날짜

주제

내용

예습/숙제

참고자료

1

3.2()

소개

 

 

2

3.9()

엑셀 기초

Data Smart 1

Variables

Population vs sample

 

쪽지시험

 

엑셀 연습문제

3

3.16()

Clustering

(쪽지시험 )

Data Smart 2

Central tendency

Variability

Measures of position

 

쪽지시험

 

VBA implementation of K-means algorithm

 

4

3.23()

Naive Bayes

Data Smart 3

 

(쪽지시험 범위)

Probability

 Probability basics

Sets and subsets

Stat experiments

Counting data points

 Probability laws

What is probability

Probability problems

Rules of probability

Bayes' rule

Data Smart 3장 읽고 실습하기 ß 내용 요약하기(3 22일 정오 제출 마감).

 

WineKMC.xls파일에 Kmeans VBA 적용하기 (3 22일 정오 제출 마감)

 

쪽지시험

 

How To Implement Naive Bayes From Scratch in Python

5

3.30()

Optimization Modeling

Data Smart 4

(쪽지시험 범위)

 Random variables

Types of variables

Distributions

Mean and variance

Independence

Combining

Transforming

Data Smart 4장 읽고 실습하기 ß 내용 요약하기(3 29일 정오 제출 마감).

쪽지시험

 

6

4.6()

Network Graphs and Community Detection

Data Smart 5

(쪽지시험 범위)

 Sampling theory

Random sampling

Central tendency

Variability

Sampling distribution

Diff between props

Diff between means

Data Smart 217쪽 하단의 연습 과제를 수행한 엑셀 파일 제출 (4 5일 정오 제출 마감).

 

Data Smart 5장 읽고 실습하기 ß 내용 요약하기(4 5일 정오 제출 마감).

쪽지시험

 

4.13()-선거일

 

 

 

 

7

4.20()

Regression

Data Smart 6

 

쪽지시험 범위

Distributions

 Distribution basics

Probability dist

Discrete/continuous

 Discrete

Binomial distribution

Negative binomial

Hypergeometric

Multinomial

Poisson

 Continuous

Normal distribution

Standard normal

Student's t

Chi-square

F distribution

 

Receiver operating characteristic

 

Data Smart 6장 읽고 실습하기 ß 내용 요약하기(4 19일 정오 제출 마감).

쪽지시험

 

8

4.27()

Ensemble model

Data Smart 7

 

Estimation

 Estimation theory

Estimation overview

Standard error

Margin of error

Confidence intervals

 

Data Smart 7장 읽고 실습하기 ß 내용 요약하기(4 26일 정오 제출 마감).

쪽지시험

9

5.4()

Ensemble models

Data Smart 7

 

Estimation

Proportions

Estimate proportion

Small samples

Diff between props

Mean scores

Estimate mean

Diff between means

Matched pairs

Data Smart 7장 엑셀 연습

엑셀 문제

 

쪽지시험

10

5.11()

Forecasting

Hypothesis Testing

 Foundations of testing

Hypothesis tests

How to test

 

Data Smart 8장 읽고 실습하기 ß 내용 요약하기(5 10일 정오 제출 마감).

쪽지시험

11

5.18()

Outlier detection

Hypothesis Testing

 Mean scores

Test of the mean

 

Data Smart 9장 읽고 실습하기 ß 내용 요약하기(5 17일 정오 제출 마감).

쪽지시험

12

5.25()

R

Hypothesis Testing

 Power

Region of acceptance

Power of a test

How to find power

 

Data Smart 10, 483쪽까지 읽고 실습하기 (요약문은 제출하지 않음)

쪽지시험

13

6.1()

R

Hypothesis Testing

 Chi-square tests

Goodness of fit

Homogeneity

Independence

 

Data Smart 10, 498쪽까지 읽고 실습하기 (요약문은 제출하지 않음)

쪽지시험

14

6.8()

R

 Linear regression

Measurement scales

Linear correlation

Linear regression

Regression example

 Regression tests

Residual analysis

Transformations

Influential points

Slope estimate

Slope significance

 

Data Smart 책 끝까지 읽고 실습하기 (요약문은 제출하지 않음)

쪽지시험

15

6.15()

기말고사

 

범위: Data Smart 전체

내용: 장의 핵심 개념(엑셀 조작 제외)

문제유형: 단답형, 서술형

오픈북