소개글
미국 부동산 자료를 가지고 SAS data mining을 한 결과를 리포트한 PPT입니다.A+를 받은 자료입니다. 잘 사용하세요
목차
목적DIAGRAM
Insight 노드
Variable Selection
Regression
Partition
비즈니스 활용 방안
본문내용
SAS FINAL PROJECT목적
SAS Enterprise Miner를 이용하여 각 요인과 목표변수인 집 값의 관계를 결정계수(R-square)와 그래프 혹은 그림 등을 이용하여 가장 적절한 요인을 찾은 후 그 요인과 집 값과의 관계를 살펴
보고 부동산 가격을 예측하며, 그에 대한 비즈니스 전략 방안을 마련해 본다.
DIAGRAM
부동산 가격값을 예측하는 최종 모델
변수의 안정화, 비선형의 제거, 비정규성의 수정등에 사용되어 질때 두 모델이 비슷한 결과값을 얻게 되지만 Transform variables -> Variable selection의 모델이 lift value와 민감도가 더 높은 것으로 나타나 Filter outliers -> Replacement -> variable selection모델은 사용하지 않기로 하였다.
Insight 노드
★ 히스토그램 (각 변수들과 집값의 빈도) - 결측치나 이상치를 찾거나, 관측값들이 어느 한 부분으로 지나치게 치우쳐 있지 않은 지 등을 쉽게 알 수 있다.
★ 산점도 (집의 가격에 영향을 주는 요인들)
Variable Selection
Variable Selection
Regression
Effect T-scores
Regression
Estimates
Regression
산점도
Partition
Model
Partition
Lift
민감도
R
40:30:30
5.54
R
T
40:30:30
5.51
N
40:30:30
5.32
E
40:30:30
5.51
R
70:30
4.17
R
T
70:30
4.14
N
70:30
4.34
R
90:10
3.87
R
T
90:10
4.19
N
90:10
3.87
R
50:50
4.24
R
T
50:50
4.01
N
50:50
4.77
R
60:40
4.21
R
T
60:40
4.54
N
60:40
4.67
R
40:60
4.78
R
T
40:60
4.77
N
40:60
4.73
Regression, Tree, Neural Networks, Ensemble의 모델을 Traing, Validation, Test를 분할하여 예측기법의 정확도를 측정하기 위해 partition의 조절을 하였다.
각각의 lift와 민감도를 비교를 하였을 때 표의 결과와 같이 40:30:30의 비율이 가장 좋은 설정이었다.
Partition
<40:30:30 - Lift>
Partition
<40:30:30 - 민감도>
부동산 가격을 상, 중, 하의 3가지 점주로 분류하기 위해 MEDV값을 세 분류로 구간화 하였다. 5~20.33, 20.33~35.66, 35.66~50까지 각각의 새로운 target을 class로 만들었다.
class attribute는 nominal로 설정
Model
Partition
Lift
민감도
R
40:30:30
1.17
R
T
40:30:30
1.02
N
40:30:30
1.21
DIAGRAM
부동산 가격유형을 예측하는 분류모형
Model
Partition
Lift
민감도
R
CLASS 1
40:30:30
5.32
R
T
5.53
N
5.39
E
5.53
R
CLASS 2
40:30:30
5.32
R
T
5.53
N
5.39
E
5.53
R
CLASS 3
40:30:30
10
R
T
10
N
10
E
10
R
CLASS 1
70:30
4.46
R
T
4.46
N
4.46
E
4.46
R
CLASS 2
70:30
5.32
R
T
5.53
N
5.30
E
5.53
R
CLASS 3
70:30
10
R
T
10
N
10
E
10
Lift Chart (class 1)
ROC (class 1)
Confusion Matrix (class 1)
Lift Chart (class 2)
ROC (class 2)
Confusion Matrix (class 2)
Lift Chart (class 3)
ROC (class 3)
Confusion Matrix (class 3)
Confusion Matrix
비즈니스 활용 방안
부동산마케팅이란 부동산시장에서 부동산제품을 팔고 사고 임대차 하는 것을 의미한다. 부동산은 토지와 건물 등 물리적 집합체에 불과하나 마케팅의 관점에서 부동산은 그로부터 획득되는 정신적, 육체적 만족의 총체로 파악된다. 부동산마케팅 활동에 영향을 미치는 환경의 구성요소는 거시환경과 미시환경으로 나눌수 있다.
거시환경은 자연환경과 인문환경으로 나눌 수 있는데 인문환경은 다시 경제적 기술적 환경, 정치적 행정적 환경, 사회적 문화적 환경등으로 나누어 볼수 있다. 자연환경은 부동산마케팅 활동에 있어서 중요한 변화를 줄 수 있는 요소로 공기오염, 오염처리, 일조권 보호등은 생활하는 데 중요한 요소들로 보호하지 않으면 안되며 쾌적한 자연환경을 강조한 마케팅은 설득력이 좋아진다.
부동산 컨설팅 회사를 설립하고 주택인근에 소득수준에 따른 상권을 추천해주며 집값에 대한 예측정보를 제공해주는 비즈니스를 한다.
이에 따라 가격 하, 중의 모델은 lift값이 5점대로 신뢰성이 있지만 가격 상의 모델은 lift값이 10이 나왔기 때문에 집값에 대한 Segmentation을 3개를 나누고 이에 따른 targeting을 차별화 마케팅을 한다.
비즈니스 활용 방안
금리와 부동산시세
먼저 금리는 부동산시세와 음의 상관관계를 보이고 있다. 즉 다시 말하자면 금리가 인상되면 부동산시세는 내려가며, 금리가 인하되면 부동산시세는 올라간다.
부동산과 주식/환율/금리를 통해 선물옵션시장의 arbitrage와 spread 이득을 취하는 데 컨설팅 자료를 주는 비즈니스를 한다.