분석학 ) 마이크로소프트의 Team Data Science Process 분석 방법론에 대해 논하시오
- 최초 등록일
- 2022.03.04
- 최종 저작일
- 2022.02
- 9페이지/ 한컴오피스
- 가격 4,300원
목차
1. Team Data Science의 개요 및 기능
2. 구성 요소
1) 데이터 사이언스 생명 주기
2) 표준화된 프로젝트 구조
3) 인프라 및 리소스
4) 도구 및 유틸리티
3. 역할
1) 그룹 매니저
2) 팀 리더
3) 프로젝트 리더
4) 프로젝트 참여자
4. Team Data Science Process 사용 및 학습을 위한 안내
1) 분석 프로젝트를 위한 프로세스의 이해
2) 데이터 저장 공간에 대한 이해
5. 출처 및 참고문헌
본문내용
1. Team Data Science의 개요 및 기능
Team Data Science Process는 마이크로소프트사(社)에서 2016년에 런칭한 인공지능 기반의 프레임워크로, 팀 내의 각 역할을 올바르게 수행할 수 있기 위한 예측형 분석 솔루션을 제공한다. Team Data Science Process는 팀 내의 역할을 올바르게 수행할 수 있도록 방향성을 제시함으로써 팀의 협동력과 효율성을 향상시킬 수 있다.
2. 구성 요소
마이크로소프트에 따르면 Team Data Science Process의 주요 구성 요소는 데이터 사이언스 생명 주기, 표준화된 프로젝트 구조, 인프라 및 리소스, 도구 및 유틸리티의 네 가지로 이루어져 있다.
2.1. 데이터 사이언스 생명 주기
데이터 사이언스 생명 주기는 하나의 프로젝트를 수행할 때의 전체적인 단계를 의미한다. 다른 곳에서 제공되는 생명 주기 방식을 도입하거나 사용자가 지정한 생명 주기 방식을 채택할 수도 있다.
생명 주기의 각 단계에는 프로젝트 내에서 솔루션 설계자, 프로젝트 관리자, 데이터 엔지니어, 어플리케이션 개발자 등의 역할을 맡은 다양한 사람들이 배치된다. 생명 주기는 주로 프로젝트 내에서 일반적으로 수행되는 다음과 같은 반복 작업들을 관리하는 데에 용이하다.
다음의 그림은 생명 주기를 도식화한 것이다.
위의 그림을 살펴보면 Team Data Science Process 생명 주기는 다음과 같이 총 다섯 단계로 나눌 수 있다.
- 비즈니스 분석: 비즈니스를 분석하고 이해하여 프로젝트의 목적과 데이터의 소스를 정의한다. 모델 타겟으로써 수행해야 하는 핵심 사항(또는 핵심 변수)을 구체화하는 것이 이 단계에서의 목표이며, 이 핵심 사항을 얼마나 잘 정의하는 지가 프로젝트의 성패를 좌우한다. 또한 프로젝트 내에서 수집해야 하는 데이터들의 출처를 식별하는 작업도 이 단계에서 수행된다.
참고 자료
Team Data Science Process, 마이크로소프트 공식 홈페이지, https://docs.microsoft.com/en-us/azure/architecture/data-science-process/overview