* 빅데이터란
빅데이터란 데이터가 너무 방대하여 기존의 방법이나 도구로 수집, 저장, 분석이 어려운 정형 및 비정형 데이터를 의미한다.
* 빅데이터의 3 요소
1) 크기(Volume) : 기존 시스템으로 저장, 분석이 어려울정도로 데이터의 크기가 거대한데 이것을 처리 해야함
2) 속도(velocity) : 데이터의 생성, 저장 등의 과정이 빨리 이루어져야함 (배치처리, 실시간 처리)
3) 다양성(variety) : 정형, 반정형, 비정형 등 다양한 데이터로 구성되고 처리할수 있어야함
(정형 : 문자 그대로 정형화된 데이터, 고정된 필드에 저장되어있는 데이터,
반정형 : 고정된 필드에 저장되지는 않지만 xml이나 html과 같이 메타데이터나 스키마를 포함하는 데이터,
비정형 : 고정된 필드에 저장돼 있지 않은 데이터를 의미)
* 하둡이란
대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈소스 프레임워크이다.
(분산 파일 시스템인 HDFS에 데이터를 저장하고 분산 처리 시스템인 맵리듀스를 이용해 데이터를 처리)
자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다. 자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다. 저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
파일오류
중복자료
저작권 없음
설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우