• LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

빠른 클러스터 개수 선정을 통한 효율적인 데이터 클러스터링 방법

(주)코리아스칼라
최초 등록일
2023.04.05
최종 저작일
2018.06
8페이지/파일확장자 어도비 PDF
가격 4,000원 할인쿠폰받기
다운로드
장바구니

* 본 문서는 배포용으로 복사 및 편집이 불가합니다.

서지정보

발행기관 : 한국산업경영시스템학회 수록지정보 : 산업경영시스템학회지 / 41권 / 2호
저자명 : Sung-Soo Kim, Bum-Su Kang

목차

1. 연구의 배경 및 목적1
2. 빠른 클러스터 수 선택과 휴리스틱 알고리즘
2.1 데이터 클러스터링 문제와 빠른 클러스터 수선택 방법
2.2 거리의 상대적인 비율을 적용한 휴리스틱 알고리즘
3. 실험 및 분석
3.1 빠른 클러스터 수 선택
3.2 거리의 상대적인 비율을 적용한 휴리스틱알고리즘 분석
4. 결 론
References

영어 초록

K-means algorithm is one of the most popular and widely used clustering method because it is easy to implement and very efficient. However, this method has the limitation to be used with fixed number of clusters because of only considering the intra-cluster distance to evaluate the data clustering solutions. Silhouette is useful and stable valid index to decide the data clustering solution with number of clusters to consider the intra and inter cluster distance for unsupervised data. However, this valid index has high computational burden because of considering quality measure for each data object. The objective of this paper is to propose the fast and simple speed-up method to overcome this limitation to use silhouette for the effective large-scale data clustering. In the first step, the proposed method calculates and saves the distance for each data once. In the second step, this distance matrix is used to calculate the relative distance rate (Vj) of each data j and this rate is used to choose the suitable number of clusters without much computation time. In the third step, the proposed efficient heuristic algorithm (Group search optimization, GSO, in this paper) can search the global optimum with saving computational capacity with good initial solutions using Vj probabilistically for the data clustering. The performance of our proposed method is validated to save significantly computation time against the original silhouette only using Ruspini, Iris, Wine and Breast cancer in UCI machine learning repository datasets by experiment and analysis. Especially, the performance of our proposed method is much better than previous method for the larger size of data.

참고 자료

없음

자료문의

제휴사는 별도로 자료문의를 받지 않고 있습니다.

판매자 정보

코리아스칼라는 정직과 신뢰를 기반으로 학술단체 발전에 도움을 드리고자 하는 기업입니다. 본 사는 본 사가 자체 개발한 솔루션을 통하여 보다 효율적인 업무 관리 뿐만 아니라, 학술지의 데이터베이스화, ARCHIVE를 돕습니다. 본 사의 One Stop Service를 통해 국제적인 학술단체로 함께 도약 할 수 있다고 믿습니다.

주의사항

저작권 본 학술논문은 (주)코리아스칼라와 각 학회간에 저작권계약이 체결된 것으로 AgentSoft가 제공 하고 있습니다.
본 저작물을 불법적으로 이용시는 법적인 제재가 가해질 수 있습니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

최근 본 자료더보기
탑툰 이벤트
빠른 클러스터 개수 선정을 통한 효율적인 데이터 클러스터링 방법
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
AI 챗봇
2024년 06월 02일 일요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
11:23 오후
New

24시간 응대가능한
AI 챗봇이 런칭되었습니다. 닫기