• LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

카이스트 Bioengineering Laboratory 1 lab4_final [Text Mining of Biological Literature]

*현*
개인인증판매자스토어
최초 등록일
2015.01.04
최종 저작일
2014.04
11페이지/워드파일 MS 워드
가격 2,000원 할인쿠폰받기
다운로드
장바구니

소개글

카이스트 바이오및뇌공학과 계측 1 실험 4 : text mining of biological literature final 보고서 입니다
한글자료입니다

목차

1. Introduction

2. Theoretical Background
1) co-occurence based text mining
2) scoring function

3. Methods

4. Source code
1) Find same PMID index
2) save scoring information

5. Result & Discussion

본문내용

1. Introduction

21세기, 인터넷 정보 통신의 발전으로 인해 정보화시대로 접어들면서 우리는 언제 어디서든 손쉽게 원하는 정보를 얻을 수 있게 되었다. 하지만 정보의 양이 어마어마하게 증가하면서 막대한 양의 정보 속에서 필요한 정보만을 선택적으로, 빠르게 찾아내는 일이란 매우 어려워졌다. Text mining이란 text 형식으로 된 정리되지 않은 문헌에서 패턴 또는 관계를 유추하여 의미 있는 정보를 추출하는 작업을 말한다.
현재 Text mining 기법은 어휘 분석, 패턴인식, 문서요약 등 다양한 분야에서 널리 쓰이고 있다. 특히 생명과학 분야에서는 방대한 양의 biomedical literature로부터 필요한 정보만을 얻어내기 위해 text mining 기법을 사용한다. 이번 lab에서는 수 많은 논문들의 데이터를 text mining로 분석하여 특정 disease와 관련된 protein gene을 찾아내는 방법을 구현해 보고자 한다.

<중 략>

5. Result & Discussion

Parkinson’s disease와 multiple sclerosis에 대해 Pre-lab에서 얻은 gene tagging table과 disease tagging table로부터 같은 PMID에 등장한 protein들을 extract 한 뒤 이를 scoring function에 기반하여 score를 매기고, 상위 30개의 protein에 대해 F-score test를 시행하였다.
처음에 Parkinson’s disease를 통해 처음 test할 때는 co-occurrence method에 기반하여 같은 논문에서 같은 문장에 위치해 있는 disease와 protein gene만을 extract하여 F-score test를 시행하였다. 하지만 PMID, sentence index가 disease와 일치하는 50개의 protein gene 가운데 4개만 true positive protein으로 밝혀졌다.

참고 자료

Pre-Lab Report #4_20120589
2014 Bioengineering Laboratory 1-Lab4 material
http://www.cplusplus.com/reference/map/map/?kw=map
http://stackoverflow.com/questions/5056645/sorting-stdmap-using-value
http://stackoverflow.com/questions/16545309/stdmap-how-to-change-key-sorting
*현*
판매자 유형Bronze개인인증

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

최근 본 자료더보기
탑툰 이벤트
카이스트 Bioengineering Laboratory 1 lab4_final [Text Mining of Biological Literature]
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
AI 챗봇
2024년 06월 03일 월요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
11:54 오전
New

24시간 응대가능한
AI 챗봇이 런칭되었습니다. 닫기