'datamining'에 해당되는 글 2건

  1. 2009.02.02 Lab Works (온톨로지 기반 연구노트 시스템)
  2. 2009.02.02 XML clustering method

본 발표자료는 온톨로지 기반 연구노트 시스템에서 ID3알고리즘을 이용해 중요도 높은 지식을 찾아내는 방법에 대한 자료이다. 이 자료를 만든 것은 우리 연구실에 전자연구노트를 도입하기 위하여 기초조사를 한 바탕을 통해 고안되었으며 시맨틱 웹을 하는 연구실 답게 온톨로지 기반의 시스템을 고안하여 작성하였다. 그리고 ID3알고리즘을 이용하여 가장 중요도가 높은 지식을 찾아내고 활용할 수 있도록 고안하였다.
본 시스템을 처음 고안하던 당시의 (세상을 바꿀 수 있을 것 같았던!) 큰 꿈은 시스템을 고안하면서 점차 작아지게 되었는데 이는 역시 본인의 능력부족에 기인한다고 생각한다.
전자연구노트의 가치는 시간이 갈 수록 중요해지고 있고 웹 기술을 날이 갈 수록 발전하고 있으므로 여유가 된다면 언젠가 다시 한번 '팬시'한 시스템으로 재설계해보고 싶다.


XML clustering method

Topics/ETC 2009. 2. 2. 22:51 posted by Minery
본 발표자료는 07년 가을에 대학원 데이터마이닝 수업을 들으며 중간발표로 쓰인 자료이다. XML 포맷의 데이터를 클러스터링하기 위한 방법들을 소개하며 zip파일에는 발표자료에서 인용된 논문들을 첨부시켰다.
1. Introduction 에서는 xml 포맷 파일의 개요와 관련된 클러스터링에 대한 개요를 기술하였으며, 2. XML and XML schema 에서는 xml에 대해 생소한 사람들을 위해 간략히 xml 파일 포맷의 기초를 서술하였다. 3. Relational vs. XML 에서는 관계형 데이터베이스로 데이터를 관리하는 방법과 xml 파일을 이용해서 데이터를 관리하는 방법에 대해 비교하였다. 그리고 4. Paper overview 에서 관련 클러스터링 기법을 소개한다.