시맨틱 웹 기술로 사용자들의 SNS 활동을 완벽하게 기술할 수 있게 된다면 어떻게 될까? 시맨틱 웹을 한번이라도 공부해본 사람이라면 한번쯤 이런 고민을 해봤으리라. 오늘 소개해드리는 논문의 저자들 역시 마찬가지 였던 것으로 생각된다. 이 논문의 저자들은 DERI 연구소에 소속된 사람들인데 DERI 연구소는 시맨틱 웹과 소셜 웹에 관련되서 재밋는 아이디어들을 곧잘 논문으로 써내곤 한다. 시간이 난다면 한번씩 홈페이지에 들려서 논문을 읽어보는 것도 제법 도움이 되며 물론 재미도 있다.

Knowledge Discovery in distributed Social Web sharing activities

이 논문 이전에도 시맨틱 웹 기술을 이용한 소셜 웹에 대한 연구는 다양하게 있어왔다. 가장 대표적으로는 SKOS나 SIOC 같은 것이 있다. SKOS, SIOC 역시 마찬가지로 사용자의 활동을 시맨틱 웹 기술을 이용하여 작성하는 온톨로지 기반 어휘들인데 이런 것들이 있는데도 불구하고 왜 굳이 소셜 웹의 활동을 시맨틱 웹으로 표현하는 연구를 또해야만 했을까? 나는 이 논문을 읽기전에 이렇게 생각했다.

이 논문의 저자들은 다음과 같이 논문의 동기를 밝히고 있다.

1) 새로 찾게된 사람이나 지식을 PIM(Personal Information Model)로 작성해야한다.
2) 여러 SNS 서비스들의 글(Post)들이 의미적으로 연결되어야한다.
3) 소셜 기반의 추천이 가능해야한다.

이 세 개의 동기(문제점)을 해결하기 위하여 저자들은 DLPO라는 새로운 온톨로지 어휘를 제안하였다. DLPO는 완전히 새로운 온톨로지 어휘가 아니라 기존의 SIOC같은 어휘를 최대한 활용하고 LOD의 다양한 어휘까지 모두 활용하면서 기존에 제공하지 못하고 있었던 어휘를 추가하는 형태이다.


위 그림에서 보듯 여러 어휘체계들이 있지만 온라인 포스트부터 시작해서 다른 부분까지 완벽하게 제공하는 것은 자신들 뿐이라고 주장하고 있다. (평가항목이 이 것이 전부는 아닐터이지만.. 논문이란 것이 자신의 시스템이 훌륭하다고 주장하는 것이 일반적임을 감안해야하긴 한다.) 뭐 어쨌든 기존 방법들에 비해 어휘체계가 더 풍부한건 맞는 것같다. 혹여나 싶어서 소셜 웹의 사용자 활동을 기술하기 위한 여러 시맨틱 웹 기술들에 관한 논문들을 본인이 직접 찾아봤는데 그래도 그 중에 이 논문에서 제안한 것 보다 훌륭한건 아직 없어보였다.

사실, 연구를 하다보면 어?? 저 논문.. 아이디어는 신선하지만 실제로 구현이 어렵진 않았을 것 같은데?! 하는 것들이 제법 많다. 그러나 그런걸 함부로 무시하면 안된다. 그런 생각을 했다는 것과 못했다는 것은 굉장히 큰 차이기 때문이다. 피타고라스의 정리에서 직각삼각형의 대각선 거리 재는 공식을 활용해서 다차원 공간의 벡터 노름 구하는 공식을 구한 사람 또한 위대한 수학자로 인정받고 있지 않는가?

이 논문 역시 마찬가지로 내가 평가할 땐 소셜 웹의 사용자 활동을 완벽하게 시맨틱 웹 기술로 표현하고 그걸 여러 소셜 네트워크 서비스의 데이터에 적용가능하게 하고 또한, 그걸로 소셜 추천이 가능하도록 한 아이디어 자체가 나이스포인트라고 본다. 아직까진 그런 시도를 한 사람이 없으니까. 오히려 왜 그런 시도가 여태 없었지? 하는 의문이 들 정도다.

나처럼 설렁설렁 공부하는 사람들은 아마 .. 나와 마찬가지로 SIOC로 다 되잖아? 라고 이미 생각한 후 넘겨버렸을지도 모른다.


위 그림은 논문에서 제안한 DLPO의 구성도이다. 제안한 온톨로지는 크게 네 개의 부분으로 구성되어있는데 각각 Multimedia, presence, message, web document이다. 그리고 이 네개의 부분들은 SIOC, RDF 등 다른 어휘와 연결되어 구성된다.

구현과 결론 부에서는 아직 완성된 시스템을 보여주고 있지는 않은데 나는 한가지 의심이 드는 것이 과연 다양한 SNS의 데이터들을 시맨틱 웹으로 연결시켰을 때 어떤 시너지 효과가 있을 것인가 하는 것이다.

나는 소셜 네트워크 서비스의 구조에 대해 가지고 있는 아이디어가 하나 있는데 그 아이디어를 논문으로 쓸 때 DLPO를 가져다 쓸 수 있을지 그 때가서 생각해보려고 한다.

원문 링크: http://ceur-ws.org/Vol-838/paper_17.pdf

웹 과학, 복잡계를 만나다

Topics/Semantic Web 2012. 6. 13. 23:52 posted by Minery

2011년 3회 Network Theory 국제 워크샵에서 생긴 일

월드와이드웹을 공부하는 사람이라면 한번쯤은 들어봤음직한 이름의 인물 ‘팀 버너스리’, 그는 2006년에 자신의 글을 통해 많은 웹 과학의 과학자들이 그들의 연구 범위를 컴퓨터를 포함하여, 경제, 정부, 법, 심리학 같은 분야까지 넓히려고 노력해왔다고 했다. 물론 웹과 관련된 분야에 종사하고 있는 사람이 순수하게 웹만 연구하거나 개발하지 않고 있다는 것은 자명한 사실이다. 웹은 그 자체로 학문이기도 하지만 여러 분야에 접목하여 사용할 수 있는 도구적 측면이 있기 때문이리라. 필자 역시 웹과 시맨틱 웹을 다양한 분야에 접목시키기 위한 노력을 해오기도 했다.

한편, 네트워크 과학은 그 출발이 물리학에서 시작되었는데 한국에서는 ‘복잡계 네트워크’라는 이름으로 더 잘 알려져 있다. 네트워크 과학은 웹 과학을 포함하여 신경망, 소셜 네트워크, 단백질 네트워크 등 네트워크의 특징을 탐구하는데 그 목적이 있다. 필자가 복잡계 네트워크라는 단어를 듣게 된 것은 공교롭게도 필자의 친형에게서이다.
필자의 친형은 물리학과 박사과정이고 현재 복잡계를 연구하고 있는 중이다. 평소 가깝게 지내는 편은 아니지만 설날, 추석에 한번 씩 만나 자신의 연구 주제에 대해 설명하곤 하는데 2011년 추석에, 형과 연구주제에 대한 대화를 하다가 서로의 주제가 엇비슷하게 맞물러 가고 있다는 것을 알게 되었다. 웹을 연구하는 나에겐 취약한 이론적 근거나 메서드를 복잡계에서 가져다 쓸 수 있겠다 싶어서 급격한 관심이 생길 수밖에 없었고 반대로 복잡계를 연구하는 형에겐 아주 특수한 형태의 네트워크만을 다뤄오다가 웹 및 소셜 네트워크는 새로운 방대한 소스를 발견하게 되어 기쁠 수밖에 없었던 것이다.
인간의 생각이란게 거의 비슷하게 돌아가긴 하나보다. 2011년 5월에 네트워크 이론이라는 국제 워크샵에서 웹 과학자 그룹과 네트워크 과학자 그룹이 처음으로 만난 사건이 일어났고 나와 형의 놀라움과 마찬가지로 이들도 서로의 존재에 대해 상당히 놀라왔던 것으로 보인다. 워크샵에 모인 학자들은 서로의 연구주제에 대해 토의하면서 웹이 복잡계의 일부냐 복잡계가 웹의 일부냐로 약간의 논쟁이 있었던 것으로 생각되지만 서로의 존재를 발견한 기쁨은 여러 곳에서 엿볼 수 있다.

웹 사이언스에서 트러스트 분야의 유명한 학자인 사우스 햄턴 대학교의 Hall 교수는 다음과 같이 발언했다.

웹과학이 네트워크의 일부냐 아니면 그 반대냐의 질문에 대한 답은 아무런 상관이 없다.

지금으로부터 불과 1년 전 웹 과학과 복잡계 네트워크 과학이 만나기 시작했다는 것이 중요하다. 평행한 시기에 서로 다른 주제로 연구를 해오다가 이들이 공통의 토픽을 만났을 때 어떤 시너지 효과가 일어날 것인가? 우리는 이 질문에 좀 더 많은 신경을 쏟아야 할 것이다. 그리고 이 글을 읽으시는 여러분이 주인공이 되어 보시는건 어떨까? 물론, 이 글을 쓰고 있는 필자를 포함해서.

링크: http://cacm.acm.org/magazines/2011/5/107690-web-science-meets-network-science/fulltext