'2012/06'에 해당되는 글 2건

  1. 2012.06.17 소셜 네트워크에서 신뢰(Trust)를 예측하기
  2. 2012.06.13 웹 과학, 복잡계를 만나다

우리는 종종 어떤 물건을 사거나 질문을 할 때 주변 사람들에게 묻곤한다. 평소 친분이 깊은 사람에게 물어봤다면 별로 안 친한 사람에게 물어보는 것보다 마음속으로 더 깊은 신뢰감을 얻는 게 너무나 당연한 일이다. 사람과 사람들이 서로 대화하고 의견을 주고 받는다는 측면에서 소셜 네트워크는 우리의 실생활과 닮은 점이 많은 편이다. 그래서 온라인 소셜 네트워크에서 역시 실생활처럼 믿을 만한 사람을 찾는 일은 얼마나 신뢰있는 인터넷 생활을 하느냐로 직결된다고 볼 수 있다. 오늘 소개해드리는 논문은 소셜 네트워크에서 신뢰(Trust) 혹은 불신뢰(Distrust)를 측정(예측)하기 위한 논문이다.

트러스트란 '어느 사용자가 얼마나 다른 사용자에게 신뢰받고 있는가'를 측정하는 지표로 사용된다. (Manuela et al., 2012) 그리고 다른 정의에서는 '에이전트가 다른 에이전트에게 적당한 방식으로 행동하기 위한 신뢰의 정량화'라고 한다. (Zheng, 2011) 다시 말해 월드와이드웹에서의 트러스트는 사람이나 콘텐츠가 얼마나 신뢰받을만한지를 보이는 지표라고 할 수 있다.

소개해드리는 논문에서는 트러스트를 다음과 같이 설명하고 있다.

Trust information can help a user make decisions, sort and filter information, receive recommendations, and develop a context within a community with respect to whom to trust and why.

트러스트 정보는 커뮤니티에서 누가 왜 신뢰받고 있는지를 통해 사용자의 결정을 도울 수 있고 정보를 필터, 정렬할 수 있고 추천을 받을 수 있고 콘텍스트를 개발할 수 있다.

소개해드리는 논문은 소셜 네트워크에서 신뢰와 불신뢰를 측정하기 위한 알고리즘을 제안한다. 위에서 봤던 것과 같이 신뢰는 깔끔하게 정의되는데 불신뢰는 또 무엇인가? 하는 생각이 들 것이다. 필자 역시 마찬가지 였는데 이 논문에서 불신뢰를 하는 이유는 다음 그림으로 설명된다.

위 그림에서 보면 노드 A, B, C, D가 있는데 각 연결 선마다 있는 >.9 와 같은 표시는 신뢰(Trust)를 나타낸다. A는 B와 B를 상당히 높은 수준에서 신뢰하는 것을 볼 수 있는데 B와 C의 경우 D를 각각 0.9, 0.1만큼 신뢰한다. 이 때 A는 D를 얼마나 신뢰한다고 판단할 수 있을까? 측정값을 신뢰 하나만 사용하는 경우 위 그림과 같이 A와 D사이의 애매한 면이 드러나게된다.

위와 같은 문제를 해결 하기 위하여 논문에서는 신뢰를 측정하기 위하여 경로 확률(Path probability)를, 비신뢰를 측정하기 위하여 Spring-embedding 알고리즘을 사용한다. 그리고 이 두 계산 결과를 합하여 상대를 얼마나 신뢰할 수 있는지 판단한다.

이 논문에서 제안한 방법의 실험은 스탠포드 대학교의 Large dataset collection에서 세 개를 골라서 실험대상으로 삼아 실험을 하였다. 여기서 재밋는 것은 스탠포드 대학교의 데이터셑이다. 주소는 http://snap.stanford.edu/data 이다. 이 사이트에 들어가면 여러가지 형태의 네트워크 실험용 데이터를 얻을 수 있으며 다른 논문들에서도 이 데이터를 사용하여 여러가지 실험을 하고 있으므로 만약 여러분들이 그래프/네트워크 관련 연구를 하고 계시다면 증명용으로 상당히 쓸만하게 사용하실 수 있을 것이다.

마지막으로 참고삼아 말씀드리면 본 논문의 공저자 중에 한명인 Jennifer Golbeck은 Trust에 관한 다양한 연구를 하고 있고 많은 논문을 출판한 사람이므로 그녀의 이름으로 검색해서 논문을 찾아 읽으면 Trust에 관한 다양한 지식을 쌓을 수 있을 것이다.


원문 링크: http://www.cs.umd.edu/~golbeck/papers/sign.pdf




웹 과학, 복잡계를 만나다

Topics/Semantic Web 2012. 6. 13. 23:52 posted by Minery

2011년 3회 Network Theory 국제 워크샵에서 생긴 일

월드와이드웹을 공부하는 사람이라면 한번쯤은 들어봤음직한 이름의 인물 ‘팀 버너스리’, 그는 2006년에 자신의 글을 통해 많은 웹 과학의 과학자들이 그들의 연구 범위를 컴퓨터를 포함하여, 경제, 정부, 법, 심리학 같은 분야까지 넓히려고 노력해왔다고 했다. 물론 웹과 관련된 분야에 종사하고 있는 사람이 순수하게 웹만 연구하거나 개발하지 않고 있다는 것은 자명한 사실이다. 웹은 그 자체로 학문이기도 하지만 여러 분야에 접목하여 사용할 수 있는 도구적 측면이 있기 때문이리라. 필자 역시 웹과 시맨틱 웹을 다양한 분야에 접목시키기 위한 노력을 해오기도 했다.

한편, 네트워크 과학은 그 출발이 물리학에서 시작되었는데 한국에서는 ‘복잡계 네트워크’라는 이름으로 더 잘 알려져 있다. 네트워크 과학은 웹 과학을 포함하여 신경망, 소셜 네트워크, 단백질 네트워크 등 네트워크의 특징을 탐구하는데 그 목적이 있다. 필자가 복잡계 네트워크라는 단어를 듣게 된 것은 공교롭게도 필자의 친형에게서이다.
필자의 친형은 물리학과 박사과정이고 현재 복잡계를 연구하고 있는 중이다. 평소 가깝게 지내는 편은 아니지만 설날, 추석에 한번 씩 만나 자신의 연구 주제에 대해 설명하곤 하는데 2011년 추석에, 형과 연구주제에 대한 대화를 하다가 서로의 주제가 엇비슷하게 맞물러 가고 있다는 것을 알게 되었다. 웹을 연구하는 나에겐 취약한 이론적 근거나 메서드를 복잡계에서 가져다 쓸 수 있겠다 싶어서 급격한 관심이 생길 수밖에 없었고 반대로 복잡계를 연구하는 형에겐 아주 특수한 형태의 네트워크만을 다뤄오다가 웹 및 소셜 네트워크는 새로운 방대한 소스를 발견하게 되어 기쁠 수밖에 없었던 것이다.
인간의 생각이란게 거의 비슷하게 돌아가긴 하나보다. 2011년 5월에 네트워크 이론이라는 국제 워크샵에서 웹 과학자 그룹과 네트워크 과학자 그룹이 처음으로 만난 사건이 일어났고 나와 형의 놀라움과 마찬가지로 이들도 서로의 존재에 대해 상당히 놀라왔던 것으로 보인다. 워크샵에 모인 학자들은 서로의 연구주제에 대해 토의하면서 웹이 복잡계의 일부냐 복잡계가 웹의 일부냐로 약간의 논쟁이 있었던 것으로 생각되지만 서로의 존재를 발견한 기쁨은 여러 곳에서 엿볼 수 있다.

웹 사이언스에서 트러스트 분야의 유명한 학자인 사우스 햄턴 대학교의 Hall 교수는 다음과 같이 발언했다.

웹과학이 네트워크의 일부냐 아니면 그 반대냐의 질문에 대한 답은 아무런 상관이 없다.

지금으로부터 불과 1년 전 웹 과학과 복잡계 네트워크 과학이 만나기 시작했다는 것이 중요하다. 평행한 시기에 서로 다른 주제로 연구를 해오다가 이들이 공통의 토픽을 만났을 때 어떤 시너지 효과가 일어날 것인가? 우리는 이 질문에 좀 더 많은 신경을 쏟아야 할 것이다. 그리고 이 글을 읽으시는 여러분이 주인공이 되어 보시는건 어떨까? 물론, 이 글을 쓰고 있는 필자를 포함해서.

링크: http://cacm.acm.org/magazines/2011/5/107690-web-science-meets-network-science/fulltext