우리는 종종 어떤 물건을 사거나 질문을 할 때 주변 사람들에게 묻곤한다. 평소 친분이 깊은 사람에게 물어봤다면 별로 안 친한 사람에게 물어보는 것보다 마음속으로 더 깊은 신뢰감을 얻는 게 너무나 당연한 일이다. 사람과 사람들이 서로 대화하고 의견을 주고 받는다는 측면에서 소셜 네트워크는 우리의 실생활과 닮은 점이 많은 편이다. 그래서 온라인 소셜 네트워크에서 역시 실생활처럼 믿을 만한 사람을 찾는 일은 얼마나 신뢰있는 인터넷 생활을 하느냐로 직결된다고 볼 수 있다. 오늘 소개해드리는 논문은 소셜 네트워크에서 신뢰(Trust) 혹은 불신뢰(Distrust)를 측정(예측)하기 위한 논문이다.

트러스트란 '어느 사용자가 얼마나 다른 사용자에게 신뢰받고 있는가'를 측정하는 지표로 사용된다. (Manuela et al., 2012) 그리고 다른 정의에서는 '에이전트가 다른 에이전트에게 적당한 방식으로 행동하기 위한 신뢰의 정량화'라고 한다. (Zheng, 2011) 다시 말해 월드와이드웹에서의 트러스트는 사람이나 콘텐츠가 얼마나 신뢰받을만한지를 보이는 지표라고 할 수 있다.

소개해드리는 논문에서는 트러스트를 다음과 같이 설명하고 있다.

Trust information can help a user make decisions, sort and filter information, receive recommendations, and develop a context within a community with respect to whom to trust and why.

트러스트 정보는 커뮤니티에서 누가 왜 신뢰받고 있는지를 통해 사용자의 결정을 도울 수 있고 정보를 필터, 정렬할 수 있고 추천을 받을 수 있고 콘텍스트를 개발할 수 있다.

소개해드리는 논문은 소셜 네트워크에서 신뢰와 불신뢰를 측정하기 위한 알고리즘을 제안한다. 위에서 봤던 것과 같이 신뢰는 깔끔하게 정의되는데 불신뢰는 또 무엇인가? 하는 생각이 들 것이다. 필자 역시 마찬가지 였는데 이 논문에서 불신뢰를 하는 이유는 다음 그림으로 설명된다.

위 그림에서 보면 노드 A, B, C, D가 있는데 각 연결 선마다 있는 >.9 와 같은 표시는 신뢰(Trust)를 나타낸다. A는 B와 B를 상당히 높은 수준에서 신뢰하는 것을 볼 수 있는데 B와 C의 경우 D를 각각 0.9, 0.1만큼 신뢰한다. 이 때 A는 D를 얼마나 신뢰한다고 판단할 수 있을까? 측정값을 신뢰 하나만 사용하는 경우 위 그림과 같이 A와 D사이의 애매한 면이 드러나게된다.

위와 같은 문제를 해결 하기 위하여 논문에서는 신뢰를 측정하기 위하여 경로 확률(Path probability)를, 비신뢰를 측정하기 위하여 Spring-embedding 알고리즘을 사용한다. 그리고 이 두 계산 결과를 합하여 상대를 얼마나 신뢰할 수 있는지 판단한다.

이 논문에서 제안한 방법의 실험은 스탠포드 대학교의 Large dataset collection에서 세 개를 골라서 실험대상으로 삼아 실험을 하였다. 여기서 재밋는 것은 스탠포드 대학교의 데이터셑이다. 주소는 http://snap.stanford.edu/data 이다. 이 사이트에 들어가면 여러가지 형태의 네트워크 실험용 데이터를 얻을 수 있으며 다른 논문들에서도 이 데이터를 사용하여 여러가지 실험을 하고 있으므로 만약 여러분들이 그래프/네트워크 관련 연구를 하고 계시다면 증명용으로 상당히 쓸만하게 사용하실 수 있을 것이다.

마지막으로 참고삼아 말씀드리면 본 논문의 공저자 중에 한명인 Jennifer Golbeck은 Trust에 관한 다양한 연구를 하고 있고 많은 논문을 출판한 사람이므로 그녀의 이름으로 검색해서 논문을 찾아 읽으면 Trust에 관한 다양한 지식을 쌓을 수 있을 것이다.


원문 링크: http://www.cs.umd.edu/~golbeck/papers/sign.pdf