본 게시물은 Maximizing the Spread of Influence through a Social Network, David Kempe, Jon Kleinberg, Ev´ a Tardos를 읽고 작성한 글입니다.

 

1. Title

Maximizing the Spread of Influence through a Social Network

 

2. Abstract

알고리즘의 근본 문제, 만약 개인이 새로운 제품을 사도록 설득하고, 연쇄 반응을 촉발하고 싶다면 어떤 개인 집합을 대상으로 할까.

'가장 영향력 있는 노드' 선택 문제는 NP-난해, 하위 모듈러 함수 기반 분석 프레임워크 사용으로 접근할 것

'근사 알고리즘'이 증명 가능한 것 외에도 성능이 좋다는 점이 있다.

 

3. 목표

SNS 영향력 최대화를 위한 타겟 탐색

 

4. 방법

[모델]

(1) 두 단계 시딩 모델

- 1단계 : 초기 접근 가능 사용자에게 할인 제공으로 에이전트 모집

- 2단계 : 새로운 접근 가능 사용자들에게 할인 제공으로 더 큰 영향력 확산 유도

(2) 독립 캐스케이드 모델

- 각 엣지마다 독립적 확률로 영향력 전파

- 한 번 활성화된 노드의 상태는 불변

(3) 선형 임계값 모델

-  각 노드는 임계값이 있고, 활성화된 이웃 노드들의 가중치 합이 임계값 초과시 활성화

- 노드 활성화가 이웃 노드들의 집합적 효과에 의해 결정되기에 노드 수준 피드백 모델링에 적합

(4) 트리거링 모델

- 독립 캐스케이드 모델과 선형 임계값 모델을 일반화한 모델

- 특징 :

각 노드가 자신의 이웃 노드 중 일부를 '트리거 집합'으로 선택

활성화 노드 집합 A가 주어지고, 만약 vi의 트리거 집합에 속한 이웃 노드 중 하나가 활성화되면 그 다음 시점에 vi가 활성화된다.

행렬 B의 원소 bij는 엣지(i, j)가 live(node i가 node j를 트리거 집합에 포함시킨 경우)일 확률을 나타낸다.

 

[알고리즘]

Greedy Hill-Climbing

(1) 하위 모듈성 활용

- 목표 : 영향력 함수가 하위 모듈성을 가진다는 것을 증명

- 하위 모듈성이란 : '어떤 집합에 요소 추가시 얻는 이득'은 그 집단이 이미 클수록 줄어든다.

- 이를 이용해 성능 보장 가능

(2) 탐욕적 알고리즘

- 내용 : 각 단계에서 영향력을 가장 증가시키는 노드를 집합에 추가하는 과정을 k만큼 반복해 k개의 노드를 찾는다.

(3) 근사 보장

- 최적해에 비해 63% 이상의 영향력을 갖는 해를 찾을 수 있다.

 

5. 결과

두 모델 모두 영향력 최대화 문제는 NP-hard

두 모델 모두 탐욕적 언덕 오르기 알고리즘은 약 63%의 근사 보장 -> 영향력 함수가 하위 모듈성을 가짐을 증명

탐욕적 언덕 오르기 알고리즘이 연결/거리 중심성 기반 노드 선택 휴리스틱보다 뛰어남

 

6. 향후 계획

으음?