
372
AI
를 위한 필수 수학
CoRA
데이터셋
230
에는
7
개의 카테고리로 분류된
3
,
000
개의 머신러닝 출판물이 포함되어 있
다. 인용 네트워크의 각 논문은 미리 지정된 사전에서 단어의 유무를 나타내는 원-핫 벡터 또
는 용어 빈도-역문서 빈도(
TF
-
IDF
) 벡터로 표현된다. 이러한 데이터셋은 더 많은 논문이 네
트워크에 합류함에 따라 지속적으로 업데이트되고 있다.
9.6.10
소셜 미디어 네트워크와 영향력 예측
페이스북, 트위터, 인스타그램, 레딧과 같은 소셜 미디어 네트워크는
2010
년 이후의 시대를 대
표하는 특징이다. 사용 가능한 데이터셋으로는 레딧 데이터셋
231
이 있다. 이 그래프에서는 노
드가 게시물이며 같은 사용자의 댓글이 있는 두 게시물 사이에 엣지가 있게 된다. 게시물에는
해당 게시물이 속한 커뮤니티가 레이블로 지정되어 있다.
소셜 미디어 네트워크와 그 사회적 영향력은 광고부터 대통령 선거 승리에 이르기까지, 심지어
는 정치 체제의 붕괴에 이르기까지 우리 사회에 상당한 영향을 미친다. 소셜 네트워크를 나타
내는 그래프 모델의 중요한 목표 중 하나는 네트워크 안의 노드들의 사회적 영향력을 예측하는
것이다. 여기서 노드는 사용자이며 그들 간의 상호 작용이 엣지다. 사용자에는 성별, 나이, 위
치, 활동 수준 등이 포함된다. 목표 변수인 사회적 영향력을 ...