네트워크를 Degree of Node의 distribution으로 표현한다면 굉장히 skewed하다. 예를 들면, 일반적으로 100~200의 친구를 갖는 사람들은 매우 많은데, 테일러 스위프트 같은 사람이 친구를 수천명 혹은 수만명 갖고있는 경우에 꼬리가 굉장히긴 distribution(right - skewed)이 형성되기 때문이다. 이때, 테일러 스위프트가 갖는 high degree를 hubs라고 부른다.
nodes의 분포는 어플리케이션 도메인에 상관없이 멱법칙을 따른다.
large scale network를 측정하고 양을 나타내는데 사용하는 measure
- Degree distribution
- Clustering coefficient
- Diameter of a Network
지금까지, node에 대해서 언급했다면 edge의 입장에서 보자.
네트워크가 node N개의 간단한 모형이라면 edge가 가질 수 있는 가장 큰 수는 N * (N-1)/2 이다.
또한, 네트워크의 밀도(Density of Network) 는 엣지의 비율(Fraction of Edge)이다. densitiy에 따라서 네트워크의 양상이 달라진다.
네트워크 밀도에 대해서 논한다면, 가장 먼저 sparse network를 말할 수 있다. 노드 수에 비해 엣지 수가 드문 경우이다. social network가 sparse network의 예이다. 반대로, 엣지가 노드 수를 거의 따라잡은 것이 dense network다. 예를 들면, 먹이사슬이다.
Clustering coefficient는 해당 노드에 이웃하는 노드들이 얼마나 잘 연결되어 있는지 측정하는 measure이다.
Diameter of a Netwrok는 두 노드가 정보가 흐르는데 걸리는 최대 거리를 말한다. 다시 말해, 한 사람으로부터 다른 사람에게 정보가 가기까지 걸리는 가장 긴 길이를 말한다. 또한, 정보가 가기까지 걸리는 최대시간을 의미하기도 한다. maximal geodesic distance in a network이다.
'데이터분석 > 네트워크와 그래피컬모델' 카테고리의 다른 글
Networks and graphical model - (4) 랜덤 네트워크 모델 (0) | 2022.07.26 |
---|---|
Networks and graphical model - (2) adjacency matrix로 중요한 노드 찾기 (0) | 2022.07.26 |
Networks and graphical model - (1) 소개 (0) | 2022.07.21 |