KoreaTech

[데이터분석개론] Gephi로 데이터 분석 및 시각화 실습

졸려질려 2019. 5. 3. 15:12
반응형

데이터 시각화 방법 정리

1. 빅카인즈에서 다운 받은 Raw 데이터를 어느 정도 필터링 하여 단어 분할한 후에 Gephi로 Import 한다.


2018년 E스포츠 기사들이다.

2. Statistics를 수행한다.

  • Average Degree
  • Modularity
  • Eigenvector Centrality

3. Filters 를 설정한다.

  • Degree Range
  • Partition ( 이후 과정에서 설정 )

4. Filter 를 클릭하면 아래와 같이 그래프가 출력된다.

  • 위 그래프는 각 노드의 Degree(엣지 개수)가 400개 이상인 노드들만 모아진 것이다.
  • Arial Bold, 32 를 클릭하여 폰트를 한글 폰트로 설정한다. ( 한글 폰트로 바꾸지 않으면 한글 텍스트가 깨진다. )

5. Appearance 를 설정한다.

  • EigenVector Centrality의 크기 에 따라 노드의 크기 를 크게 해준다.

  • Apply 를 클릭했을 때의 결과

  • Modularity 에 따라 색상을 다르게 해준다.

  • Apply 를 클릭했을 때의 결과

6. Layout 을 설정한다.

  • Force Atlas 2
  • Scaling : 1000

  • Run 클릭 했을 때의 결과
  • 여기에서 빨간 박스 를 클릭하면 각 노드의 이름이 나타난다.
  • 어느 정도 형태가 변하지 않는다면 Stop을 클릭한다.

7. 결과

  • 이제부터는 Modularity로 나뉜 영역의 의미와 각 노드들의 의미를 분석한다.

★. 겹쳐져있는 노드 떼어내기

  • 이렇게 겹쳐져 있는 노드들은 하나하나 드래그 하여 떼어내는 것도 방법이지만

  • Label Adjust 기능을 통해 각 노드들을 떼어내준다.

★. 각 Modularity 만 관찰하기

  • Filter 구성
    • Main Filter : Partition ( Modularity Class )
    • Sub Filter : Degree Range
  • 각 Partition을 클릭하면 해당 Partition 만의 그래프를 출력한다.

이제 분석을 시행하면서 데이터 수정을 반복한다.

반응형