본문 바로가기
데이터/데이터 시각화

데이터 시각화(data visualization)를 위한 오픈소스 비교

by 찌노오 2023. 1. 24.

BI라는 관점에서 그리고 기꺼이 유료로 사용할 수 있다면,

구글의 데이터 스튜디오(Data Studio)와 태블로(Tableau)라는 강력한 소프트웨어가 있다.

하지만, 우리는 아직 규모가 작고 가난하기에 오픈 소스에서 몇 가지를 찾아봤었다.

 

당시 화려한 시각화보다는 database 간 결합하거나, 다양한 데이터 소스를 지원하고, 알람을 쏴주는 그런 부분들이 더 필요했다. 그래서 추려낸 오픈 소스가 grafana, metabase, superset, redash 정도였다.

grafana는 모니터링툴로 취급받아 같은 선상에서 비교하기는 어려웠다.

 

 

간략하게 정리해보면 다음과 같다.

 

metabase 
  •  장점
    • Tableau의 대체제로 많이 언급되고 있음
    • SQL Editor가 강력해서 사용성이 좋음
    • superset보다 dashboard 속도가 빠르다는 의견이 있음
    • 다른 툴에서는 안되는 GA연동이 가능함(Superset에서는 변환서비스를 써야함)
    • pivot table 기능 지원
  • 단점

 

Superset
  • 장점
    • 대시보드 및 차트 공유가 쉬움
    • 필터링 기능이 좋음
    • pivot table 기능 지원
  • 단점
    • GUI가 별로라는 평이 있음
    • 서버에 설치하는게 어려움
    • GA를 지원하지 않음

 

Redash
  • 장점
    • 많은 data sources 지원
    • 파라미터 쿼리 지원
    • 대시보드를 그룹핑하는 기능을 지원함(daily, weekly 와 같이 접두사는 같으나 기간이 다른 경우)
    • database 쿼리 결과를 다시 쿼리할 수 있도록 제공
  • 단점
    • 속도가 느리고 메모리를 많이 차지함
    • 시각화 유형이 Superset보다 미흡함
    • 쿼리 자체만 시각화함으로 시간 차원의 비교는 불가능함

 

Grafana
  • 장점
    • time-series, realtime 등 모니터링하기 최적의 조건
    • 경고나 알림기능으로 타 채널(e.g. Slack)로 보고가 가능함
    • Transformations 기능을 제공해 이름 명명, 요약, 결합, 집계 등이 가능함 
  • 단점
    • BI 툴로 보면 부족한 기능들이 많음
    • 한정적인 패널, 그래프 디자인

 

 결과적으로 Grafana를 선택하고 현재 이 툴을 사용하고 있지만, 늘 아쉽다.

다른 오픈소스 역시 해보진 않았지만 아쉬운 부분이 많았을 것 같다. 그럼에도 뭔가 새롭고 체계적으로 관리되지 않는 오픈소스를 다뤄보니, 다른 툴을 배울 때 좀 더 쉽게 접근할 수 있겠다라는 자신감이 생겼다.

그와 동시에 빨리 트래픽이 늘어나서 유료툴을 써보고 싶다는 생각도 든다.

반응형

'데이터 > 데이터 시각화' 카테고리의 다른 글

QGIS(오픈소스) 설치 및 초기 세팅하기  (0) 2023.02.20

댓글