BI라는 관점에서 그리고 기꺼이 유료로 사용할 수 있다면,
구글의 데이터 스튜디오(Data Studio)와 태블로(Tableau)라는 강력한 소프트웨어가 있다.
하지만, 우리는 아직 규모가 작고 가난하기에 오픈 소스에서 몇 가지를 찾아봤었다.
당시 화려한 시각화보다는 database 간 결합하거나, 다양한 데이터 소스를 지원하고, 알람을 쏴주는 그런 부분들이 더 필요했다. 그래서 추려낸 오픈 소스가 grafana, metabase, superset, redash 정도였다.
간략하게 정리해보면 다음과 같다.
metabase
- 장점
- Tableau의 대체제로 많이 언급되고 있음
- SQL Editor가 강력해서 사용성이 좋음
- superset보다 dashboard 속도가 빠르다는 의견이 있음
- 다른 툴에서는 안되는 GA연동이 가능함(Superset에서는 변환서비스를 써야함)
- pivot table 기능 지원
- 단점
- 라이센스 문제가 있음 - GNU(AGPL) 관련
- 데이터베이스간 join 여부 - 불가능
Superset
- 장점
- 대시보드 및 차트 공유가 쉬움
- 필터링 기능이 좋음
- pivot table 기능 지원
- 단점
- GUI가 별로라는 평이 있음
- 서버에 설치하는게 어려움
- GA를 지원하지 않음
Redash
- 장점
- 많은 data sources 지원
- 파라미터 쿼리 지원
- 대시보드를 그룹핑하는 기능을 지원함(daily, weekly 와 같이 접두사는 같으나 기간이 다른 경우)
- database 쿼리 결과를 다시 쿼리할 수 있도록 제공
- 이 기능을 통해 서로 다른 데이터베이스를 결합할 수 있음
- Querying Existing Query Results
- 단점
- 속도가 느리고 메모리를 많이 차지함
- 시각화 유형이 Superset보다 미흡함
- 쿼리 자체만 시각화함으로 시간 차원의 비교는 불가능함
Grafana
- 장점
- time-series, realtime 등 모니터링하기 최적의 조건
- 경고나 알림기능으로 타 채널(e.g. Slack)로 보고가 가능함
- Transformations 기능을 제공해 이름 명명, 요약, 결합, 집계 등이 가능함
- 단점
- BI 툴로 보면 부족한 기능들이 많음
- 한정적인 패널, 그래프 디자인
결과적으로 Grafana를 선택하고 현재 이 툴을 사용하고 있지만, 늘 아쉽다.
다른 오픈소스 역시 해보진 않았지만 아쉬운 부분이 많았을 것 같다. 그럼에도 뭔가 새롭고 체계적으로 관리되지 않는 오픈소스를 다뤄보니, 다른 툴을 배울 때 좀 더 쉽게 접근할 수 있겠다라는 자신감이 생겼다.
그와 동시에 빨리 트래픽이 늘어나서 유료툴을 써보고 싶다는 생각도 든다.
반응형
'데이터 > 데이터 시각화' 카테고리의 다른 글
QGIS(오픈소스) 설치 및 초기 세팅하기 (0) | 2023.02.20 |
---|
댓글