본문 바로가기
스터디/혼공학습단 11기 - 얄팍한코딩지식

데이터분석을 하게 되면 알게 되는 첫 장벽

by 찌노오 2024. 1. 24.

 

 

 

 

 

선택미션

주차 진도 선택 미션
4주차
(1/22 ~ 1/28)
Chapter 02 Ch.02(02-7) 데이터와 데이터베이스 강의 듣고 핵심내용 정리하기

 

 

서론

사실 이 주제는 나에게는 이미 암묵지 지식처럼 체화된 내용들이라 따로 정리할 것이 별로 없다.

 

사회초년생때,  처음 엑셀(excel)이라는 툴로 일이라는 것을 해봤을 때가 기억난다.

당시 처음 열어봤던 파일은 대리점 코드와 대리점명, 담당 영업사원명, 기준년월, 실적 등의 컬럼(Column)으로 구성된 데이터(Data)였다. 

 

 하지만 회사에는 내가 봤던 그 데이터만 있는 것은 아니었고, 대리점과 거래하는 고객의 정보를 담은 테이블(Table), 판매 상품코드를 마스터코드로 관리하는 테이블(Table), 정산 내역을 보관하는 테이블(Table)까지 무수히 많은 데이터의 집합이 있었다. 이를 데이터베이스(Database)라 불렀다.

 

물론 데이터베이스는 범용적이고 약간 추상적인 개념이라 할 수 있다.

실제로 데이터웨어하우스(Data Warehouse, DW)라는 저장소 개념으로 데이터베이스를 운용하고 다시 부서별 혹은 추출방식에 따라 데이터 마트(Data Mart, DM)라는 하위 개념의 저장소를 사용했다.

 

좀 더 쉽게 설명하면 어떤 데이터를 추출하거나 테이블에 접근할 때, 모든 사용자가 전체 데이터베이스에 접근하면 위험성도 크고, 접근 권한 관리도 어려우니 효율적인 방식으로 유지/관리 시스템 정도로 이해할 수 있다.

 

이 때, 추출은 SQL(Structured Query Language)이라고 하는 데이터베이스 조작하기 위한 표준화된 언어를 사용한다.

이게 사실 프로그래밍 언어라고 정의하기엔 조금 무리가 있고, 혼공얄코에선 도메인 특화 언어라고 표현한다.

 

여기까지가 어느 정도 추상적인 개념이라면, DBMS(Database Management System)는 이 데이터베이스를 관리하는 실질적인 소프트웨어다. 

 

그러다보니, 회사마다 사용하는 DBMS가 다르고, 또 관계형 데이터베이스 관리시스템이라 부르는 RDBMS만 존재하는 건 아니라서 이런 식으로 사용자 인기 순위도 나온다.

출처 : https://db-engines.com/en/ranking

 

첫 직장에서는 Oracle을 사용했는데, 두 번째 직장에서는 MySQL을 사용했다.

아마 규모에 따라 달라지지만 두 DBMS는 상용(유료), 오픈소스라는 차이점이 존재한다. 

 

 

용어 정리

주요 용어를 다시 정리해보면 다음과 같다.

 

데이터(Data)

  • 정보를 표현하고 저장하는 데 사용되는 사실이나 값의 집합
  • 숫자, 문자, 이미지, 동영상 등 다양한 형태의 자료를 포함한다.

데이터베이스(Database)

  • 구조화된 데이터의 모임으로, 특정 목적을 위해 체계적으로 정리되어 관리되는 데이터의 집합을 의미한다.
  • 데이터베이스는 하나 이상의 테이블이라 불리는 데이터의 집합으로 구성된다.

SQL(Structured Query Language)

  • 데이터베이스에서 데이터를 조작하고 관리하기 위한 표준화된 언어로, 구조화된 쿼리 언어
  • SQL을 사용하여 데이터베이스에 쿼리를 실행하거나 수정, 삭제, 삽입 등의 작업을 수행한다.

DBMS(Database Management System)

  • 데이터베이스를 관리하기 위한 소프트웨어 시스템으로, 데이터의 생성, 수정, 관리, 검색 등을 효율적으로 수행한다.
  • DBMS는 데이터베이스를 관리하고 제어하는데 필요한 여러 기능을 제공하며, 사용자 및 응용 프로그램과 데이터베이스 간의 상호 작용을 조율한다.
 

 

 

 

 

 

 

** 사실과 다른 내용이 있을 수 있습니다. 언제든지 피드백 부탁드립니다!

반응형

댓글