본문 바로가기

데이터47

[Pandas] iloc, loc 인덱싱 구분하기(차이와 사용방법) 데이터 전처리의 꽃인 pandas, 그 중에서 핵심인 인덱싱을 정리해보려고 한다. pandas에서는 iloc과 loc 두 가지 방법이 있다. 샘플 데이터프레임 생성 직접 데이터 프레임을 만들어 해보자. import pandas as pd # 샘플 데이터프레임 생성 data = {'Name': ['Jino', 'Jun', 'Dayna', 'Sopia', 'Jay'], 'Age': [29, 28, 21, 32, 35], 'City': ['Seoul', 'New York', 'Paris', 'London', 'Tokyo']} df = pd.DataFrame(data) # 데이터프레임 출력 print(df) 1. iloc 먼저 iloc는 정수 기반의 인덱싱을 사용한다. 즉, 정수 인덱스를 사용하여 특정 위치의 .. 2023. 5. 27.
[MySQL] 변수값으로 where절 필터를 설정하는 동적쿼리 대시보드를 만드는 도중에 사용자에게 2가지 옵션을 주고 싶었다. 원하면 개별로 조회할 수 있게 변수명을 받아 검색기능을 넣고 그렇지 않다면 최근 날짜순으로 정렬해서 모든 데이터를 보여주는 식으로 말이다. -- @myVariable에 변수 값이 할당 SET @myVariable = 'abc'; -- 쿼리에 동적으로 WHERE 절 조건을 설정합니다. SELECT * FROM my_table WHERE (@myVariable IS NULL OR column_name = @myVariable); 이렇게 해두면 변수명이 비어있을 때는 전체를 조회하게 되고, 변수명이 입력되면 해당 변수명으로만 필터링하여 조회할 수 있다. 2023. 5. 16.
[MySQL] ST_DISTANCE_SPHERE 함수를 활용하여 거리/반경 구하기 ST_DISTANCE_SPHERE 함수란? MySQL에서 제공하는 지리 함수 중 하나로, 두 지점 사이의 거리를 구하는 데 사용한다.구의 표면을 이용하여 두 지점 사이의 최단 거리를 계산하고 이를 미터로 환산해준다. ST_DISTANCE_SPHERE 함수의 사용법 ST_DISTANCE_SPHERE(point(lon1, lat1), point(lon2, lat2)) 위 구문에서 lon1, lat1, lon2, lat2는 경도와 위도 값을 나타내다. 이 함수는 두 지점 사이의 거리를 미터 단위로 반환한다. 약간 헷갈리는게 우리가 위도/경도가 순서가 익숙한데 여기서는 경도, 위도 순이라는 점이다. 그럼 실제로 사용해보자. 부산시청과 서울시청과의 거리를 측정해볼텐데, 두 위치의 위경도는 여기서 구할 수 있다. .. 2023. 5. 5.
HackerRank SQL - Weather Observation Station 20 A median is defined as a number separating the higher half of a data set from the lower half. Query the median of the Northern Latitudes (LAT_N) from STATION and round your answer to 4 decimal places. Input Format The STATION table is described as follows: where LAT_N is the northern latitude and LONG_W is the western longitude. Problem median(중위값)은 상위, 하위 절반을 구분한다. LAT_N의 중위값을 쿼리하라. Answer1 SET.. 2023. 2. 24.
HackerRank SQL - 15 Days of Learning SQL Julia conducted a days of learning SQL contest. The start date of the contest was March 01, 2016 and the end date was March 15, 2016. Write a query to print total number of unique hackers who made at least submission each day (starting on the first day of the contest), and find the hacker_id and name of the hacker who made maximum number of submissions each day. If more than one such hacker has .. 2023. 2. 22.
HackerRank SQL - Print Prime Numbers Write a query to print all prime numbers less than or equal to 1000 . Print your result on a single line, and use the ampersand (&) character as your separator (instead of a space). For example, the output for all prime numbers would be: 2&3&5&7 Problem 1~1000 중 소수를 출력하되, &문자로 구분하여 하나의 행으로 출력하라. Answer1 WITH RECURSIVE numbers AS ( SELECT 2 AS n UNION ALL SELECT 1+n FROM numbers WHERE n 1 AND n2.n 2023. 2. 21.
QGIS(오픈소스) 설치 및 초기 세팅하기 지리정보를 시각화하기 위해서는 GIS 소프트웨어가 필요한데, 이게 유료는 가격이 매우 사악하여 일반인은 사용하기 어렵다. 이번에 오픈 소스로 배포된 QGIS라는 소프트웨어를 알게 되어 간단하게 정리해보기로 했다. QGIS 란? 먼저 GIS의 의미부터 파악할 필요가 있다. 국가공간정보포털에서는 Geographic Information System의 약자로 인간생활에 필요한 지리정보를 컴퓨터 데이터로 변환하여 효율적으로 활용하기 위한 정보시스템으로 정의하고 있다. 공간을 분석하거나 지도상의 공간정보에 데이터를 매핑, 시각화하는 방식으로 활용이 가능하다. QGIS는 이러한 GIS를 효율적으로 활용하기 위한 소프트웨어다. 일단 오픈 소스이기 때문에 별도의 비용이 들지 않고, 집단 지성으로 끊임없이 업데이트되고 .. 2023. 2. 20.
부산에서 내 맘대로 쏘카존을 추가해보자! 쏘카 사업매니저 직무에 지원하기 전에 정리했던 사전 과제를 남겨보기로 한다. 코딩 테스트와는 달리 공개된 질문이다보니 남겨도 상관없을 것 같다. 게다가 여기서 사용했던 모든 데이터셋은 공공데이터와 같은 공개된 형태만 사용했다. 왜냐하면, 애초에 사전과제가 나의 분석 접근 방법을 보는 거지 진짜 답을 원해서는 아니라고 생각했기 때문이다. 그래서 독창적이기보다는 다소 뻔하고 범용적인 가설로 접근했다. 각설하고 사전과제의 주제는 "수익성 확보 목적으로, 어디에 쏘카존을 개설할 수 있을까?"이다. 너무 개방적이지만 오히려 개방적이라 창의적인 접근을 원했던 것 같기도 하다. 과제는 세 개의 지역을 제시했지만 나는 그 중에 임의로 부산 한 곳만 선정했다. 그 내용 전문은 아래와 같다. 수익성 확보 목적으로, 어디에.. 2023. 2. 15.