본문 바로가기

분류 전체보기139

[Pandas] iloc, loc 인덱싱 구분하기(차이와 사용방법) 데이터 전처리의 꽃인 pandas, 그 중에서 핵심인 인덱싱을 정리해보려고 한다. pandas에서는 iloc과 loc 두 가지 방법이 있다. 샘플 데이터프레임 생성 직접 데이터 프레임을 만들어 해보자. import pandas as pd # 샘플 데이터프레임 생성 data = {'Name': ['Jino', 'Jun', 'Dayna', 'Sopia', 'Jay'], 'Age': [29, 28, 21, 32, 35], 'City': ['Seoul', 'New York', 'Paris', 'London', 'Tokyo']} df = pd.DataFrame(data) # 데이터프레임 출력 print(df) 1. iloc 먼저 iloc는 정수 기반의 인덱싱을 사용한다. 즉, 정수 인덱스를 사용하여 특정 위치의 .. 2023. 5. 27.
엑셀(excel) - 위도/경도 좌표값으로 두 지점 간 거리 구하기 보통은 엑셀보다는 python이나 SQL에서 다루는 부분이지만, 오늘은 데이터 처리가 좀 복잡해져서 엑셀로 가공, 전처리를 하게 되면서 필요하게 되었다. 1. 두 지점간의 거리 수식 아래와 같이 latitude와 longitude의 셀 값을 넣으면 km단위로 환산한 두 지점간 거리를 뽑아낼 수 있다. =6371*ACOS(COS(RADIANS(90-[ latitude1 ]))*COS(RADIANS(90-[ latitude2 ]))+SIN(RADIANS(90-[ latitude1 ]))*SIN(RADIANS(90-[ latitude2 ]))*COS(RADIANS([ longitude1 ]-[ longitude2 ]))) 2. 실제 적용해보기 준비한 데이터는 저번에 정리해본 부산지역 쏘카존 위치 데이터이다. .. 2023. 5. 24.
[노션] 데이터베이스에서 소수점 2자리로 % 표기하기 노션의 데이터베이스에서 수식 기능을 통해 사칙연산은 물론 if 함수까지 다양하게 적용할 수 있다. 그러나 아쉽게도 round 함수에서 자리수를 설정할 수 없는데, 간단한 수식을 통해 이걸 구현하는 방법을 알아보자. 1. 데이터베이스 준비 먼저 간단하게 다음과 같이 데이터셋을 작성한다. 상품명과 단위 정상가, 할인가로 이루어져 있고, 우리가 구하고자 하는 것은 할인율(%)이다. 먼저, 할인율을 구하는 공식은 할인금액/정상가 *100 = 할인율(%) 이다. 수식이 복잡할 수 있으니 할인금액은 따로 열을 하나 더 만들었다. 2. 할인금액 구하기 수식을 입력할 때는 prop("열 이름")으로 지정하면 되고, 간단한 사칙연산은 별도의 함수없이 연산기호로 가능하다. 작성이 완료되면 해당 열의 모든 행의 값이 자동 .. 2023. 5. 23.
[MySQL] 변수값으로 where절 필터를 설정하는 동적쿼리 대시보드를 만드는 도중에 사용자에게 2가지 옵션을 주고 싶었다. 원하면 개별로 조회할 수 있게 변수명을 받아 검색기능을 넣고 그렇지 않다면 최근 날짜순으로 정렬해서 모든 데이터를 보여주는 식으로 말이다. -- @myVariable에 변수 값이 할당 SET @myVariable = 'abc'; -- 쿼리에 동적으로 WHERE 절 조건을 설정합니다. SELECT * FROM my_table WHERE (@myVariable IS NULL OR column_name = @myVariable); 이렇게 해두면 변수명이 비어있을 때는 전체를 조회하게 되고, 변수명이 입력되면 해당 변수명으로만 필터링하여 조회할 수 있다. 2023. 5. 16.
[MySQL] ST_DISTANCE_SPHERE 함수를 활용하여 거리/반경 구하기 ST_DISTANCE_SPHERE 함수란? MySQL에서 제공하는 지리 함수 중 하나로, 두 지점 사이의 거리를 구하는 데 사용한다.구의 표면을 이용하여 두 지점 사이의 최단 거리를 계산하고 이를 미터로 환산해준다. ST_DISTANCE_SPHERE 함수의 사용법 ST_DISTANCE_SPHERE(point(lon1, lat1), point(lon2, lat2)) 위 구문에서 lon1, lat1, lon2, lat2는 경도와 위도 값을 나타내다. 이 함수는 두 지점 사이의 거리를 미터 단위로 반환한다. 약간 헷갈리는게 우리가 위도/경도가 순서가 익숙한데 여기서는 경도, 위도 순이라는 점이다. 그럼 실제로 사용해보자. 부산시청과 서울시청과의 거리를 측정해볼텐데, 두 위치의 위경도는 여기서 구할 수 있다. .. 2023. 5. 5.
꼭 필요한 만큼의 리서치 - 한 학기 수업 같은 리서치 개론 [제목] 저자 : 에리카 홀 출판 : 앱액츄얼코리아 발매 : 2017.09.08 UX디자인 직무쪽에서는 꽤 유명한 책인듯 싶다. 최근에 서비스 기획쪽 업무를 하면서 레퍼런스를 찾던 중 해당 책을 어딘가서 추천받아 읽게 되었다. 다만, 다소 딱딱한 문체 덕분에 잘 읽히는 책은 아니였다. 또한 책에서 배운대로 표현해보자면, 예시로 든 내용들이 대부분 저자의 컨텍스트(e.g. 스타트랙에 대한 예시)에 맞추다보니 와닿지 않는 부분도 있었다. 이 책을 관통하는 주제는 '훌륭한 디자인은 리서치에서 나온다.'라는 것이다. 그러한 리서치를 진행함에 있어 참여자가 아닌 관찰자 시점에서, 포커스 그룹 인터뷰가 아닌 관찰이 우선시 되어햐 하는 점을 강조하고 있다. 또한 단순 방법론을 넘어서 실제로 현업에서 어떻게 하는지, .. 2023. 4. 9.
Product-Market Fit(PMF) : 제품의 시장적합성을 찾아서 이 제품은 product-market fit을 가지고 있나요?초기 스타트업에서 가장 중요한 개념이자, 지속가능한 성장을 위해 계속 검증해나가야 하는 PMF(Product Market Fit)에 대해서 정리해보았다. Analytics Meta의 있는 내용을 위주로 발췌하였다.  Product-Market Fit(PMF)란 무엇인가?특정 세분시장의 요구를 충족시키기 위해 제품이 가지는 가치를 의미한다. 1. 모두에게 적용되는 PMF는 없다. PMF는 정의가능하면서 특정한 세분시장에 제품을 집중시키는 것이다. 궁극적으로 제품을 세분시장의 요구를 잘 충족시키는 것이다.  2. PMF는 정적이지 않다. 제품의 가치는 시간이 지남에 따라 변하고, 시장이 변하기도 하고 혹은 둘 다 변한다. 이것은 Product-Ma.. 2023. 4. 3.
HackerRank SQL - Weather Observation Station 20 A median is defined as a number separating the higher half of a data set from the lower half. Query the median of the Northern Latitudes (LAT_N) from STATION and round your answer to 4 decimal places. Input Format The STATION table is described as follows: where LAT_N is the northern latitude and LONG_W is the western longitude. Problem median(중위값)은 상위, 하위 절반을 구분한다. LAT_N의 중위값을 쿼리하라. Answer1 SET.. 2023. 2. 24.