본문 바로가기

pandas3

[Pandas] concat, merge 구분하기 데이터를 합치는 concat()과 merge() 메서드 pd.concat과 pd.merge는 둘 다 데이터프레임을 결합하는 데 사용되는 메서드다. 그러나 각각 다른 방식으로 작동하며, 다른 상황에서 사용될 수 있다. 그래서 두 개념은 한 번에 정리해두는 게 좋겠다. 1. pd.concat() pd.concat 함수는 주어진 데이터프레임을 연결(concatenate)하여 새로운 데이터프레임을 생성한다. 데이터프레임을 행 또는 열 방향으로 연결이 가능하다. 연결하는 데이터프레임의 구조와 인덱스는 유지되며, 연결한 결과는 단순히 데이터프레임을 이어붙인 형태로 반환된다. 일반적으로 pd.concat은 데이터프레임을 단순히 결합하고자 할 때 사용되는데 예를 들어, 여러 개의 데이터프레임을 행 방향으로 연결하여 전.. 2023. 6. 22.
[Pandas] iloc, loc 인덱싱 구분하기(차이와 사용방법) 데이터 전처리의 꽃인 pandas, 그 중에서 핵심인 인덱싱을 정리해보려고 한다. pandas에서는 iloc과 loc 두 가지 방법이 있다. 샘플 데이터프레임 생성 직접 데이터 프레임을 만들어 해보자. import pandas as pd # 샘플 데이터프레임 생성 data = {'Name': ['Jino', 'Jun', 'Dayna', 'Sopia', 'Jay'], 'Age': [29, 28, 21, 32, 35], 'City': ['Seoul', 'New York', 'Paris', 'London', 'Tokyo']} df = pd.DataFrame(data) # 데이터프레임 출력 print(df) 1. iloc 먼저 iloc는 정수 기반의 인덱싱을 사용한다. 즉, 정수 인덱스를 사용하여 특정 위치의 .. 2023. 5. 27.
[Python] json 파일 읽어서 csv로 저장하기 아래는 json 파일로 되어 있는 파일을 파이썬으로 읽어 엑셀로 저장하기 위한 코드이다. 우선 json은 파이썬의 딕셔너리처럼 키와 값, 두 쌍으로 이루어진 자료형식이다. 오픈 API를 사용하거나 크롤링을 진행할 때 자주 만나게 되고 아래 방법을 알기 전에는 엑셀로 전처리하기도 했는데 상당히 비효율적이고 휴먼에러가 발생한 여지가 있다. 그래서 아래와 같이 json파일을 읽어오면 휠씬 빠르게 가공하여 활용할 수 있다. import requests import pandas as pd import json url = '' #json URL response = requests.get(url) contents = response.text json_ob = json.loads(contents) body = json.. 2023. 1. 24.