본문 바로가기

데이터/Pandas3

[Pandas] concat, merge 구분하기 데이터를 합치는 concat()과 merge() 메서드 pd.concat과 pd.merge는 둘 다 데이터프레임을 결합하는 데 사용되는 메서드다. 그러나 각각 다른 방식으로 작동하며, 다른 상황에서 사용될 수 있다. 그래서 두 개념은 한 번에 정리해두는 게 좋겠다. 1. pd.concat() pd.concat 함수는 주어진 데이터프레임을 연결(concatenate)하여 새로운 데이터프레임을 생성한다. 데이터프레임을 행 또는 열 방향으로 연결이 가능하다. 연결하는 데이터프레임의 구조와 인덱스는 유지되며, 연결한 결과는 단순히 데이터프레임을 이어붙인 형태로 반환된다. 일반적으로 pd.concat은 데이터프레임을 단순히 결합하고자 할 때 사용되는데 예를 들어, 여러 개의 데이터프레임을 행 방향으로 연결하여 전.. 2023. 6. 22.
[Pandas] iloc, loc 인덱싱 구분하기(차이와 사용방법) 데이터 전처리의 꽃인 pandas, 그 중에서 핵심인 인덱싱을 정리해보려고 한다. pandas에서는 iloc과 loc 두 가지 방법이 있다. 샘플 데이터프레임 생성 직접 데이터 프레임을 만들어 해보자. import pandas as pd # 샘플 데이터프레임 생성 data = {'Name': ['Jino', 'Jun', 'Dayna', 'Sopia', 'Jay'], 'Age': [29, 28, 21, 32, 35], 'City': ['Seoul', 'New York', 'Paris', 'London', 'Tokyo']} df = pd.DataFrame(data) # 데이터프레임 출력 print(df) 1. iloc 먼저 iloc는 정수 기반의 인덱싱을 사용한다. 즉, 정수 인덱스를 사용하여 특정 위치의 .. 2023. 5. 27.
[Pandas] read_csv / read_excel - csv/excel 파일 읽기 CSV 파일 읽기 pandas에서 DataFrame 형식으로 csv파일을 읽어올 때 다음과 같이 사용한다. import pandas as pd df = pd.read_csv('파일경로/파일명') 주요 파라미터 encoding str, optional 인코딩하여 읽어올 수 있다. 가끔 한글의 경우 깨지는 경우가 있는데 이럴 땐, encoding = 'cp949' 를 붙여준다. 참조) List of Python standard encodings - https://docs.python.org/3/library/codecs.html#standard-encodings Excel 파일 읽기 pandas에서 DataFrame 형식으로 Excel파일을 읽어올 때 다음과 같이 사용한다. import pandas as p.. 2022. 12. 14.