아래는 json 파일로 되어 있는 파일을 파이썬으로 읽어 엑셀로 저장하기 위한 코드이다.
우선 json은 파이썬의 딕셔너리처럼 키와 값, 두 쌍으로 이루어진 자료형식이다.
오픈 API를 사용하거나 크롤링을 진행할 때 자주 만나게 되고 아래 방법을 알기 전에는 엑셀로 전처리하기도 했는데 상당히 비효율적이고 휴먼에러가 발생한 여지가 있다.
그래서 아래와 같이 json파일을 읽어오면 휠씬 빠르게 가공하여 활용할 수 있다.
import requests
import pandas as pd
import json
url = '' #json URL
response = requests.get(url)
contents = response.text
json_ob = json.loads(contents)
body = json_ob[''] #json 특정요소만 불러오기
df = pd.json_normalize(body)
print(df)
result = df.to_csv('result.csv', index=False, encodings='CP949')
사용하는 모듈은 URL의 정보를 파싱하는 requests,
파싱한 파일을 csv파일로 바꿔줄 때 필요한 pandas,
마지막으로 json파일을 일기기 위한 json이다.
반응형
'아주 미비한 코딩 > Python' 카테고리의 다른 글
[Python] Selenium을 Webdriver-manager로 설정하기 (0) | 2024.08.17 |
---|---|
[Python] 네이버 플레이스(naver place) 리뷰 크롤링 (35) | 2024.08.11 |
[Python] 두 좌표사이의 거리 구하기 - Haversine distance (0) | 2023.01.19 |
[Python] 네이버 플레이스 크롤링(selenium, BS4) (6) | 2022.12.20 |
[Python] json 형식 읽기 (0) | 2022.12.14 |
댓글