본문 바로가기

분류 전체보기139

[MySQL] 데이터(값)가 없는 날짜도 출력하여 채우기 MySQL를 사용하여 데이터를 일자별로 조회하여 이를 그래프로 보여주거나, 통계 계산을 할 때, 특정 일자의 데이터가 기록되지 않는다면 출력 결과에도 보이지 않게 된다. 그래서 With 절을 이용하여 날짜 범위를 생성하고 Left Join으로 데이터가 없는 날짜로 출력해야 한다.   1. 문제 상황 : 거래가 없는 날짜가 존재하는 데이터셋일자별로 거래 데이터를 집계한다고 하면, Select문을 작성 후, Group by  혹은 윈도우 함수를 사용하여 집계할 수 있다.그리고 Where절에서 date 범위 값을 지정하면 손쉽게 출력할 수 있다. 그러나, 특정일에 데이터가 없다면, 다시 말해 집계할 데이터가 존재하지 않는 null 상태라면 일자값도 가져올 수 없다. 아래와 같은 데이터가 있다고 가정하자. 20.. 2024. 8. 18.
[Python] Selenium을 Webdriver-manager로 설정하기 Selenium을 사용할 때,  Chrome driver를 설치하고 버전을 맞추는 것이 상당히 귀찮다.특히 사용자의 로컬 환경에서 크롬 버전이 맞아야 실행이 되니 또 하나의 의존성 문제가 발생하는 것이다.주기적으로 크롬 드라이버를 확인하고 설치하는 번거로움도 추가된다.  ChromeDriver 개요  |  Chrome for DevelopersChromeDriver는 W3C WebDriver 표준을 구현하는 독립형 서버입니다.developer.chrome.com  그래서 나온 Webdriver-manager 패키지는 버전이나 설치 위치를 잡아줄 필요없이  자동으로 설치해준다. 1. Webdrvier-manger 라이브러리 설치pip install selenium webdriver-manager 먼저, 터.. 2024. 8. 17.
[Python] 네이버 플레이스(naver place) 리뷰 크롤링 지난 번 네이버 플레이스를 통해 크롤링을 해봤는데,이번에는 리뷰를 가져오는 코드를 실습해보았다. 특히 수집된 데이터를 다시 자연어 처리해 다른 분석을 해볼 때도 유용할 것 같다.  그리고 최근에 알게 된 사실인데, 크롤링(Crawling)과 스크래핑(Scraping)은 구분되는 개념이지만 그냥 크롤링이라는 명칭을 썼다. 사실 지금 하는 실습은 스크래핑이라는 것을 밝혀둔다. 1.탐색네이버 리뷰는 어디서 볼 수 있을까? 네이버 리뷰는 크게 2가지 방법으로 노출되고 있는데, 네이버 맵과 네이버 플레이스다.네이버 맵으로 접근하는 건 다른 개발블로그에서 많이 봤었고, 효율적인 코드가 많았다.맵에서는 검색 기반이라 특정 페이지로 바로 들어가는 건 불가능하고, 오직 검색을 통해서만 접근 할 수 있다.그런데 첫번째 검.. 2024. 8. 11.
처음 시작하는 FastAPI - 이왕 처음 배우는 거라면 최신 기술 [처음 시작하는 FastAPI]저자 : 빌 루바노빅 저자(글) · 한용재 , 한바름 번역출판 : 한빛미디어발매 : 2024.06.30 파이썬으로 웹 개발을 시작하는 사람이라면   책의 구성과 내용#️⃣  기본정보ISBN9791169212649발행(출시)일자2024년 5월 10일쪽수324쪽크기183 * 235 * 16 mm / 695 g   #️⃣ 목차책의 감상평#️⃣ 파이썬으로 웹개발을 해보지 않아도 괜찮은 친절한 설명 원서는 'FastAPI' 이지만, 번역본에서는 '처음 시작하는'이라는 수식어가 있다. 300여 페이지의 구성이지만 파이썬으로 웹 개발을 하지 않은 사람이나 웹 개발에 대해 이해도 높지 않은 사람들도 이해할 수 있도록 비교적 설명이 친절했다. 특히, Part 1에서는 개략적인 모던 웹을 훑.. 2024. 7. 27.
머신러닝 리스크 관리 with 파이썬 - 내가 만든 모델은 내가 책임져야...!? [머신러닝 리스크 관리 with 파이썬]저자 : 패트릭 홀 , 제임스 커티스 , 파룰 판데이 저자(글) · 윤덕상 , 이상만 , 김경환 , 김광훈 , 장기식 번역출판 : 한빛미디발매 : 2024.05.10 암세포 조기 진단 모델과 신용평가 모델이 같을 수 없는 이유딥러닝 모델을 통해 암세포를 조기 진단하는 경우와 신용평가 모델을 구현하는 경우를 비교해보자.  딥러닝으로 암세포를 조기 진단하는 모델에서는 높은 정확도가 무엇보다 중요하다.정확히 암세포를 감지 할 수 있다면, 환자의 생명을 구하는데 큰 기여를 할 수 있다. 사실 그 정확도 조차도 암 발병 확률로 치환한다면 모델로서 나쁘지 않을 거라 생각한다. 어쨌든 이 경우, 설명 가능성은 상대적으로 덜 중요하고 모델이 암세포를 얼마나 정확하게 예측하는지가 .. 2024. 6. 15.
UX 디자인 입문 A to Z - 후루룩 머리 속에 정리되는 UX 디자인 [ 뉴욕 프로덕트 디자이너가 알려주는 UX 디자인 입문 A to Z ]저자 : 에릭(박의준)출판 : 위키북스 UX 디자인 21발매 : 2022.5.20  #️⃣ UX 디자이너가 쓴 책은 마케터가 쓴 책보다 휠씬 읽기 쉽다. 요즘 여러 분야의 책을 읽으면서 한 가지 드는 생각은 마케터가 쓴 책보다 UX디자이너 쓴 책이 휠씬 읽기 쉽다라는 점이다. 마케팅이라는 분야는 학부생부터 지금까지 꾸준히 자극받으며 공부하고 있어 새로운 것이랄 것도 크게 없는데 이상하게 잘 읽히지 않고, UX디자인은 IT회사에서 다니기 시작한 시점에서 알게 된 개념인데, 새로운 내용을 이해하는데 크게 무리가 없다. 이 책 역시 UX디자이너가 쓴 책 답게 어떻게 하면 독자가 포기하지 않고, 끝까지 읽을지 고민하고 쓴 책이다. 목차부터 책.. 2024. 6. 7.
데이터 드리븐 리포트 - 데이터 분석 보고 어떻게 하는지 모르겠다고요? [데이터 드리븐 리포트]저자 : 이상석출판 : 한빛미디발매 : 2023.10.31  입로만, 마음으로만 데이터 드리븐(Data Driven) 하지 않는가?데이터가 중요하다고 하는데 정말 데이터 드리븐 의사결정이 되고 있는 조직은 많이 없는 것 같다.조직문화나 의사결정자마다 다르겠지만, 보고를 하는 실무자 입장에서도 데이터 기반의 의사결정을 할 수 있도록 올바른 리포트를 작성하는 것도 중요하다. 오늘 데이터 드리븐 리포트의 개괄적인 내용을 다룬 책을 리뷰하려고 한다.책의 구성과 내용#️⃣  기본정보ISBN9791169211574발행(출시)일자2023년 10월 31일쪽수408쪽크기 183 * 235 * 22 mm / 859 g  생각보다 두껍고 책의 가격도 비싼 편이긴 하다.아트지 느낌의 용지로 수성펜은 번.. 2024. 5. 18.
엑셀(Excel) - 한글과 영어 분리하기(내장함수, VBA) 영문자의 위치가 일정한 경우 아래와 같은 데이터셋이 있다고 가정해보자. 띄어쓰기, 대소문자, 문자길이가 각각 다르지만 모두 영어가 오른쪽에 위치하고 있음을 알 수 있다. 이 경우 가장 처음에 나타나는 영문자의 위치를 추출하여LEFT 함수를 사용하면 영문자만 추출할 수 있다. =IFERROR(LEFT(A1,MIN(IFERROR(SEARCH({"a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z"},LOWER(A1)),1000))-1),"") 함수의 원리는 영문 알파벳을 찾아 모두 소문자로 바꿔주고,소문자 알파벳이 나오는 첫번째 글자의 위치를 찾아 LEFT함수로 추출하는 방식이다.. 2024. 5. 9.