본문 바로가기

Dev/Python

(28)
[Python] 데이터 스케일링 (표준화) 스케일링 데이터셋을 정제할 때, 특성별로 데이터 스케일이 다르면 안되기 때문에 이 작업을 통해 모든 특성의 범위를 같게 만들어줘야함 전체 데이터가 아닌 훈련 데이터에 대해서만 fit() 적용 scikit-learn에서 제공하는 스케일링 방법 1️⃣ StandardScaler() 각 특성의 평균을 0, 분산을 1로 스케일링 최솟값과 최댓값의 크기를 제한하지 않음 회귀보다 분류에 유용 데이터를 정규분포로 만듦 from sklearn.preprocessing import StandardScaler # 객체 생성 scaler = StandardScaler() # 훈련데이터의 분포 저장 scaler.fit(df) # 훈련 데이터 스케일링 scaler_scaled = scaler.transform(df) 2️⃣ R..
[Python] 람다표현식(Lambda expressions) 람다표현식(Lambda expressions) 익명 함수를 만드는 방식 익명 함수는 말 그대로 함수의 이름이 없는 함수 언제 사용할까? 함수를 한 줄로 간결하게 표현할 때 간단한 함수를 굳이 def를 사용하지 않고 만들고 싶을 때 def를 사용할 수 없는 곳에서 사용하고 싶을 때 다른 함수의 전달인자로써 사용하려 할 때 사용하는 방법 # def def square(x) : return x * x square(2) # 람다식 square = lambda x : x * x square(2) # 변수에 할당하지 않고 바로 사용 (lambda x: x*x)(2)
[Python] 깃허브에서 주피터 노트북 파일 렌더링 방법 문제 깃허브에 주피터 노트북 파일을 올렸을 때 시각화 차트가 나타나지 않는 경우가 발생했다 팀원들이 보기 쉽게 다운받지 않고, 이를 확인할 수 있는 방법이 없을까 서치해보았다 해결 방법 nbviewer라는 사이트를 이용해 렌더링 하면된다! nbviewer url과 주피터 노트북 파일이 올려져 있는 깃허브 사이트의 url을 뒤에 붙여넣으면 끝 nbviewer url https://nbviewer.jupyter.org jupyter notebook file link https://github.com/yujin-jo/mini-project-team1/blob/main/2.%20Data%20Analysis/analysis_02_%EB%8F%85%EB%A6%BD%EC%98%81%ED%99%94%EC%88%98%E..
[Python] JSON, API JSON(JavaScript Object Notation) Key-Value형태로 데이터를 전달하기 위해 사용하는 포맷이다 본래는 자바스크린트 언어에서 파생되었지만 언어 독립형 데이터 포맷이다 즉, 여러 프로그래밍 언어에서 쉽게 이용할 수 있다 그래서, 대부분의 API에서 JSON포맷(혹은 XML)을 사용한다 파이썬의 Dictionary와 매우 비슷하지만, JSON은 통신 등을 통해 데이터를 주고 받기 위한 것이기 때문에 언어에 국한되지 않은 문자열 형태이다 예시 json_str = '{"name" : "jack", "age":20}' > json을 어떻게 바꾸지? 통신을 통해 데이터를 주고 받기 때문에 JSON형식을 갖춘 문자열형태로 전달된다 이것을 우리는 Dictionary형태로 변환해서 사용하면 된..