ALL (300) 썸네일형 리스트형 [Python] 데이터 스케일링 (표준화) 스케일링 데이터셋을 정제할 때, 특성별로 데이터 스케일이 다르면 안되기 때문에 이 작업을 통해 모든 특성의 범위를 같게 만들어줘야함 전체 데이터가 아닌 훈련 데이터에 대해서만 fit() 적용 scikit-learn에서 제공하는 스케일링 방법 1️⃣ StandardScaler() 각 특성의 평균을 0, 분산을 1로 스케일링 최솟값과 최댓값의 크기를 제한하지 않음 회귀보다 분류에 유용 데이터를 정규분포로 만듦 from sklearn.preprocessing import StandardScaler # 객체 생성 scaler = StandardScaler() # 훈련데이터의 분포 저장 scaler.fit(df) # 훈련 데이터 스케일링 scaler_scaled = scaler.transform(df) 2️⃣ R.. [데잇걸즈] 12~13주차 회고(9.13~9.24) KEEP 프로젝트가 본격적으로 시작되었다. 12주차에는 데이터 수집으로 바쁘게 보냈고 13주차에는 추석 연휴가 껴있어서 숙제도 하면서 쉬엄쉬엄 보냈다. 추석 돌려줘.. 12주차 수요일에 팀원분들 만나서 같이 밥도 먹고, 카페에 가서 커피도 마셨다. 물론 90%는 일을 하면서 보냈다. 잘 안풀리는 부분도 여럿이 모여서 같이 하니까 금방 해결할 수 있었다. 정말 오프라인으로 진행했으면 좋았을텐데 아쉬웠다. 데이터 정의를 하면서 어떤 식으로 설계를 해야하는지 알 수 있었고, 데이터 수집을 하면서 API를 이용해 긁어오는 법도 배웠다. 본격적으로 지수를 산출해내는 과정에서 어려움을 겪었는데 빛과 소금이었던 멘토링 덕분에 답답했던 부분이 많이 풀렸다. 범위를 줄여서 해보자! PROBLEM 데이터 수집 후에 전처리.. [통계] 비지도학습(차원 축소, 군집분석) 1️⃣ 머신러닝의 학습 방법 ▪️ 지도학습 말 그대로 정답이 있는 데이터를 활용해 데이터를 학습시키는 것 입력 값이 주어지면 입력값에 대한 Label을 주어 학습시키며 대표적으로 분류, 회귀 예를 들어 3*3을 주고 라벨 데이터 셋을 입력 데이터 셋의 정답인 9를 알려주면 주어지지 않은 데이터 셋 9*3도 해결할 수 있음 ▪️ 비지도학습 지도 학습과 달리 정답이 없는 데이터 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법 라벨링이 되어 있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도학습보다는 조금 더 난이도가 있음 비지도 학습의 대표적인 종류로는 클러스터링(Clustering), 차원 축소(Dimentionality Reduction)이 있음 2️⃣ 차원 축소 데이터.. [데잇걸즈] 11주차 회고(9.6~9.10) KEEP 데모데이 주제와 팀을 속전속결로 정했다! 이틀 간의 대장정이 끝나고 이제 선택과 집중만 하면 된다 ❤️🔥 같이 일해보고 싶던 분들과 함께 하게 되어서 기대가 된다. 좋은 동료와 친구를 이번 프로젝트를 얻어갈 수 있을 것 같다! 팀원 수가 많음에도 불구하고 의사결정이 착착 진행되는 게 정말 신기하다. 평소에 관심있는 주제를 프로젝트로 하다보니 어라.. 너무 재미있다. 하다보니까 좋아하는 주제로 다른 프로젝트도 해보고 싶어졌다 특강에서 연사님의 귀중한 경험을 들을 수 있었다. 가고싶은 회사에 다니고 있거나 다녔던 분들에게 어떻게든 컨택해서 이야기 듣기.. 면접 내게 유리하게 만들기.. 자신감과 확신을 가지고 일단 덤비기! 임파워링 되는 시간이었다. 나도 언젠간 누군가를 끌어주는 자리에 있고싶다! .. 이전 1 ··· 6 7 8 9 10 11 12 ··· 75 다음