일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 국비지원
- SQL
- stratascratch
- groupby
- 논리적사고
- 태블로
- 데이터분석가양성과정
- Python
- eda
- 데이터 분석을 위한 sql 레시피
- 데이터분석
- 파이썬
- 비즈니스분석가양성과정
- while
- sql문제
- 비즈니스 분석가
- for
- 데이터베이스
- 크롤링
- SubQuery
- 패스트캠퍼스
- Tableau
- 데이터분석가 과정
- GA
- sql with
- sql partition by
- BDA과정
- 데이터캠프
- 시각화
- sql문제풀이
- Today
- Total
목록데이터캠프 (3)
원시인
원하 ㅎㅎ 판다스 데이터프레임에 대한 인덱스 설정과 리셋 방법에 대해 배워보겠습니다. 먼저 들어가기에 앞서 인덱스가 왜 중요한가? 라는 질문을 던져보면 답은 아래와 같습니다. 하위 집합 코드를 더 깨끗하게 만들 수 있기 때문인데요. 그럼 시작하겠습니다 ㅎㅎ import numpy as np import pandas as pd set_index() - index 지정 sample.set_index("Country").head(3) Ship Mode Segment City State Postal Code Region Category Sub-Category Sales Quantity Discount Profit Country United States Second Class Consumer Henderson K..
원하 ㅎㅎ drop_duplicates , value_counts , groupby 함수들에 대해 배워봤습니다. import numpy as np import pandas as pd bike = pd.read_csv("Desktop/bike.csv") bike.head(3) datetime season holiday workingday weather temp atemp humidity windspeed casual registered count 0 2011-01-01 00:00:00 1 0 0 1 9.84 14.395 81 0.0 3 13 16 1 2011-01-01 01:00:00 1 0 0 1 9.02 13.635 80 0.0 8 32 40 2 2011-01-01 02:00:00 1 0 0 1 9.0..
원하 ㅎㅎ 데이터를 EDA(Exploratory Data Analysis)하는 과정에서 사용하는 요약통계 함수를에 대하여 공부하였습니다. 간단한 함수들이지만 유용하게 사용할 수 있을거라 생각이 드네요. import numpy as np import pandas as pd sp = pd.read_csv ( "Desktop/SampleSuperstore.csv") sp.head(3) Ship Mode Segment Country City State Postal Code Region Category Sub-Category Sales Quantity Discount Profit 0 Second Class Consumer United States Henderson Kentucky 42420 South Furnit..