일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 데이터분석
- 비즈니스 분석가
- 파이썬
- sql with
- 데이터베이스
- groupby
- for
- 시각화
- sql문제
- 데이터분석가 과정
- 크롤링
- BDA과정
- 패스트캠퍼스
- Python
- sql문제풀이
- GA
- Tableau
- SQL
- sql partition by
- stratascratch
- eda
- 비즈니스분석가양성과정
- 국비지원
- SubQuery
- 데이터분석가양성과정
- while
- 데이터 분석을 위한 sql 레시피
- 태블로
- 데이터캠프
- 논리적사고
- Today
- Total
목록파이썬 (9)
원시인
[KDT] 패스트캠퍼스 비즈니스 데이터 분석가 양성과정 16일~20일 차 EDA 프로젝트 안녕하세요 일주일만에 돌아왔네요 ㅎㅎ 저번주 화요일부터 이번주 월요일까지 BDA과정 첫 프로젝트를 진행하느라 바쁜나날을 보내 글을 올리지 못했습니다. EDA프로젝트인 만큼 원래 존재하던 데이터셋보다는 주제에 부합하는 데이터를 크롤링하고 정제, 시각화 및 분석하는 과정을 가졌습니다. 주제에 따른 문제정의를 명확하게 하지 못해 여러번 주제를 바꿔가며 주말까지 시간을 할애에 진행하였는데 일단 너무 좋은 팀원들을 만나고 저희가 우려했던 부분인 문제정의, 분석결과 등을 강사님, 다른 조원분들이 저희 생각과 다르게 좋게 봐주셔서 기분좋게 마무리 할 수 있었던거 같습니다. 아무런 정제가 되지 않은 rawdata를 가져와 분석에 ..
원하 ㅎㅎ 판다스 데이터프레임에 대한 인덱스 설정과 리셋 방법에 대해 배워보겠습니다. 먼저 들어가기에 앞서 인덱스가 왜 중요한가? 라는 질문을 던져보면 답은 아래와 같습니다. 하위 집합 코드를 더 깨끗하게 만들 수 있기 때문인데요. 그럼 시작하겠습니다 ㅎㅎ import numpy as np import pandas as pd set_index() - index 지정 sample.set_index("Country").head(3) Ship Mode Segment City State Postal Code Region Category Sub-Category Sales Quantity Discount Profit Country United States Second Class Consumer Henderson K..
원하 ㅎㅎ drop_duplicates , value_counts , groupby 함수들에 대해 배워봤습니다. import numpy as np import pandas as pd bike = pd.read_csv("Desktop/bike.csv") bike.head(3) datetime season holiday workingday weather temp atemp humidity windspeed casual registered count 0 2011-01-01 00:00:00 1 0 0 1 9.84 14.395 81 0.0 3 13 16 1 2011-01-01 01:00:00 1 0 0 1 9.02 13.635 80 0.0 8 32 40 2 2011-01-01 02:00:00 1 0 0 1 9.0..
원하 ㅎㅎ 데이터를 EDA(Exploratory Data Analysis)하는 과정에서 사용하는 요약통계 함수를에 대하여 공부하였습니다. 간단한 함수들이지만 유용하게 사용할 수 있을거라 생각이 드네요. import numpy as np import pandas as pd sp = pd.read_csv ( "Desktop/SampleSuperstore.csv") sp.head(3) Ship Mode Segment Country City State Postal Code Region Category Sub-Category Sales Quantity Discount Profit 0 Second Class Consumer United States Henderson Kentucky 42420 South Furnit..

[KDT] 패스트캠퍼스 비즈니스 데이터 분석가 양성과정 6일 차 파이썬 프로그래밍 원하 ㅎㅎ BDA 과정 6일 차 되는 날입니다. 오늘 부로 파이썬 강의가 시작되었습니다. 프로그래밍 정의부터 기초 파이썬 type 등을 배웠고 인강 형식으로 진행되었습니다. 배웠던 내용들을 정리해보겠습니다. 프로그래밍이란 누군가가 특정명령을 컴퓨터에게 수행시키기 위해 만들어놓은 일련의 도구를 프로그램이라 지칭 프로그램을 만드는 과정을 프로그래밍 즉 컴퓨터에게 일을 시키는 방법 , 컴퓨터에게 명령을 내리는 방법이라고 할 수 있습니다. 구성요소 두가지 명령을 수행하는 컴퓨터 , 명령을 구성하는 코드 프로그래밍 언어 - 컴퓨터와의 소통수단 언어적인 특징이 존재 syntax, semantics 언어가 사용되는 목적에 따라 특징이 ..
안녕하세요 원시인 입니다 ㅎㅎ 데이터분석에 있어서 빠질 수 없는 것이 시각화인데요. 파이썬 시각화 툴 중에서 Matplotlib에 대해서 정리해봤습니다. Matplotlib matplotlib은 2차원 그래픽 패키지이다. Matlab과 같이 커맨드 방식(matplotlib에서는 Pyplot API라고 한다)으로 그래프를 그릴 수 있으며, 커맨드 함수의 이름도 유사도록 설계되어 있다. Matplotlib 특징 파이썬의 대표적인 과학 계산용 그래프 라이브러리 선 그래프, 히스토그램, 산점도 등의 고품질 그래프 제공 저수준 api를 사용한 다양한 시각화 기능 제공 다양한 운영체제와 그래픽 백엔드에서 동작 import numpy as np import pandas as pd import matplotlib.py..