본문 바로가기

pandas

파이썬(8)-Numpy와 Pandas를 이용한 데이터 전처리, 분석 *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*데이터 불러와서 객체 설정retail = pd.read_csv('/content/drive/MyDrive/KDT/5. 데이터 분석/데이터/OnlineRetail.csv')retailretail.info()# 행이 54만개, 열은 8개위 데이터프레임의 컬럼 설명InvoiceNo : 주문 번호 StockCode : 상품 코드 Description : 상품 설명 Quantity : 주문 수량 InvoiceDate : 주문 날짜 UnitPrice : 상품 가격 CustomerID : 고객 아이디 Country : 고객 거주지역(국가)# 각 컬럼당 null값이 몇 개 있는지 확인# sum()으로 총합 알기r.. 더보기
파이썬(6)-Pandas(2) *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*8. 통계함수df.describe()df['height'].sum() # 합계df['height'].count() # 갯수, NaN은 미포함df['height'].mean() # 평균df['height'].median() #중위값df['height'].max() #최댓값df['height'].min() #최솟값df['height'].var() # 분산: 확률분포에서 데이터가 퍼져있는 정도# 데이터가 평균으로부터 얼마만큼 퍼져있는지# (데이터-평균)**2을 모두 다 더한 값 / 데이터의 갯수# 표준편차: 분산에 루트씌운df['height'].std()9. 그룹화groupby(): 데이터를 그룹으로 묶습니다.# grou.. 더보기
파이썬(6)-Pandas(1) *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*1. 판다스(Pandas)데이터 분석을 위한 파이썬 라이브러리 중 하나로, 표 형태의 데이터나 다양한 형태의 데이터를 쉽게 처리하고 분석합니다. 특히 테이블 형식의 데이터를 다루는 데 강력한 기능을 제공하며, 데이터 프레임(DataFrame)과 시리즈(Series)라는 두 가지 주요 데이터 구조를 기반으로 동작합니다.# pip설치!pip install pandas# 모듈 연결import pandas as pd 주요 특징1-1. 데이터 구조:Series: 1차원 배열과 유사한 구조로, 인덱스를 포함한 데이터를 저장합니다.DataFrame: 2차원 표 형식의 데이터 구조로, 각 열이 Series 객체로 구성됩니다. 행과.. 더보기