Python/데이터 분석(전처리, 시각화) 썸네일형 리스트형 파이썬(12)- 떡볶이 프랜차이즈 입점전략 *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*import pandas as pddf = pd.read_csv('/content/drive/MyDrive/KDT/5. 데이터 분석/데이터/소상공인시장진흥공단_상가(상권)정보_서울_202303.csv')dfdf.info()shop = ['엽기떡볶이', '죠스떡볶이', '신전떡볶이', '청년다방', '감탄떡볶이']# 파리바게트(+파리바게뜨) 데이터 필터링# contains(): 특정 문자열 포함 여부에 따라 True, False를 반환data =df['상호명'].str.contains('파리바게트|파리바게뜨')df_paris = df.loc[d.. 더보기 파이썬(11)- 따릉이 API활용 *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*1. 따릉이 APIhttps://www.bikeseoul.com/app/station/getStationRealtimeStatus.doimport requests # 서버 요청import folium # 지도import json # json데이터 처리import pandas as pdimport warnings # 경고처리import foliumwarnings.filterwarnings('ignore')1-1. 데이터 요청하기targetSite = 'https://www.bikeseoul.com/app/station/getStationRealtimeStatus.do'request = requests.post(targ.. 더보기 파이썬(10)-Boxplot, barplot으로 데이터분석 *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snspark = pd.read_csv('/content/drive/MyDrive/KDT/5. 데이터 분석/데이터/전국도시공원표준데이터.csv', encoding='ms949')park# UnicodeDecodeError: 'utf-8' codec can't decode utf-8 인코딩 오류 -> ms949로 인코딩 변경park.shape!sudo apt-get install -y fonts-nanum!sudo fc-.. 더보기 파이썬(9)-Seaborn, Folium을 이용한 산점도, marker 시각화 *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*1. 산점도 그리기사용하려는 모듈설치import pandas as pdimport numpy as npimport matplotlib.pyplot as plt한글 font 설치!sudo apt-get install -y fonts-nanum!sudo fc-cache -fv!rm ~/.cache/matplotlib -rfplt.rc('font', family='NanumBarunGothic')데이터 불러오기shop = pd.read_csv('/content/drive/MyDrive/KDT/5. 데이터 분석/데이터/shop_201806_01.csv')shop pd.set_option() : 출력 형식 .. 더보기 파이썬(8)-Numpy와 Pandas를 이용한 데이터 전처리, 분석 *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*데이터 불러와서 객체 설정retail = pd.read_csv('/content/drive/MyDrive/KDT/5. 데이터 분석/데이터/OnlineRetail.csv')retailretail.info()# 행이 54만개, 열은 8개위 데이터프레임의 컬럼 설명InvoiceNo : 주문 번호 StockCode : 상품 코드 Description : 상품 설명 Quantity : 주문 수량 InvoiceDate : 주문 날짜 UnitPrice : 상품 가격 CustomerID : 고객 아이디 Country : 고객 거주지역(국가)# 각 컬럼당 null값이 몇 개 있는지 확인# sum()으로 총합 알기r.. 더보기 파이썬(7)-matplotlib *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*1. Matplotlib파이썬 기반 시각화 라이브러리로, 다양한 종류의 차트를 쉽게 만들 수 있도록 도와줍니다. 한글에 대한 지원이 완벽하지 않습니다. Pandas와 연동이 용이합니다. [Matplotlib 공식 홈페이지](https://matplotlib.org/)!pip install matplotlibimport matplotlib.pyplot as plt# MATLAB과 비슷하게 명령어 스타일로 동작하는 함수들의 모음plot() : 그래프를 그립니다.plt.show() : 그래프 출력plt.plot([1, 2, 3, 4]) # 리스트의 값들은 y값들이며, x값은 자동으로 만들어줌# 이건 코랩의 기능이고 원래 .. 더보기 파이썬(6)-Pandas(2) *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*8. 통계함수df.describe()df['height'].sum() # 합계df['height'].count() # 갯수, NaN은 미포함df['height'].mean() # 평균df['height'].median() #중위값df['height'].max() #최댓값df['height'].min() #최솟값df['height'].var() # 분산: 확률분포에서 데이터가 퍼져있는 정도# 데이터가 평균으로부터 얼마만큼 퍼져있는지# (데이터-평균)**2을 모두 다 더한 값 / 데이터의 갯수# 표준편차: 분산에 루트씌운df['height'].std()9. 그룹화groupby(): 데이터를 그룹으로 묶습니다.# grou.. 더보기 파이썬(6)-Pandas(1) *이 글을 읽기전에 작성자 개인의견이 있으니, 다른 블로그와 교차로 읽는것을 권장합니다.*1. 판다스(Pandas)데이터 분석을 위한 파이썬 라이브러리 중 하나로, 표 형태의 데이터나 다양한 형태의 데이터를 쉽게 처리하고 분석합니다. 특히 테이블 형식의 데이터를 다루는 데 강력한 기능을 제공하며, 데이터 프레임(DataFrame)과 시리즈(Series)라는 두 가지 주요 데이터 구조를 기반으로 동작합니다.# pip설치!pip install pandas# 모듈 연결import pandas as pd 주요 특징1-1. 데이터 구조:Series: 1차원 배열과 유사한 구조로, 인덱스를 포함한 데이터를 저장합니다.DataFrame: 2차원 표 형식의 데이터 구조로, 각 열이 Series 객체로 구성됩니다. 행과.. 더보기 이전 1 2 다음