일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 정보처리기사 c언어
- NumPy
- 노마드코딩
- Stack
- Matplotlib
- MySQL
- 알고리즘
- 자료구조
- python
- 프로그래머스
- aws jupyter notebook
- String Method
- 알고리즘 스터디
- 가상환경
- dataframe
- 백준
- 선그래프
- queue
- programmers
- 데이터시각화
- 코딩테스트
- javascript
- Selenium
- Join
- 파이썬
- type hint
- 알고리즘스터디
- openCV
- Algorithm
- pandas
- Today
- Total
목록pandas (17)
조금씩 꾸준히 완성을 향해
그래프 여러개 그리기 ▶ axe 객체 활용 화면을 여러 개로 분할하고 분할된 각 화면에 서로 다른 그래프를 그리는 방법 axe 객체는 각각 서로 다른 그래프 표현 한 화면에서 여러 개의 그래프를 비교하거나 다양한 정보를 동시에 보여줄 때 사용 axe 객체를 한 개만 생성하는 경우에는 하나의 그래프만 표시 ▶ figure() 함수 사용 그래프를 그리는 그림틀(fig) 생성 figsize 옵션으로 (가로, 세로) 그림 틀의 크기 설정 fig 객체에 add_subplot() 메소드를 적용하여 그림틀을 여러 개로 분할(각 부분은 axe 객체) fig = plt.figure(figsize=(10,10)) #그래프 틀 생성 및 사이즈 지정 ax1 = fig.add_subplot(2, 1, 1) #ax1 객체 생성 ..
주석 달기 : annotate() 함수 주석 내용(텍스트)을 넣을 위치와 정렬방법 등을 함수에 함께 전달 S는 '', 화살표의 머리부분은 xy, 꼬리부분은 xytext, 화살표 서식은 arrowprops = dict() 사용 arrowprops 옵션 사용시 텍스트 대신 화살표 표시를 나타냄 화살표 서식은 arrowprops=dict() 함수 내에 arrowstyle(->), color(skyblue), lw(5) 속성 지정 plt.annotate('',xy=(21,650000), xytext=(2, 300000), arrowprops=dict(arrowstyle='->', color='skyblue', lw=5)) plt.annotate('',xy=(43,450000), xytext=(28,680000)..
스타일 서식 지정 색, 폰트 등 디자인적 요소를 사전에 지정된 스타일로 빠르게 일관 변경하는 것을 말한다. 스타일 서식을 지정하는 것은 matplotlib 환경 설정을 변경하는 것이므로 다른 파일에도 계속 적용된다. ▶ 사용 가능한 스타일 확인 print(plt.style.available) ['Solarize_Light2', '_classic_test_patch', 'bmh', 'classic', 'dark_background', 'fast', 'fivethirtyeight', 'ggplot', 'grayscale', 'seaborn', 'seaborn-bright', 'seaborn-colorblind', 'seaborn-dark', 'seaborn-dark-palette', 'seaborn-dark..
데이터 불러와서 처리하기 ▶ 필요한 라이브러리 가져오기 # import library import matplotlib.pyplot as plt import pandas as pd ▶ 엑셀파일 열어서 저장 df_move = pd.read_excel('/content/drive/MyDrive/ Encore Prac/시도별 전출입 인구수.xlsx') df_move ▶ 결측치 처리 df_move = df_move.fillna(method='ffill') #결측치(NaN)을 앞 데이터로 채움 df_move.head(4) #상위 4행만 확인 ▶ 데이터 추출해서 정리 (서울에서 다른 지역으로 이동한 인구 데이터만 추출) # 전출지는 서울이고, 전입지는 서울이 아닌 데이터 추출 df_seoul..
Index를 활용하는 다양한 함수들 (설정, 재설정, 초기화) ▶ set_index() : 특정 열을 행 인덱스로 설정 #데이터 확인 df # '이름' 열을 index로 지정 ndf = df.set_index('이름') ndf # '수학'과 '체육'열을 인덱스로 지정 ndf3 = df.set_index(['수학','체육']) ndf3 ▶ reindex() : 데이터 프레임의 행 인덱스를 새로운 배열로 재지정 (새로운 객체 반환) # 데이터 확인 dic # index 지정해서 데이터프레임 생성 df = pd.DataFrame(dic, index=['r0', 'r1', 'r2']) df # index를 새로운 배열로 변경 # 요소들이 존재하지 않을 경우 자동적으로 NaN으로 처리 ndf = df.reinde..
행/열 삭제 drop() 축 옵션으로 axis=0을 입력하면 행 삭제 (default 설정이라 생략가능) 축옵션 axis=1을 입력하면 열을 삭제 동시에 여러 개의 행 또는 열을 삭제하려면, 리스트 형태로 입력 원본을 변경하지 않고 새로운 객체를 반환하기 때문에 원본 객체를 변경하려면 inplace=True 옵션 사용 행 삭제 # 인덱스가 '우현'인 행 삭제 df2 = df.copy() # df2에 원본 데이터 복사 df2.drop('우현', inplace=True) # df2 직접변경 df2 # 인덱스가 '우현', '인아'인 행 삭제 df3 = df.drop(['우현', '인아'], axis = 0) #원본에서 수정된 데이터를 바로 df3으로 받기 df3 열 삭제 # '수학' 열 삭제 df4 = df...
DataFrame 객체 데이터 테이블 전체를 지칭하는 객체 넘파이 배열의 특성을 그대로 가짐 indexing : 열과 행 각각 사용하여 하나의 데이터에 접근 데이터프레임 생성 딕셔너리 타입 데이터에서 Key는 열이름, Value는 시퀀스형 데이터 타입을 넣어 각 열의 데이터로 만듦 # dictionary > DataFrame datas = {'나이': [15, 17], '성별': ['남', '여'], '학교': ['덕영중', '수리고']} pd.DataFrame(datas, index=['준서', '예은']) 리스트 타입 데이터에서 행과 열을 별도로 지정해서 데이터 프레임 생성 # List > DataFrame datas = [[15, '남', '덕영중'], [17, '여', '수리고']] pd.Data..
Pandas python의 데이터 분석 라이브러리 -> 데이터 테이블을 다루는 도구 (정형 데이터) 기본적으로 numpy를 사용 numpy : python에서 배열을 다루는 최적의 라이브러리 pandas는 numpy를 효율적으로 사용하기 위해 인덱싱, 연산, 전처리 등 다양한 함수 제공 Pandas의 개념 Data Frame : 데이터 테이블 전체 객체 Series : 각 열 데이터를 다루는 객체 Series Feature Vector 와 같은 개념 일반적으로 하나의 피쳐 데이터를 포함하는 형태 생성된 데이터 프레임 안에 포함될 수 있음 list, dict, ndarray 등 다양한 데이터 타입이 시리즈 객체 형태로 변환되기도 함. 시리즈 객체를 생성하면 세 가지 요소(property) 생성 Data :..