Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- Stack
- 알고리즘스터디
- String Method
- MySQL
- 알고리즘
- 노마드코딩
- aws jupyter notebook
- queue
- programmers
- 자료구조
- 가상환경
- Selenium
- 데이터시각화
- dataframe
- 백준
- type hint
- pandas
- 프로그래머스
- 파이썬
- javascript
- Join
- python
- openCV
- Matplotlib
- NumPy
- 정보처리기사 c언어
- 알고리즘 스터디
- 코딩테스트
- 선그래프
- Algorithm
Archives
- Today
- Total
목록데이터 전처리 (1)
조금씩 꾸준히 완성을 향해
[Pandas] 범주형(category) 데이터처리 / 구간분할(pd.cut, np.histogram)
범주형(category) 데이터 처리 구간 분할 연속형 데이터를 그대로 사용하기 보다는 일정한 구간(bin)으로 나눠서 분석하는 것이 효율적인 경우가 있다. 이를 구간 분할(binning) 이라고 하고 pandas의 cut 함수를 사용한다. ▶ 라이브러리 import import pandas as pd import numpy as np ▶ NaN값 처리 # horsepower 열의 NaN 삭제 df.dropna(subset=['horsepower'], inplace=True) # horsepower 열의 NaN 값 개수 확인 df.horsepower.isna().sum() # 0 ▶ np.histogram 함수 사용해서 열 분리 # horsepower 열을 bins 옵션으로 3개로 분리 실행 # bins..
Python/Numpy & Pandas
2022. 10. 4. 23:45