Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 정보처리기사 c언어
- NumPy
- queue
- Algorithm
- 백준
- Stack
- 데이터시각화
- 파이썬
- Matplotlib
- 코딩테스트
- pandas
- Join
- python
- 자료구조
- 알고리즘스터디
- javascript
- dataframe
- 프로그래머스
- Selenium
- 알고리즘 스터디
- programmers
- openCV
- aws jupyter notebook
- String Method
- MySQL
- 선그래프
- 노마드코딩
- 알고리즘
- type hint
- 가상환경
Archives
- Today
- Total
목록drop_duplicates (1)
조금씩 꾸준히 완성을 향해
[Pandas] 데이터 전처리 / 중복 데이터 확인 및 제거 (duplicated, drop_duplicates)
중복 데이터 처리 ▶ 중복 데이터 확인 duplicated() : 동일한 관측값이 중복되는지 여부를 확인 전에 나온 행들과 비교하여 중복되는 행이면 True, 처음 나오는 행은 False 반환 df #데이터 프레임 전체행에서 중복값 찾기 df.duplicated() # c2열에서 중복값 찾기 df.c2.duplicated() ▶ 중복 데이터 제거 drop_duplicates() : 중복된 행을 제거하고 고유한 관측값을 가진 행들만 보존 #데이터 프래임에서 중복 행을 제거 df.drop_duplicates() # c2,c3 열을 기준으로 중복 행을 제거(subset 옵션) df.drop_duplicates(subset=['c2', 'c3'])
Python/Numpy & Pandas
2022. 10. 2. 18:44