데이터 프레임 전체에서 특정한 조건에 해당하는 행들을 제거한 새 데이터 프레임을 만드는 작업을 했다.
1. for idx, row in df.itterrows(): 를 활용하여 데이터 프레임 각 행마다 작업을 수행했을 때 작업 속도 : 36분
2. 특정한 조건을 condition으로 만들어 df[condition]으로 필터링한 경우의 작업 속도 : 460ms
약 4760배 속도가 향상되었다.
'Data > Pandas' 카테고리의 다른 글
Q. 데이터프레임에 중복값이 있는지 확인하려면? A. pandas.DataFrame.duplicated (0) | 2022.10.06 |
---|---|
[AI class day12] 파이썬 판다스 python pandas TIL (0) | 2021.05.05 |
numpy, pandas 연습 문제 링크 (0) | 2021.05.03 |