Programming/Pandas
[Pandas] 데이터프레임(dataframe) 정렬 방법 (sort.index(), sort.values())
대충대충물티슈
2022. 4. 3. 15:52
Pandas로 생성한 데이터프레임 정렬하는 방법 모음
- 예제는 가장 많이 쓰이는 kaggle의 titanic 사용
sort_values()
- column의 값(value)을 기준으로 정렬
- 자주쓰는 parameter: sort_values(by, ascending=True, inplace=False)
- by: 기준이 되는 column ('by='을 생략해서 작성해도 가능)
- ascending: 오름차순(True) / 내림차순(False)
- inplace: 원본변경(True) / 원본 미변경(False)
import pandas as pd
# train.csv의 data를 'Age' column의 오름차순으로 정렬
data = pd.read_csv('train.csv')
data.sort_values('Age')
sort_index()
- column의 인덱스(index)를 기준으로 정렬
- 자주쓰는 parameter: sort_values(ascending=True, inplace=False)
- sort_values()와는 다르게 by가 없다. (index는 dataframe에 하나밖에 없으니 굳이 적을 필요가 없다는 뜻)
- ascending: 오름차순(True) / 내림차순(False)
- inplace: 원본변경(True) / 원본 미변경(False)
import pandas as pd
# train.csv의 data를 index의 내림차순으로 정렬
data = pd.read_csv('train.csv')
data.sort_index(ascending=False)