Programming/Pandas

[Pandas] 데이터프레임(dataframe) 정렬 방법 (sort.index(), sort.values())

대충대충물티슈 2022. 4. 3. 15:52

Pandas로 생성한 데이터프레임 정렬하는 방법 모음


sort_values()

  • column의 값(value)을 기준으로 정렬 
  • 자주쓰는 parameter: sort_values(by, ascending=True, inplace=False)
    • by: 기준이 되는 column ('by='을 생략해서 작성해도 가능)
    • ascending: 오름차순(True) / 내림차순(False)
    • inplace: 원본변경(True) / 원본 미변경(False)
import pandas as pd 
# train.csv의 data를 'Age' column의 오름차순으로 정렬
data = pd.read_csv('train.csv')
data.sort_values('Age')

sort_values로 Kaagle titanic 데이터(trian.csv)를 오름차순으로 정렬


sort_index()

  • column의 인덱스(index)를 기준으로 정렬 
  • 자주쓰는 parameter: sort_values(ascending=True, inplace=False)
    • sort_values()와는 다르게 by가 없다. (index는 dataframe에 하나밖에 없으니 굳이 적을 필요가 없다는 뜻)
    • ascending: 오름차순(True) / 내림차순(False)
    • inplace: 원본변경(True) / 원본 미변경(False)
import pandas as pd 
# train.csv의 data를 index의 내림차순으로 정렬
data = pd.read_csv('train.csv')
data.sort_index(ascending=False)

 

sort_index로 Kaagle titanic 데이터(trian.csv)를 index 내림차순으로 정렬