Python/기초
Pandas 사용 함수
_채리니_
2022. 4. 22. 15:39
1. dtype and type
dtype: numpy에 해당하는 함수로, 데이터 타입을 확인할 수 있음
type: pandas의 함수로, 데이터 타입을 확인할 수 있음
2. loc and iloc
loc(): pandas함수로 row의 정보로 검색
ex) data.loc[[1,2,3]]
iloc(): pandas함수로 row의 index로 추출
ex) data.iloc([:,3])
3. sort_values
ex) data.sort_values('Age') , Age = 변수이름
4. 중복값찾기: pd.duplicated()
객체.duplicated(): 전체 중복 row를 찾음
객체.duplicated(['컬럼명']): 해당 컬럼이 중복되는 row만 찾음
ex) df[df.duplicated()]
5. 중복값 제거: pd.drop_duplicates()
6. map 과 replace
dictionary형 데이터를 이용해서 컬럼으로 정보를 붙일때 => map, 자리의 정보를 대체할때 => replace
7. groupby (pivot_table대신 사용)
df.groupby(['컬럼명'])['보고싶은컬럼명'].sum().to_frame()
#output은 groupby object라서 꼭 dataframe으로 변환하는 과정이 필요함.