1. dtype and type
dtype: numpy에 해당하는 함수로, 데이터 타입을 확인할 수 있음
type: pandas의 함수로, 데이터 타입을 확인할 수 있음
2. loc and iloc
loc(): pandas함수로 row의 정보로 검색
ex) data.loc[[1,2,3]]
iloc(): pandas함수로 row의 index로 추출
ex) data.iloc([:,3])
3. sort_values
ex) data.sort_values('Age') , Age = 변수이름
4. 중복값찾기: pd.duplicated()
객체.duplicated(): 전체 중복 row를 찾음
객체.duplicated(['컬럼명']): 해당 컬럼이 중복되는 row만 찾음
ex) df[df.duplicated()]
5. 중복값 제거: pd.drop_duplicates()
6. map 과 replace
dictionary형 데이터를 이용해서 컬럼으로 정보를 붙일때 => map, 자리의 정보를 대체할때 => replace
7. groupby (pivot_table대신 사용)
df.groupby(['컬럼명'])['보고싶은컬럼명'].sum().to_frame()
#output은 groupby object라서 꼭 dataframe으로 변환하는 과정이 필요함.
'Python > 기초' 카테고리의 다른 글
동적 import가 필요할때 - importlib (0) | 2023.07.04 |
---|---|
함수, 클래스, 모듈, 패키지 간단 개념 (0) | 2023.06.06 |
각 type별 함수 사용 (0) | 2022.04.19 |
파이썬 나아가기 (0) | 2019.09.05 |
Python 프로그램 입출력하기 (0) | 2019.09.05 |