1. dtype and type

dtype: numpy에 해당하는 함수로, 데이터 타입을 확인할 수 있음

type: pandas의 함수로, 데이터 타입을 확인할 수 있음

 

2. loc and iloc

loc(): pandas함수로 row의 정보로 검색

ex) data.loc[[1,2,3]]

iloc(): pandas함수로 row의 index로 추출

ex) data.iloc([:,3])

 

3. sort_values

ex) data.sort_values('Age') , Age = 변수이름

 

4. 중복값찾기: pd.duplicated()

객체.duplicated(): 전체 중복 row를 찾음

객체.duplicated(['컬럼명']): 해당 컬럼이 중복되는 row만 찾음

ex) df[df.duplicated()]

 

5. 중복값 제거: pd.drop_duplicates() 

 

6. map 과 replace

dictionary형 데이터를 이용해서 컬럼으로 정보를 붙일때 => map, 자리의 정보를 대체할때 => replace

 

7. groupby (pivot_table대신 사용)

df.groupby(['컬럼명'])['보고싶은컬럼명'].sum().to_frame()

#output은 groupby object라서 꼭 dataframe으로 변환하는 과정이 필요함.

 

'Python > 기초' 카테고리의 다른 글

동적 import가 필요할때 - importlib  (0) 2023.07.04
함수, 클래스, 모듈, 패키지 간단 개념  (0) 2023.06.06
각 type별 함수 사용  (0) 2022.04.19
파이썬 나아가기  (0) 2019.09.05
Python 프로그램 입출력하기  (0) 2019.09.05

+ Recent posts