컴공생의 다이어리
[판다스, pandas] 데이터 타입(data type) - int64, float64, bool, datetime64, category, object 본문
데이터 분석 & 머신러닝
[판다스, pandas] 데이터 타입(data type) - int64, float64, bool, datetime64, category, object
컴공 K 2021. 7. 27. 00:02pandas의 데이터 타입(data type)
dtype | int64 | float64 | bool | datetime64 | category | object |
설명 | 정수형 | 실수형 | 부울형 | 날짜표현 | 카테고리 | 문자열 or 복합형 |
* Category형 타입?
카테고리형(Categorical) 데이터는 데이터프레임의 칼럼에서 특정한 형태의 데이터가 반복되는 경우 사용한다. 예를 들어 성별(남성, 여성), 나이(10대, 20대, ...)와 같이 특정 구간의 데이터가 반복되는 경우를 말한다.
카테고리형 데이터를 이용하면 반복된 데이터를 코드화하여 데이터의 사이즈를 줄여서 메모리 사용량이 줄어 들고 데이터 처리 속도가 빨라진다.
데이터프레임의 각 컬럼의 타입 출력
데이터 프레임의 각 컬럼의 타입을 출력하려면 dtypes를 통해 확인할 수 있다.
df.dtypes #각 컬럼의 타입 출력
728x90
반응형
'데이터 분석 & 머신러닝' 카테고리의 다른 글
[판다스, pandas] 데이터 프레임의 특정 컬럼(column) 접근, 여러 컬럼에 접근 (0) | 2021.07.28 |
---|---|
[판다스, pandas] 데이터프레임의 값(df.values), 열(컬럼) 이름(df.columns), 리스트로 만들기(tolist()) (0) | 2021.07.28 |
[판다스, pandas] 데이터 프레임(dataframe) 출력 (0) | 2021.07.27 |
[판다스, pandas] 여러 개의 컬럼 합치기 (0) | 2021.05.30 |
[파이썬, python] matplotlib - 산점도(scatter), 버블(bubble) (0) | 2021.03.21 |
Comments