카데고리컬 데이터라고 말한다.

 

 

 

 

 

생성된 카테고리의 정보를 알려준다.

 데이터의 카테고리화,

각각의 결과.

 

- 데이터의 길이 (개수 Length) 사용.

- 범주의 개수

 

 

변수명.categories 

 

 

카테고리 별 카운트는. 

 

.value_conts()

'파이썬 노트정리 > pandas' 카테고리의 다른 글

pandas  (0) 2023.02.27

pandas _ python

 

- Series Class는 1차원 ? 이라고 말함.

인덱스 ( index ) + 값 ( Value)

 

 

- data frame class : 2차원? 

 

테이블 (행과 열) 형태로 보기 쉬움.

 

※ numpy 는 계산에 특화되어 있다면 pandas는  보는 것에? 특화되어 있다고 들음.

 

import pandas as pd

알리야스는 pd  주로 사용한다.

 

pop =  pd.Series([ 100000,200000,300000,400000])

0     100000

1     200000

3     300000

4     400000

 

이렇게 지정할 수 있다.

키 : 밸류 값과 같은 개념? 으로 인덱스 번호 대신 키 값을 저장할 수 있다.  *지정

pop = pd.Series([100000,200000,300000,400000],
         index = ['십만','이십만','삼십만','사십만'])

 

십만        100000

이십만     200000

삼십만     300000

사십만     400000

 

이런식으로 나옴.

 

 

보통의 데이터와 다르게  pandas는 데이터를 보기 쉽게 컬럼명?을 지정 할 수 있다.

 

pop.index.name='숫자명'

이렇게 코드를 치면

 

숫자명

십만        100000

이십만     200000

삼십만     300000

사십만     400000

 

연산도 가능하다.

pop / 100000

숫자명

십만        1

이십만     2

삼십만     3

사십만     4

 

이렇게 나옴.

 

인덱싱도 가능함.

pop[3]

400000

 

나올거임.

 

이유는 저장을 안해서 그런다고 생각하면 됨.

pop['십만']

하면 100000 이 나옴.

 

인덱싱은

 

pop['십만':삼십만]

하면 인덱싱 번호와는 다르게 키 값은 포함되어서 나옴.

포함하기 때문에  삼십만 , 300000 까지 나옴

 

'파이썬 노트정리 > pandas' 카테고리의 다른 글

pandas- categories / 판다스 - 카테고리스  (0) 2023.03.02

+ Recent posts