전체 글
- pandas- categories / 판다스 - 카테고리스 2023.03.02
- pandas 2023.02.27
- numpy-슬라이싱 2023.02.23
pandas- categories / 판다스 - 카테고리스
pandas
pandas _ python
- Series Class는 1차원 ? 이라고 말함.
인덱스 ( index ) + 값 ( Value)
- data frame class : 2차원?
테이블 (행과 열) 형태로 보기 쉬움.
※ numpy 는 계산에 특화되어 있다면 pandas는 보는 것에? 특화되어 있다고 들음.
import pandas as pd
알리야스는 pd 주로 사용한다.
pop = pd.Series([ 100000,200000,300000,400000])
0 100000
1 200000
3 300000
4 400000
이렇게 지정할 수 있다.
키 : 밸류 값과 같은 개념? 으로 인덱스 번호 대신 키 값을 저장할 수 있다. *지정
pop = pd.Series([100000,200000,300000,400000],
index = ['십만','이십만','삼십만','사십만'])
십만 100000
이십만 200000
삼십만 300000
사십만 400000
이런식으로 나옴.
보통의 데이터와 다르게 pandas는 데이터를 보기 쉽게 컬럼명?을 지정 할 수 있다.
pop.index.name='숫자명'
이렇게 코드를 치면
숫자명
십만 100000
이십만 200000
삼십만 300000
사십만 400000
연산도 가능하다.
pop / 100000
숫자명
십만 1
이십만 2
삼십만 3
사십만 4
이렇게 나옴.
인덱싱도 가능함.
pop[3]
400000
나올거임.
이유는 저장을 안해서 그런다고 생각하면 됨.
pop['십만']
하면 100000 이 나옴.
인덱싱은
pop['십만':삼십만]
하면 인덱싱 번호와는 다르게 키 값은 포함되어서 나옴.
포함하기 때문에 삼십만 , 300000 까지 나옴
'파이썬 노트정리 > pandas' 카테고리의 다른 글
pandas- categories / 판다스 - 카테고리스 (0) | 2023.03.02 |
---|
numpy-슬라이싱
numpy.arange(1,51).reshape(5, 10)
위 코드를 작성하면 아래처럼 결과가 나온다.
array([[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
[11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
[21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
[31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
[41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])
reshape는 세로 5, 가로 10이 나온다.
(파이썬에서 .reshape 는 키워드? 테이블의 모양을 만들수 있다. (.) 쩜. 있어야한다.
.reshape(행,열 ).reshape(행,열) <- 이런식으로 여러번 쓸 수 있다. 의미는 없고. 마지막으로 지정한 값으로 나온다.
행열 이라고 하는데, 행열은 가로 세로를 뜻하면
가로가 5줄 세로가 10줄이라고 생각할 수 있는데.
행으로 가는것이 5개라고 생각하면 헷갈림에서 벗어날 수 있다.
한 번 잘못 헷갈리는 순간 빠져나오기 힘든 사고 방식이 생기니.
감각적으로 외우는 것이 좋을거같다.
위에 2차원 배열(테이블같이 생긴거)을 변수명 [arr]으로 지정하주고.
23번과 38번을 뽑으려면
[ [행, 행] , [열, 열] ]
위의 공식을 이용하면 된다고 한다.
※ (: 클론) > 클론은 시작값 : 끝값이니 쓰지않고.
( , 쉼표)를 사용한다. 왜? > 한 개만 뽑으니까.
arr [ [2,3] , [2,7] ]
이런식으로 하면
23, 38을 뽑을 수 있다.