카데고리컬 데이터라고 말한다.

 

 

 

 

 

생성된 카테고리의 정보를 알려준다.

 데이터의 카테고리화,

각각의 결과.

 

- 데이터의 길이 (개수 Length) 사용.

- 범주의 개수

 

 

변수명.categories 

 

 

카테고리 별 카운트는. 

 

.value_conts()

'파이썬 노트정리 > pandas' 카테고리의 다른 글

pandas  (0) 2023.02.27

pandas _ python

 

- Series Class는 1차원 ? 이라고 말함.

인덱스 ( index ) + 값 ( Value)

 

 

- data frame class : 2차원? 

 

테이블 (행과 열) 형태로 보기 쉬움.

 

※ numpy 는 계산에 특화되어 있다면 pandas는  보는 것에? 특화되어 있다고 들음.

 

import pandas as pd

알리야스는 pd  주로 사용한다.

 

pop =  pd.Series([ 100000,200000,300000,400000])

0     100000

1     200000

3     300000

4     400000

 

이렇게 지정할 수 있다.

키 : 밸류 값과 같은 개념? 으로 인덱스 번호 대신 키 값을 저장할 수 있다.  *지정

pop = pd.Series([100000,200000,300000,400000],
         index = ['십만','이십만','삼십만','사십만'])

 

십만        100000

이십만     200000

삼십만     300000

사십만     400000

 

이런식으로 나옴.

 

 

보통의 데이터와 다르게  pandas는 데이터를 보기 쉽게 컬럼명?을 지정 할 수 있다.

 

pop.index.name='숫자명'

이렇게 코드를 치면

 

숫자명

십만        100000

이십만     200000

삼십만     300000

사십만     400000

 

연산도 가능하다.

pop / 100000

숫자명

십만        1

이십만     2

삼십만     3

사십만     4

 

이렇게 나옴.

 

인덱싱도 가능함.

pop[3]

400000

 

나올거임.

 

이유는 저장을 안해서 그런다고 생각하면 됨.

pop['십만']

하면 100000 이 나옴.

 

인덱싱은

 

pop['십만':삼십만]

하면 인덱싱 번호와는 다르게 키 값은 포함되어서 나옴.

포함하기 때문에  삼십만 , 300000 까지 나옴

 

'파이썬 노트정리 > pandas' 카테고리의 다른 글

pandas- categories / 판다스 - 카테고리스  (0) 2023.03.02
numpy.arange(1,51).reshape(5, 10)

 

위 코드를 작성하면 아래처럼 결과가 나온다. 

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27, 28, 29, 30],
       [31, 32, 33, 34, 35, 36, 37, 38, 39, 40],
       [41, 42, 43, 44, 45, 46, 47, 48, 49, 50]])

 

reshape는  세로 5, 가로 10이 나온다.

(파이썬에서 .reshape 는 키워드? 테이블의 모양을 만들수 있다.   (.) 쩜. 있어야한다.

 .reshape(행,열 ).reshape(행,열)   <- 이런식으로 여러번 쓸 수 있다. 의미는 없고. 마지막으로 지정한 값으로 나온다.

 

행열 이라고 하는데, 행열은 가로 세로를 뜻하면 

가로가 5줄 세로가 10줄이라고 생각할 수 있는데. 

행으로 가는것이 5개라고 생각하면 헷갈림에서 벗어날 수 있다.

한 번 잘못 헷갈리는 순간 빠져나오기 힘든 사고 방식이 생기니.

감각적으로 외우는 것이 좋을거같다.

 

 

위에 2차원 배열(테이블같이 생긴거)을 변수명 [arr]으로 지정하주고.

23번과 38번을 뽑으려면

 

  [ [행, 행]  , [열, 열] ]

 

위의 공식을 이용하면 된다고 한다.

※  (: 클론)   > 클론은  시작값 : 끝값이니 쓰지않고.

( , 쉼표)를 사용한다. 왜? > 한 개만 뽑으니까.

 

arr [  [2,3]  ,  [2,7]  ]

 

 

이런식으로 하면 

 

23, 38을 뽑을 수 있다.

 

 

  • Boolean : True/False
  • True 값은 출력
  • Faslse 값은 출력하지 않음
    • 조건에 해당하는 (True)인 값들만 출력할 때 사용 > 필터링
    • 조건에 해당하는 값이 존재하는지 파악할 때 사용

 

 

 

sum : 합계

mean : 평균

abs : 절대값

 

등이 있다. 평균은 보통 average가 있는거같은데,

영어에서 숫자 같은 수학적의미의 평균은

 

mean으로 쓰여 파이썬에서도 mean을 쓰는것같다.

 

찾아보니 mean 말고도 median 메디안?이라고 중간값이 있다.

 

 

 

 

 

 

Tip.

테이블 회전하는법.

테이블명.T

 

 

 

 

 

 

 

- 파이썬 자료형 list 와 비슷함 ( 같다는 것은 아니고) 

- 빠르고 효율적인 산술연산을 함

- 반복문 없고 전체 데이터 배열 연산이 가능함.

 

1. numpy (넘파이)라고 읽는다.

라이브러리에서 import 한다. 

import numpy as np

보통 as( alis:알리야스) 라는 별칭을 이용해 np 라고  많이 쓰는 듯.

 

2. numpy.array

2. numpy는 N차원의 형태로 구성이 가능하다.

(index:인덱스)가 부여되어있다. 그 말은 순서가 있다는 말이기에 

인덱싱과 슬라이싱이 가능하다. 

( 숫자 시작 : 숫자 미만 ) 

 

list1 = [1,2,3,4,5]
list1

# 이렇게 나온듯 >> [1, 2, 3, 4, 5]

array1 = np.array(list1)
array1

#이렇게 나온듯 >> array([1, 2, 3, 4, 5])

array1+array1

#이렇게 나온듯 >> array([ 2,  4,  6,  8, 10])

배열과 배열이 더해진다.

자바에서 할 수 있었는지 모르겠다.

 

3. numpy.full

# numpy.full
# 풀 이런 것은.. 채우다? 라고 한다.


np_full = numpy.full((5,5), 3)
변수명 = 넘피. 풀 (2차원 배열 숫자) , 채울 숫자)

 

array([[3, 3, 3, 3, 3],
       [3, 3, 3, 3, 3],
       [3, 3, 3, 3, 3],
       [3, 3, 3, 3, 3],
       [3, 3, 3, 3, 3]])
 

4. numpy - shape (모양)

배열(테이블) 모양을 다시 설정할 수 있다.

대신 데이터의 갯수가 같아야 된다고 한다.

 

세로 4개, 가로 5개인 2차 배열 (테이블이라고해야하나?)

 

컬럼, 로우, 종, 횡 을 헷갈리지만..

 

 

[3, 3, 3, 3, 3],
[3, 3, 3, 3, 3],
[3, 3, 3, 3, 3],
[3, 3, 3, 3, 3],

 

 

 

자동판매기가 달러 받는다면
원화가 쌔지면 콜라는 싸지고 달러가 쌔지면 콜라가 비싸지는건가? 유로와 파운드.?

1. 테슬라는 소프트웨어를 적절한 마케팅으로 사용하고 있다고 생각합니다. 그로 인해서 지금 사도 충전, 전비, 제로백 개선을 할 수 있다는 인식되고 있음. 이건 해마다 페이스리프트나 기능 개선으로 차가 새로 나와서 이 기능을 추가한다는 개념보단 이미 기능을 넣고 그걸 개선시키는 것이 아닐까 추측.

2. 테슬라는 앞으로 무료 업데이트 기간이 정해지고 추가적인 프리미엄 유료 구독 서비스 개념을 도입 할 지에 대한 추측.

3. 지금 추세로는 전기차가 이미지가 좋기도하지만 이 그냥 전기차보다는 테슬라 자체를 더 선호하고 있다고 생각함 이유는 테슬라라는 브랜드 이미지가 큼.
어차피 전기차같은 경우 번호판 색깔이 다르고 초반 순발력도 거의 비슷. 하지만 앞서 말한 브랜드 이미지가 한 몫 한다는 뇌피셜.

4. 전기차는 특성상 연료비가 상대적으로 적게 들고 막말로 5년 탔을 때 아반떼 휘발유 비교시 전기차가 유지비에서 비슷해지거나 추월 할 가능성이 있음. 즉 단차가 심해도 3번에서 말한 테슬라 마크와 5년을 함께하는거와 미안하지만 아반떼와 5년을 함께 하는 거는 차이가 없지는 않을거라 생각.
따지고 보면 세금 혜택 (유류비 주차 통행료)에서 차 값의 배라고 생각.

5년 할부로보면 어쩌면 조삼모사가 아닐련지... 의문이 듬
이유는 자급제 폰으로 상대적으로 저렴한 통신료를 매달 내는 것과 통신사 할인을 받고 자급제 보다 비싼 통신료를 쓰는 것과 비슷.

5. 일론 머스크는 마케팅을 너무 잘함.

6. 최근에 테슬라 쉐어링으로 차를 더 가지고 싶게 만듦 그걸 고려했을 때 다른 차는 방치에 가깝지만 내 차는 유지비를 아껴주거나. 벌어준다는 인식이 강하게 듦

'잡담' 카테고리의 다른 글

2019 01월에 게시글...  (0) 2020.01.10
드디어 끝났습니다. 구형맥북 하이시에라 핸드오프, 에어드랍  (0) 2018.05.03
분열  (0) 2018.01.18
오랜만에 티스토리 로그인  (0) 2018.01.16
담양 오프닝 영상  (0) 2017.04.07

https://youtu.be/Ne8xDEI1kME

그동안 로그인도 안하고.. 1년이 지났다. 어쨋든 난 서버 용량과 트래픽을 아낀것같다. 뇌피셜로 정보를 작성하거나 하면 큰일난다. 라고 해야하나..

'잡담' 카테고리의 다른 글

테슬라에 대한 나의 뇌피셜  (0) 2020.08.14
드디어 끝났습니다. 구형맥북 하이시에라 핸드오프, 에어드랍  (0) 2018.05.03
분열  (0) 2018.01.18
오랜만에 티스토리 로그인  (0) 2018.01.16
담양 오프닝 영상  (0) 2017.04.07

+ Recent posts