4-3. pandas_datatype

데이터사이언스

4-3. pandas_datatype

유니진 2023. 1. 24. 03:08

1. dtypes

- 다양한 종류의 데이터를 담을 수 있는 pandas

- dtypes 를 사용해서 각 column 이 어떤 데이터 타입을 보관하는지 확인 가능

- 예시

import pandas as pd

two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]]

my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'], index=['a', 'b', 'c', 'd'])

print(my_df.dtypes)

name             object
english_score     int64
math_score        int64
dtype: object

[코드설명]

- column 'name' 은 'object' 자료형을 보관

- column 'english_score' 와 'math_score' 는 'int 64' 자료형을 보관

- 또한, 한 column 내에서 모든 값이 동일한 데이터 타입 (자료형) 이다.

2. pandas dytpe

dtype	설명
int 64	정수
float 64	실수
object	텍스트
bool	불린 (참과 거짓)
datetime 64	날짜와 시간
category	카테고리

pandas 로 데이터 읽어들이기

1. csv

- Comma - Separated - Values

- 값들이 쉼표로 나뉘어져 있다.

- 데이터 읽기 과정

ㄱ. 파일을 불러온다. (예를 들면 iphone.csv - 아이폰에 대한 정보가 담긴 파일 - from 캐글)

ㄴ.

- 값들이 쉼표 ( ,) 로 나누어져 있다.

- header : 첫 줄에 나와있는 column 이름들

- 레코드 : 두 번째 줄 ~

ㄷ. 이렇게 저장된 데이터 파일을 불러온다.

import pandas as pd
pd.read_csv

ㄹ. 다음과정

import pandas as pd
pd.read_csv ('data/iphone.csv')
iphone_df = pd.read_csv('data/iphone.csv')
iphone_df

- 출력

[코드설명]

** 순서대로

- pd.read_csv (파라미터) : 파라미터로 파일 경로를 넣어준다.

- 예를 들면 'data/iphone.csv'

: data 폴더 안에 있는 iphone.csv 이라는 이름을 가진 파일이 있다는 의미

- 파일 경로를 파라미터로 가지는 함수로 파일을 읽은 메모리를 iphone_df 변수에 저장한다.

ㅁ. 만약에 위와 다르게 'header' index 가 없을 경우

- 엉뚱한 값들이 대신 header 줄로 들어가게 된다.

- 솔루션 : parameter 자리에 None

import pandas as pd
iphone_df = pd.read_csv ('data/iphone.csv', head = None)
iphone_df

- 출력

'데이터사이언스' 카테고리의 다른 글

5-1. DataFrameIndexing (0)	2023.01.24
4+. 예제 (0)	2023.01.24
4-2. pandas_dataframe (0)	2023.01.24
4. pandas (2)	2023.01.24
3+. 예제 (0)	2023.01.23

현재글4-3. pandas_datatype

hello, it’s me

공대생의 이모저모

jupyter #python #주피터 #파이썬 #단축기 #cell #cell사용법, 파이썬 #python #palindrome #팔린드롬 #예제, 파이썬 #python #return #parameter #argument #code #사각형넓이구하기 #파이썬예제 #함수형태 #파이썬코드 #리턴값 #반환값, jupyter #numpy #numpay.array #넘파이 #이차원배열, pandas #판다스 #dataframe #datatype #dtype #데이터타입 #자료형, dataframe #indexing #데이터프레임 #인덱싱 #예제, pandas #dataframe #판다스 #데이터프레임 #import_pandas_as_pd, numpy #numpy기본연산 #연산 #numpyboolen연산 #boolen, python #numpy #index #indexing #slicing, pandas #판다스 #pd.read_csv #파라미터 #판다스예제, pd.read_csv #csv #header, numpy #최솟값 #최댓값 #중간값 #표준편차 #분산, python #module #libarary #plt #np #import #as, 데이터사이언스 #데이터분석 #빅데이터 #데이터사이언스정의 #data #datascience #python #R언어, import_numpy_as_np, 파이썬 #python #파이썬예제 #numpy예제, numpy #python #numpyarray #pythonlist #비교, python #datascience #numpy #numpyarray #array #넘피 #넘피어레이 #데이터사이언스, jupyter #jupyternotebook #cell #cell사용법, python #파이썬 #datascience #데이터사이언스 #데이터 #numpy #row #column #행 #열 #pandas #pandaslibrary #판다스 #이차원 #dataframe #데이터프레임 #df,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

hello, it’s me