ICT COG Academy 5일차(1)

ndarray: 같은 종류의 데이터만 담을수 있는 배열

 

df

데이터 프레임의 값을 ndarray로 표현

df.values

출력

이때 열이 하나의 요소가 아니라 행이 하나의 요소로 되어있다.

 

데이터의 개수(count), 평균(mean), 최솟값(min), 최댓값(max), 4분위 값(25%,50%,75%), 표준편차(std) 를 출력할때 describe 메소드를 사용한다.

데이터 프레임 정렬

 기준을 정해놓고, 기준에 맞게 오름/내림 차순으로 정렬하는것

df.sort_values(by="B", ascending=True) #by는 정렬 할 컬럼 ascending이 True일시 내림차순 False면 오름차순

pandas가 dictionary와 굉장히 비슷하다. 컬럼의 이름이 키값의 역할을 한다.

df["A"] #열선택
df.A #같다

여러개를 선택 할때는 배열을 이용한다.

names=["A","C"]
df[names]
df["A","C"] #이 코드는 오류
df[["A","C"]] # 이 코드는 정상적으로 실행된다

슬라이스 기법으로 출력 데이터 범위 지정

df[:3]
df["20210302":"20210304"] #인덱스 데이터로도 슬라이싱이 가능하다.

특정 위치의 데이터 확인

df.loc[dates[0]]
df.loc["20210302"] #위와 같은 출력. dates는 index의 date값을 담아논 배열.

df.loc["20210302":"20210304",["A","C"]] #앞부분은 행, 뒷부분은 컬럼

df.loc["20210302":"20210304","A":"C"]

df.loc["20210302","A"] 

 0.6881447375317375

 

loc과 다르게 iloc은 행과 열의 인덱스를 사용한다.

df.iloc[3] #index[3] 출력

df.iloc[2:5,0:2] #행 2~4까지 출력, 컬럼 0~1까지 출력

 

'ICT COG Academy > AI 기본' 카테고리의 다른 글

ICT COG Academy 5일차(2)  (0) 2021.03.07
ICT COG Academy 4일차(2)  (0) 2021.03.05
ICT COG Academy 4일차(1)  (0) 2021.03.01
ICT COG Academy 3일차  (0) 2021.03.01
ICT COG Academy 2일차(2)  (0) 2021.02.23