ndarray: 같은 종류의 데이터만 담을수 있는 배열
데이터 프레임의 값을 ndarray로 표현
df.values
출력
이때 열이 하나의 요소가 아니라 행이 하나의 요소로 되어있다.
데이터의 개수(count), 평균(mean), 최솟값(min), 최댓값(max), 4분위 값(25%,50%,75%), 표준편차(std) 를 출력할때 describe 메소드를 사용한다.
데이터 프레임 정렬
기준을 정해놓고, 기준에 맞게 오름/내림 차순으로 정렬하는것
df.sort_values(by="B", ascending=True) #by는 정렬 할 컬럼 ascending이 True일시 내림차순 False면 오름차순
pandas가 dictionary와 굉장히 비슷하다. 컬럼의 이름이 키값의 역할을 한다.
df["A"] #열선택
df.A #같다
여러개를 선택 할때는 배열을 이용한다.
names=["A","C"]
df[names]
df["A","C"] #이 코드는 오류
df[["A","C"]] # 이 코드는 정상적으로 실행된다
슬라이스 기법으로 출력 데이터 범위 지정
df[:3]
df["20210302":"20210304"] #인덱스 데이터로도 슬라이싱이 가능하다.
특정 위치의 데이터 확인
df.loc[dates[0]]
df.loc["20210302"] #위와 같은 출력. dates는 index의 date값을 담아논 배열.
df.loc["20210302":"20210304",["A","C"]] #앞부분은 행, 뒷부분은 컬럼
df.loc["20210302":"20210304","A":"C"]
df.loc["20210302","A"]
0.6881447375317375
loc과 다르게 iloc은 행과 열의 인덱스를 사용한다.
df.iloc[3] #index[3] 출력
df.iloc[2:5,0:2] #행 2~4까지 출력, 컬럼 0~1까지 출력
'ICT COG Academy > AI 기본' 카테고리의 다른 글
ICT COG Academy 5일차(2) (0) | 2021.03.07 |
---|---|
ICT COG Academy 4일차(2) (0) | 2021.03.05 |
ICT COG Academy 4일차(1) (0) | 2021.03.01 |
ICT COG Academy 3일차 (0) | 2021.03.01 |
ICT COG Academy 2일차(2) (0) | 2021.02.23 |