ICT COG Academy 5일차(2)

df

특정 조건을 만족시키는 데이터 

df의 A가 0.5보다 큰 값을 출력시킬때

df.A>0.5

true와 false를 반환하므로 데이터로 출력시키려면

df[df.A>0.5] #df.A가 True인 것만 출력

데이터 전체가 0.5보다 큰것 출력

df>0.5

df[df>0.5]

데이터 프레임 복사

df2=df.copy()

df2에 새로운 데이터 추가. 기존 컬럼에는 E가 없었으므로 새로운 series가 생긴다. 단 추가할 떄 행의 개수와 같아야 된다. 다를시 오류

df2["E"]=[1,2,3,4,5]
df2["E"]=[1,2,3,4] #행의 개수가 5개인데 4개를 입력해서 오류

.

데이터 프레임에 원하는 데이터가 존재하는지 유무 판단

df2["E"].isin(["1","2"])

E컬럼에서 1과 2가 존재하는 행만 가져오기

df2[df2["E"].isin(["1","2"])]

데이터 프레임에서 간단한 통계형태로 데이터 확인

   apply 함수사용, numpy와 조합하여 사용

df2.apply(np.cumsum) #내림차순으로 값을 더해간다.

df2.apply(np.mean) #각 시리즈의 평균값을 구한다.

보통은 numpy모듈을 사용하지 않고, 직접 람다함수를 만들어서 사용한다고 한다.

df2.apply(lambda x: x.max()-x.min()) #각 시리즈별 최댓값과 최솟값의 차. x에는 시리즈가 들어간다.

 

'ICT COG Academy > AI 기본' 카테고리의 다른 글

ICT COG Academy 5일차(1)  (0) 2021.03.06
ICT COG Academy 4일차(2)  (0) 2021.03.05
ICT COG Academy 4일차(1)  (0) 2021.03.01
ICT COG Academy 3일차  (0) 2021.03.01
ICT COG Academy 2일차(2)  (0) 2021.02.23