특정 조건을 만족시키는 데이터
df의 A가 0.5보다 큰 값을 출력시킬때
df.A>0.5
true와 false를 반환하므로 데이터로 출력시키려면
df[df.A>0.5] #df.A가 True인 것만 출력
데이터 전체가 0.5보다 큰것 출력
df>0.5
df[df>0.5]
데이터 프레임 복사
df2=df.copy()
df2에 새로운 데이터 추가. 기존 컬럼에는 E가 없었으므로 새로운 series가 생긴다. 단 추가할 떄 행의 개수와 같아야 된다. 다를시 오류
df2["E"]=[1,2,3,4,5]
df2["E"]=[1,2,3,4] #행의 개수가 5개인데 4개를 입력해서 오류
.
데이터 프레임에 원하는 데이터가 존재하는지 유무 판단
df2["E"].isin(["1","2"])
E컬럼에서 1과 2가 존재하는 행만 가져오기
df2[df2["E"].isin(["1","2"])]
데이터 프레임에서 간단한 통계형태로 데이터 확인
apply 함수사용, numpy와 조합하여 사용
df2.apply(np.cumsum) #내림차순으로 값을 더해간다.
df2.apply(np.mean) #각 시리즈의 평균값을 구한다.
보통은 numpy모듈을 사용하지 않고, 직접 람다함수를 만들어서 사용한다고 한다.
df2.apply(lambda x: x.max()-x.min()) #각 시리즈별 최댓값과 최솟값의 차. x에는 시리즈가 들어간다.
'ICT COG Academy > AI 기본' 카테고리의 다른 글
ICT COG Academy 5일차(1) (0) | 2021.03.06 |
---|---|
ICT COG Academy 4일차(2) (0) | 2021.03.05 |
ICT COG Academy 4일차(1) (0) | 2021.03.01 |
ICT COG Academy 3일차 (0) | 2021.03.01 |
ICT COG Academy 2일차(2) (0) | 2021.02.23 |