빅데이터/데이터 전처리

#2. 데이터 프레임 심화

태 랑 2021. 10. 18. 23:56
반응형

지난 시간에는 데이터 프레임을 조금 다뤄 보았습니다.

오늘은 데이터 프레임에 대해 더 알아 봅시다.

 

이렇게 예시 프레임을 하나 만들어 줍니다.

 

a, b, c 칼럼이 있는게 보이시죠?

여기서 저희는 d 칼럼을 하나 더 만들어 봅시다.

d 칼럼에는 2,3,2,3,2 의 수치가 있어야 합니다.

 

간단하게 해결 됩니다.

 

추가 사항으로

e 칼럼을 만들때 df['e'] = 0 만 작성해 봅시다.

 

오류가 날 것만 같았던 코드가 예상을 빗나갔습니다.

잘 작동 하는 모습을 볼 수 있습니다.

 

이 의미 없는 e 칼럼을 바로 삭제해봅시다.

 

 

여기 까지 하셨다면

a,b,c 칼럼에 각 1,2,3 숫자를 추가해봅시다

 

핵심은 ignore_index 입니다. 이게 추가 되지 않으면 append 사용에 제약이 생깁니다.

 

----

apply와 map으로 데이터 변환을 한번 해 봅시다.

 

프레임을 하나 만들어 주시고

 

적용 방법은

df['c'] = df['a'].apply(function):

 

map을 사용해볼까요?

df['e'] = df['a'].map(a)

 

 

이번에는 map과 apply가 핵심이었습니다.

 

반응형