이번 포스팅에서는 본격적으로 Pandas 학습한 내용을 나중에 복습하기 위한 목적에서 간단하게 정리해보려고 한다.
Index 설정하고 재설정하기
- 판다스는 csv파일을 읽거나 데이터를 DataFrame의 형태로 저장하는데 사용된다. (numeric index는 기본적으로 설정된다)
1 | import pandas as pd |
- 특정 column을 index column으로 할당
1 | bank_df.set_index('First Name', inplace = True) # inplace = True로 원본 데이터 업데이트 |
- 다시 numeric index를 index값으로 되돌릴때에는
reset_index
메소드를 사용한다.
1 | bank_df.reset_index(inplace = True) |
- 열을 판다스 데이터 프레임의 인덱스로 사용하고 싶을 때
1 | bank_df = pd.read_csv('bank_client_information.csv', index_col = 'First Name') |
- (CHALLENGE #4) 판다스 데이터 프레임 인덱스 설정하고 재 설정하기
1 | # 방법1 |
데이터 프레임에서 열을 선택하기
1 | bank_df = pd.read_csv('bank_client_information.csv') |
- (CHALLENGE #5) 순 자산(Net Worth), 거래 햇수(Years with Bank), 그리고 우편번호(Postal Code)에 해당하는 열을 데이터프레임에서 선택하시오.
1 | my_selected_columns = ['Net Worth', 'Years with Bank', 'Postal Code'] |
DataFrame에서 Columns을 추가하고 지우기
1 | bank_df = pd.read_csv('bank_client_information.csv') |
특정 칼럼 추출하기
1 | Years_with_bank = bank_df.pop('Years with Bank') |
- (CHALLENGE #6) 고객의 대출 여부를 알려주는 열을 추가하시오. 그리고 대출금을 알려주는 열을 기존의 데이터프레임에 추가하시오.
1 | bank_df = pd.read_csv('bank_client_information.csv') |
DataFrame에서 LABEL-BASED로 요소선택하기
1 | import pandas as pd |
- (CHALLENGE #7) “first name” column을 index로 설정해서 csv 파일을 로드하고, 데이터프레임으로부터 랜덤으로 2개의 행 데이터를 선택한다.
1 | import pandas as pd |
DataFrame에서 INTEGER INDEX-BASED 요소 선택
1 | bank_df = pd.read_csv('bank_customer_information.csv') |
- (CHALLENGE #8) 두 가지 다른 방법을 사용해서 마지막 두 행 데이터를 가져와서 출력하시오.
1 | bank_df.iloc[-2:] # 끝에서 2번째부터 끝까지 출력 |
브로드캐스팅 연산과 새로운 데이터 프레임값을 설정하는 방법
1 | bank_df = pd.read_csv('bank_client_information.csv') |