2019-03-10

내가 쓸 pandas method 모음집

0. 자주 쓰였던 명령어를 정리하는 차원에서 기록해보았다.

개인적인 취향으로 정리했기 때문에 '이게 통상적으로 많이 쓰이는가'라는

추리는 하지 마시길..




  • df.head()
처음 5행을 출력한다. df.head(1000)은 1000줄을 출력한다.

  • df.tail()
마지막 5행을 출력한다.

  • df.name
'name'이라는 이름의 column을 Series 객체로 반환한다. Column 이름이 'moldb_smiles'라면 df.moldb_smiles라고 쓰면 된다.

  • df[:2]
파이썬에서 인덱싱, 슬라이싱하는 것처럼 사용하면 된다. 특정 행을 가져온다.

  • df[(df.moldb_average_mass <= 500) & (df.moldb_average_mass > 100)]
DataFrame의 moldb_average_mass의 값이 100 초과 500 이하인 값을 가져온다.
요렇게 하면 안된다 :
df[100 < df.moldb_average_mass <= 500]
df[[df.moldb_average_mass <= 500] & [df.moldb_average_mass > 100]]
df[(df.moldb_average_mass <= 500) and (df.moldb_average_mass > 100)]



df.iloc[:, 0:2]
첫 번째 인자는 row의 범위를 지정하고, 두 번째 인자는 column의 범위를 지정해 해당 범위만큼 가져온다.
예시에서 [:, 0:2]의 범위는 'row는 0부터 끝까지, column은 0번째부터 2번째 미만까지'를 나타낸다.





댓글 없음:

댓글 쓰기