(Python : Basic) pandas

Posted by : at

Category : Python


numpy? pandas? 무슨 차이지?

  • numpy : 배열의 index가 숫자임
  • pandas : 배열의 index를 지정가능
    • 그럼 dictionary아닌가? -> 역시 연산속도 때문에 pandas사용
import pandas as pd

a = pd.Series([1, 2, 3])
# 이렇게 하면 numpy와 동일하게 숫자로 indexing

a = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
# 이런식의 선언이 가능

a = pd.Series({'a': 1, 'b': 2, 'c': 3})
# 이것도 가능

tips

a.head(2)
# 상위 2개만 출력
a = pd.Series([1, 2, 3, np.nan])

len(a) 
# 4

a.count() 
# 3 : nan을 제외한 숫자 리턴
a.unique()    
# unique한 값의 갯수 리턴
s3 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']) 
s4 = pd.Series([4, 3, 2, 1], index=['d', 'c', 'b', 'a'])

print(s3 + s4)
a    2
b    4
c    6
d    8
dtype: int64

About Taehyung Kim

안녕하세요? 8년차 현업 C++ 개발자 김태형이라고 합니다. 😁 C/C++을 사랑하며 다양한 사람과의 협업을 즐깁니다. ☕ 꾸준한 자기개발을 미덕이라 생각하며 노력중이며, 제가 얻은 지식을 홈페이지에 정리 중입니다. 좀 더 상세한 제 이력서 혹은 Private 프로젝트 접근 권한을 원하신다면 메일주세요. 😎

Star
Useful Links