class pandas.Series
pandas의 기본 데이터 구조이다. 일차원 ndarry형태로 axis label을 갖는다. 일반 배열의 경우 0부터 시작하는 인덱스만 사용할 수 있지만 series는 다양한 방식으로 series 데이터의 값을 선택할 수 있다.
함수 구문
pandas.series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
파라메터
1. data (array-like, iterable, dict or scalar value)
: series에 사용할 데이터. 사용가능한 형태의 데이터는 array-like, iterable, dict or scalar value 형태를 사용할 수 있다.
2. index (array-like or index(id))
: index를 설정하지 않으면 기본적으로 rangeindex(0,1,2,...n)의 값이 설정된다. 만약 "data"파라메터가 [dict] 형태인 경우에는 [dict] 데이터의 key를 사용한다.
3. dtype (str, numpy.dtype or extensionDtype, optional)
: series 데이터를 출력할 데이터 type을 의미한다. 정의하지 않은 경우 입력된 데이터를 통해서 정해진다.
4. name (str, optional)
: series 데이터의 이름을 설정한다.
5. copy (bool, default False)
: 입력 데이터를 복사한다.
사용 예제
pandas series 데이터를 생성해 보겠습니다.
import pandas as pd
Serise를 생성하기 위해 데이터 [1,2,3,4,5,6,7]을 파라메터로 전달하여 생성합니다.
s = pd.Series([1,2,3,4,5,6,7])
s
0 1
1 2
2 3
3 4
4 5
5 6
6 7
dtype: int64
출력된 series 데이터를 보면 입력하지 않은 index가 자동으로 설정된 것을 확인할 수 있습니다. 인덱스는 0부터 시작되는 값으로 생성되었습니다.
data = [1,2,3,4,5,6,7]
data
[1, 2, 3, 4, 5, 6, 7]
리스트를 출력하는 경우 index가 없지만 series를 생성하면서 인덱스가 자동으로 생성되엇습니다.
s = pd.Series()
s
Series([], dtype: float64)
series의 기본값은 None으로 설정되어 있기 때문에 입력하지 않는 경우 empty series가 생성됩니다. 테스트한 python 3.7에서는 empty series에 대한 warning을 출력합니다.
현재는 empty series가 float64 형식이지만 나중에는 object형식으로 변경된다고 합니다.
※ pandas doc : pandas.pydata.org/docs/
'Programming > Pandas' 카테고리의 다른 글
[Pandas] 날짜범위 index 만들기 (0) | 2021.12.26 |
---|---|
[Pandas] 데이터 프레임으로 파일로딩 (0) | 2021.12.26 |
[Pandas] DataFrame 만들기 및 index 변경하기 (0) | 2021.12.26 |
[Pandas] 데이터 프레임에 칼럼 추가 하기 (0) | 2021.01.24 |
[Pandas] DataFrame 칼럼, 로우 가져오기, 변경하기 (0) | 2021.01.24 |