Pandas Series

Pandas Series 기본 작업

pandas.Series

Series 구조는 다음과 같습니다：

pandas.Series(　data,　index,　dtype,　copy)

생성자의 매개변수는 다음과 같습니다-

data: 데이터는 ndarray, 리스트, 상수 등 다양한 형태를 취할 수 있습니다 index: 인덱스 값은 독립적이고 해시 가능해야하며, 데이터 길이와 같아야 합니다. 인덱스를 전달하지 않으면, 기본적으로 np.arange(n)입니다 dtype: 데이터 타입을 정의합니다. None이면 데이터 타입을 추론합니다 copy: 데이터를 복사합니다. 기본적으로 False입니다

Series를 생성하는 데 다양한 입력을 사용할 수 있습니다. 예를 들어

배열 딕셔너리 스칼라 값 또는 상수

공간 Series 생성

예제

　>>>　#　pandas 의존성 패키지를 임포트하고 별명을 지정
　>>>　import　pandas　as　pd
　>>>　s　=　pd.Series()
　>>>　print(s)
　Series([],　dtype:　float64)

ndarray로 Series 생성

데이터가 ndarray라면, 전달된 인덱스는 같은 길이를 가져야 합니다. 인덱스를 전달하지 않으면, 기본적으로 인덱스는 range(n)로 설정됩니다. n은 배열 길이이며, 즉 [0,1,2,3…。범위（len(array)）-1]。

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　import　numpy　as　np
　data　=　np.array(['a','b','c','d'])
　s　=　pd.Series(data)
　print(s)

실행 결과:

　0　a
　1　b
　2　c
　3　d
　dtype:　object

인덱스를 전달하지 않았기 때문에, 기본적으로 0부터 len(data)까지의 범위를 할당합니다-1，즉 0부터3。

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　import　numpy　as　np
　data　=　np.array(['a','b','c','d'])
　s　=　pd.Series(data,index=[100,101,102,103]
　print(s)

실행 결과:

　100　a
　101　b
　102　c
　103　d
　dtype:　object

우리는 여기서 인덱스 값을 전달했습니다. 이제, 출력에서 사용자 정의 인덱스 값을 볼 수 있습니다.

딕셔너리로 Series 생성

딕셔너리는 입력으로 전달될 수 있습니다. 인덱스가 지정되지 않으면, 딕셔너리 키는 정렬 순서로 인덱스를 구성합니다. 인덱스가 지정되면, 인덱스 태그에 해당하는 데이터 값이 추출됩니다.

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　import　numpy　as　np
　data　=　{'a'　:　0.,　'b'　:　1.,　'c'　:　2.}
　s　=　pd.Series(data)
　print(s)

실행 결과:

　a　0.0
　b　1.0
　c　2.0
　dtype:　float64

딕셔너리 키는 인덱스를 구성하는 데 사용됩니다.

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　import　numpy　as　np
　data　=　{

실행 결과:

　b　1.0
　c　2.0
　d　NaN
　a　0.0
　dtype:　float64

인덱스 순서는 유지되며, 누락된 요소는 NaN（비수학적）으로 채워집니다.

단위 값으로 Series 생성

데이터가 단위 값이면, 인덱스를 제공해야 합니다. 이 값은 인덱스 길이와 일치하도록 반복됩니다

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　import　numpy　as　np
　s　=　pd.Series(5,　index=[0,　1,　2,　3]
　print(s)

실행 결과:

　
　0　5
　1　5
　2　5
　3　5
　dtype: int64

위치 Series를 가진 데이터 접근

Series 내의 데이터를 ndarray와 같이 접근할 수 있습니다.
첫 번째 요소를 검색합니다. 잘 알려진 것처럼, 배열의 계산은 0에서 시작하므로 첫 번째 요소는 0번 위치에 저장됩니다. 이와 같이 계속됩니다.

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
　# 첫 번째 데이터 검색
　print s[0]

실행 결과:

Series의 앞 세 개 요소를 검색합니다. 그 앞에 추가하면, 그 인덱스부터 모든 항목이 추출됩니다. 두 인덱스(두 인덱스 사이에 있는:)을 사용하면, 두 인덱스 사이의 항목(종료 인덱스를 포함하지 않음)

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
　# 앞으로3개 요소
　print s[:3]

실행 결과:

　a　1
　b　2
　c　3
　dtype: int64

마지막 세 개 요소 검색

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
　# 마지막 세 개 요소 검색
　print s[-3:]

실행 결과:

　c　3
　d　4
　e　5
　dtype: int64

태그(인덱스)를 사용하여 데이터 검색

Series는 고정 크기의 딕셔너리처럼, 인덱스 태그를 통해 값을 가져오고 설정할 수 있습니다.
인덱스 태그 값으로 단일 요소 검색

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　s = pd.Series([1,2,3,4,5], index = [

실행 결과:

인덱스 태그 값 목록을 사용하여 여러 요소를 검색합니다.

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　s = pd.Series([1,2,3,4,5], index = [

실행 결과:

　
　a　1
　c　3
　d　4
　dtype: int64

레이블이 포함되지 않으면 예외가 발생합니다.

예제

　# 파일 이름 : pandas.py
　# 저자 by : ko.oldtoolbag.com　
　# pandas 의존 패키지 가져오기 및 별명 지정
　import pandas as pd
　s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
　# 여러 요소 검색
　print(s['f'])

실행 결과:

　　　...
　KeyError: ''f''

Pandas SQL 작업 Pandas 데이터 구조

Pandas 교재

Pandas Series

pandas.Series

공간 Series 생성

ndarray로 Series 생성

딕셔너리로 Series 생성

단위 값으로 Series 생성

위치 Series를 가진 데이터 접근

태그(인덱스)를 사용하여 데이터 검색