English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Pandas Series

Pandas Series 기본 작업

pandas.Series

Series 구조는 다음과 같습니다:

pandas.Series( data, index, dtype, copy)

생성자의 매개변수는 다음과 같습니다-

data: 데이터는 ndarray, 리스트, 상수 등 다양한 형태를 취할 수 있습니다 index: 인덱스 값은 독립적이고 해시 가능해야하며, 데이터 길이와 같아야 합니다. 인덱스를 전달하지 않으면, 기본적으로 np.arange(n)입니다 dtype: 데이터 타입을 정의합니다. None이면 데이터 타입을 추론합니다 copy: 데이터를 복사합니다. 기본적으로 False입니다

Series를 생성하는 데 다양한 입력을 사용할 수 있습니다. 예를 들어

배열 딕셔너리 스칼라 값 또는 상수

공간 Series 생성

 >>> # pandas 의존성 패키지를 임포트하고 별명을 지정
 >>> import pandas as pd
 >>> s = pd.Series()
 >>> print(s)
 Series([], dtype: float64)

ndarray로 Series 생성

데이터가 ndarray라면, 전달된 인덱스는 같은 길이를 가져야 합니다. 인덱스를 전달하지 않으면, 기본적으로 인덱스는 range(n)로 설정됩니다. n은 배열 길이이며, 즉 [0,1,2,3…。범위(len(array))-1]。

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 import numpy as np
 data = np.array(['a','b','c','d'])
 s = pd.Series(data)
 print(s)

실행 결과:

 0 a
 1 b
 2 c
 3 d
 dtype: object

인덱스를 전달하지 않았기 때문에, 기본적으로 0부터 len(data)까지의 범위를 할당합니다-1,즉 0부터3。

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 import numpy as np
 data = np.array(['a','b','c','d'])
 s = pd.Series(data,index=[100,101,102,103]
 print(s)

실행 결과:

 100 a
 101 b
 102 c
 103 d
 dtype: object

우리는 여기서 인덱스 값을 전달했습니다. 이제, 출력에서 사용자 정의 인덱스 값을 볼 수 있습니다.

딕셔너리로 Series 생성

딕셔너리는 입력으로 전달될 수 있습니다. 인덱스가 지정되지 않으면, 딕셔너리 키는 정렬 순서로 인덱스를 구성합니다. 인덱스가 지정되면, 인덱스 태그에 해당하는 데이터 값이 추출됩니다.

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 import numpy as np
 data = {'a' : 0., 'b' : 1., 'c' : 2.}
 s = pd.Series(data)
 print(s)

실행 결과:

 a 0.0
 b 1.0
 c 2.0
 dtype: float64

딕셔너리 키는 인덱스를 구성하는 데 사용됩니다.

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 import numpy as np
 data = {

실행 결과:

 b 1.0
 c 2.0
 d NaN
 a 0.0
 dtype: float64

인덱스 순서는 유지되며, 누락된 요소는 NaN(비수학적)으로 채워집니다.

단위 값으로 Series 생성

데이터가 단위 값이면, 인덱스를 제공해야 합니다. 이 값은 인덱스 길이와 일치하도록 반복됩니다

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 import numpy as np
 s = pd.Series(5, index=[0, 1, 2, 3]
 print(s)

실행 결과:

 
 0 5
 1 5
 2 5
 3 5
 dtype: int64

위치 Series를 가진 데이터 접근

Series 내의 데이터를 ndarray와 같이 접근할 수 있습니다.
첫 번째 요소를 검색합니다. 잘 알려진 것처럼, 배열의 계산은 0에서 시작하므로 첫 번째 요소는 0번 위치에 저장됩니다. 이와 같이 계속됩니다.

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # 첫 번째 데이터 검색
 print s[0]

실행 결과:

1

Series의 앞 세 개 요소를 검색합니다. 그 앞에 추가하면, 그 인덱스부터 모든 항목이 추출됩니다. 두 인덱스(두 인덱스 사이에 있는:)을 사용하면, 두 인덱스 사이의 항목(종료 인덱스를 포함하지 않음)

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # 앞으로3개 요소
 print s[:3]

실행 결과:

 a 1
 b 2
 c 3
 dtype: int64

마지막 세 개 요소 검색

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # 마지막 세 개 요소 검색
 print s[-3:]

실행 결과:

 c 3
 d 4
 e 5
 dtype: int64

태그(인덱스)를 사용하여 데이터 검색

Series는 고정 크기의 딕셔너리처럼, 인덱스 태그를 통해 값을 가져오고 설정할 수 있습니다.
인덱스 태그 값으로 단일 요소 검색

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = [

실행 결과:

 1

인덱스 태그 값 목록을 사용하여 여러 요소를 검색합니다.

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = [

실행 결과:

 
 a 1
 c 3
 d 4
 dtype: int64

레이블이 포함되지 않으면 예외가 발생합니다.

 # 파일 이름 : pandas.py
 # 저자 by : ko.oldtoolbag.com 
 # pandas 의존 패키지 가져오기 및 별명 지정
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # 여러 요소 검색
 print(s['f'])

실행 결과:

   ...
 KeyError: ''f''