English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Pandas Series 기본 작업
Series 구조는 다음과 같습니다:
pandas.Series( data, index, dtype, copy)
생성자의 매개변수는 다음과 같습니다-
data: 데이터는 ndarray, 리스트, 상수 등 다양한 형태를 취할 수 있습니다 index: 인덱스 값은 독립적이고 해시 가능해야하며, 데이터 길이와 같아야 합니다. 인덱스를 전달하지 않으면, 기본적으로 np.arange(n)입니다 dtype: 데이터 타입을 정의합니다. None이면 데이터 타입을 추론합니다 copy: 데이터를 복사합니다. 기본적으로 False입니다
Series를 생성하는 데 다양한 입력을 사용할 수 있습니다. 예를 들어
배열 딕셔너리 스칼라 값 또는 상수
>>> # pandas 의존성 패키지를 임포트하고 별명을 지정 >>> import pandas as pd >>> s = pd.Series() >>> print(s) Series([], dtype: float64)
데이터가 ndarray라면, 전달된 인덱스는 같은 길이를 가져야 합니다. 인덱스를 전달하지 않으면, 기본적으로 인덱스는 range(n)로 설정됩니다. n은 배열 길이이며, 즉 [0,1,2,3…。범위(len(array))-1]。
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data) print(s)
실행 결과:
0 a 1 b 2 c 3 d dtype: object
인덱스를 전달하지 않았기 때문에, 기본적으로 0부터 len(data)까지의 범위를 할당합니다-1,즉 0부터3。
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data,index=[100,101,102,103] print(s)
실행 결과:
100 a 101 b 102 c 103 d dtype: object
우리는 여기서 인덱스 값을 전달했습니다. 이제, 출력에서 사용자 정의 인덱스 값을 볼 수 있습니다.
딕셔너리는 입력으로 전달될 수 있습니다. 인덱스가 지정되지 않으면, 딕셔너리 키는 정렬 순서로 인덱스를 구성합니다. 인덱스가 지정되면, 인덱스 태그에 해당하는 데이터 값이 추출됩니다.
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd import numpy as np data = {'a' : 0., 'b' : 1., 'c' : 2.} s = pd.Series(data) print(s)
실행 결과:
a 0.0 b 1.0 c 2.0 dtype: float64
딕셔너리 키는 인덱스를 구성하는 데 사용됩니다.
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd import numpy as np data = {
실행 결과:
b 1.0 c 2.0 d NaN a 0.0 dtype: float64
인덱스 순서는 유지되며, 누락된 요소는 NaN(비수학적)으로 채워집니다.
데이터가 단위 값이면, 인덱스를 제공해야 합니다. 이 값은 인덱스 길이와 일치하도록 반복됩니다
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd import numpy as np s = pd.Series(5, index=[0, 1, 2, 3] print(s)
실행 결과:
0 5 1 5 2 5 3 5 dtype: int64
Series 내의 데이터를 ndarray와 같이 접근할 수 있습니다.
첫 번째 요소를 검색합니다. 잘 알려진 것처럼, 배열의 계산은 0에서 시작하므로 첫 번째 요소는 0번 위치에 저장됩니다. 이와 같이 계속됩니다.
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # 첫 번째 데이터 검색 print s[0]
실행 결과:
1
Series의 앞 세 개 요소를 검색합니다. 그 앞에 추가하면, 그 인덱스부터 모든 항목이 추출됩니다. 두 인덱스(두 인덱스 사이에 있는:)을 사용하면, 두 인덱스 사이의 항목(종료 인덱스를 포함하지 않음)
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # 앞으로3개 요소 print s[:3]
실행 결과:
a 1 b 2 c 3 dtype: int64
마지막 세 개 요소 검색
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # 마지막 세 개 요소 검색 print s[-3:]
실행 결과:
c 3 d 4 e 5 dtype: int64
Series는 고정 크기의 딕셔너리처럼, 인덱스 태그를 통해 값을 가져오고 설정할 수 있습니다.
인덱스 태그 값으로 단일 요소 검색
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd s = pd.Series([1,2,3,4,5], index = [
실행 결과:
1
인덱스 태그 값 목록을 사용하여 여러 요소를 검색합니다.
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd s = pd.Series([1,2,3,4,5], index = [
실행 결과:
a 1 c 3 d 4 dtype: int64
레이블이 포함되지 않으면 예외가 발생합니다.
# 파일 이름 : pandas.py # 저자 by : ko.oldtoolbag.com # pandas 의존 패키지 가져오기 및 별명 지정 import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # 여러 요소 검색 print(s['f'])
실행 결과:
... KeyError: ''f''