English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
문자열 encode() 메서드는 지정된 인코딩으로 문자열을 인코딩합니다. 인코딩을 지정하지 않으면 UTF-8입니다.
Python 3.0부터 시작합니다.문자열유니코드 형식으로 저장됩니다. 즉문자열에서 각 문자는 하나의 코드 포인트로 표현됩니다. 따라서, 각 문자열은 유니코드 코드 포인트 시퀀스입니다.
이 문자열을 효과적으로 저장하기 위해 코드 포인트 시퀀스를 바이트 셋으로 변환합니다. 이 과정은인코딩입니다.
여러 가지 다른 인코딩이 있습니다. 이들은 문자열 처리 방식이 다릅니다. 인기 있는 인코딩은utf-8,ascii등을 사용합니다.
문자열의 encode() 메서드를 사용하여, 인코딩되지 않은 문자열을 Python이 지원하는 어떤 인코딩으로 변환할 수 있습니다. 기본적으로, Python은utf-8编码.
encode() 메서드의 문법은 다음과 같습니다:
string.encode(encoding='UTF-8,errors='strict')
기본적으로, encode() 메서드는 어떤 매개변수도 필요하지 않습니다.
그 문자열의 utf를 반환합니다-8인코딩 버전. 오류가 발생하면 UnicodeDecodeError 예외가 발생합니다
하지만, 두 가지 매개변수가 필요합니다:
encoding -문자열을 인코딩할 수 있는 인코딩 유형
errors-인코딩 실패 시의 응답. 여섯 가지 종류의 오류 응답이 있습니다
strict-기본 응답은 실패 시 UnicodeDecodeError 예외를 발생시킵니다
ignore-결과에서 인코딩할 수 없는 Unicode를 무시합니다
replace-인코딩할 수 없는 Unicode를 물음표로 대체하세요?
xmlcharrefreplace-인코딩할 수 없는 Unicode를 인코딩할 수 없는 XML 문자 참조로 대체하세요
backslash replace-인코딩할 수 없는 Unicode를 인코딩할 수 없는 \uNNNN 시퀀스로 대체하세요
namereplace-인코딩할 수 없는 Unicode를 인코딩할 수 없는 escape 시퀀스로 대체하세요
# unicode 문자열 string = 'pythön!' # 문자열 출력 print('문자열:', string) # 기본 인코딩 utf-8 string_utf = string.encode() # 출력 결과 print('인코딩 버전은:', string_utf)
이 프로그램을 실행할 때, 출력은 다음과 같습니다:
문자열: pythön! 인코딩 버전은: b'pyth\xc3\xb6n!
# unicode 문자열 string = 'pythön!' # 출력 string print('문자열:', string) # ignore error print('인코딩된 버전(ignore):', string.encode("ascii", "ignore")) # substitute error print('인코딩된 버전(replace):', string.encode("ascii", "replace"))
이 프로그램을 실행할 때, 출력은 다음과 같습니다:
문자열: pythön! 인코딩된 버전(ignore): b'pythn!' 인코딩된 버전(replace): b'pyth?n!'
주의:다른 인코딩과 오류 매개변수를 시도하세요。