English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Python으로 텍스트 유형을 간단히 검사하는 방법2이 방법【파일 헤더 및 cchardet 라이브러리 기반】

이 문서는 Python의 간단한 텍스트 타입 검사 방법에 대한 예제를 설명합니다. 여러분이 참고할 수 있도록 구체적으로 설명합니다:

1、헤더에 따라.

#BOM을 포함한 UTF인지 확인.8파일
def IsUtf8BomFile(pathfile):
  if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
    return True
  return False

2、cchardet 라이브러리 사용.

>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}

Python 관련 내용에 더 많은 관심을 가진 독자는 다음 특집을 확인할 수 있습니다: 《Python 파일과 디렉토리 작업 기술 요약》、《Python 텍스트 파일 작업 기술 요약》、《Python URL 작업 기술 요약》、《Python 이미지 작업 기술 요약》、《Python 데이터 구조와 알고리즘 튜토리얼》、《Python Socket 프로그래밍 기술 요약》、《Python 함수 사용 기술 요약》、《Python 문자열 작업 요약》 및 《Python 입문 및 중급 경典 튜토리얼》

본 문서에서 설명된 내용이 여러분의 Python 프로그래밍에 도움이 되길 바랍니다.

성명: 본문의 내용은 인터넷에서 가져왔으며, 저작권자는 본사에 있습니다. 인터넷 사용자가 자발적으로 기여하고 자체적으로 업로드한 내용이며, 사이트는 소유권을 가지지 않으며, 인공 편집을하지 않았으며, 관련 법적 책임도 부담하지 않습니다. 저작권 침해가 의심되는 내용이 있다면, 이메일을 보내주세요: notice#oldtoolbag.com(보내는 이메일에서 #을 @으로 변경하시고, 관련 증거를 제공하시면, 해당 내용이 실제로 침해되었는지 확인되면, 사이트는 즉시 해당 침해 내용을 삭제합니다.)

추천 합니다