Python 분할 함수: 분할 함수 개요()

게시 됨: 2023-05-25

목차

Python의 split() 함수 소개

Python의 분할 함수는 큰 문자열을 분할하여 더 작은 문자열로 쉽게 처리할 수 있도록 도와주는 문자열 조작 도구입니다.이 함수는 다양한 문자열을 하나로 결합하는 문자열 연결과 반대로 작동합니다. 문자열을 평가하고 이미 지정된 구분 기호를 관찰하면 격리합니다.

split 함수가Python 분할 목록 에서 미리 정의된 구분 기호를 찾지 못하면 기본적으로 공백을 사용합니다.또한 이 함수는 쉼표(,) 문자와 같은 구분 기호 문자열을 사용하여 줄이나 문자열을 구분하는 단어로 구성된 목록을 반환합니다.

Python에서 split 함수를 사용하는 방법이 궁금하십니까 ?개선된 구현을 위해 이 기능에 대한 모든 내용을 이해하려면 계속 읽으십시오!

경쟁에서 우위를 차지하려면 무료 과정을 확인하십시오.

기본 구문 및 매개변수

Python split 함수 의 구문은 다음과 같습니다 .

string.split(구분자,최대)

다음 각 매개변수의 의미를 이해해 보겠습니다.

분리 기호:

구분 기호는 문자열을 분할할 위치를 Python에 알려줍니다. 기본적으로 구분 기호 역할을 하며 미리 정의된 구분 기호를 기준으로 문자열을 구분합니다. 언급한 구분 기호에서 문자열이 분할됩니다. 이 매개변수는 옵션이므로 구분 기호를 지정하지 않으면 분할 함수는 공백을 기본 구분 기호로 활용합니다.

출력에 있는 각 변수 사이에 배치되는 문자별로 미리 정의된 Python 분할 문자열 로 작동합니다 .

최대 분할:

Python에서 split 함수를 사용하는 방법 을 배우려면 이 매개변수의 중요성을 이해해야 합니다 .문자열을 몇 번 분할해야 하는지 정확히 알려주는 숫자입니다. 선택 사항입니다. 따라서 지정하지 않으면 기본값은 -1입니다.

문자열이 분할될 수 있는 횟수에 대한 제한이 없음을 의미하는 Maxsplit 값에는 제한이 없습니다.

함수가 언급된 구분 기호로 문자열을 나눈 후Python 분할 문자열 목록을 반환합니다.

일반적으로 이러한 매개 변수는 문자열 Python을 문자별로 분할하여 작동합니다.

세계 최고의 대학에서 온라인으로데이터 과학 과정을배우십시오. PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 취득하여 경력을 빠르게 쌓으십시오.

문자열을 하위 문자열 목록으로 분할

Python에서 문자열을 구분 기호로 구성된 목록으로 분할하는 것은 출력에 하위 문자열의 세분화된 목록이 표시됨을 의미합니다. 모든 구분 기호는 Python 문자열 분할 함수 에서 구분 기호처럼 작동하여 문자열 목록으로 나눌 수 있습니다.

다음은 문자열을 목록으로 분할하는 방법의 예입니다.

str = "년-월-일"

인쇄(str.split("-"))

결과는 다음과 같습니다.

['연도', '월', '일']

문자열을 문자로 나누는 위의 Python 예제에서 str 변수는 사이에 대시 문자(-)를 포함하는 문자열로 선언되며 구분 기호로 사용됩니다. 이 작업은 대시가 나타날 때마다 문자열을 나눕니다.문자열 Python을 문자로 나눈 해당 출력은 하위 문자열 목록입니다.

분할 구분 기호 지정

Python 분할 문자열 의 기본 구분 기호 는 공백입니다.

다음은 분할 구분 기호를 지정하는 방법을 보여주는 예입니다.

subj = '영어,지리,수학, GK'

인쇄(subj.split(','))

야채 = '감자$양파$양배추$완두콩'

인쇄(야채.분할('$'))

산출

['영어', '지리', '수학', 'GK']

['감자', '양파', '양배추', '완두콩']

위의 첫 번째 예에서 subj.split(',') 함수는 쉼표를 구분 기호로 지정합니다.

위의 두 번째 예에서 vegetables.split('$')는 $기호를 구분 기호로 언급합니다 . 따라서 split() 메서드는 각 구분 기호에서 문자열을 분할하고 문자열의 각 부분을 목록에 통합합니다.

인기 있는 데이터 과학 과정 살펴보기

IIITB의 데이터 사이언스 총괄 포스트 대학원 프로그램 비즈니스 의사 결정을 위한 데이터 과학 전문 인증 프로그램 애리조나 대학교 데이터 과학 석사
IIITB의 데이터 과학 고급 인증 프로그램 메릴랜드 대학교의 데이터 과학 및 비즈니스 분석 전문 인증 프로그램 데이터 과학 과정

분할 수 제한

Python 분할 함수 의 두 번째 매개 변수에 숫자를 지정하기만 하면 분할 수를 제한할 수 있습니다 .

아래 예에서는 maxsplit 매개변수에 숫자를 언급하여 분할을 제한합니다.

subj = '영어,지리,수학, GK'

인쇄(subj.split(',', 2))

야채 = '감자$토마토$양파$완두콩'

인쇄(야채.split('$', 2))

산출:

['영어', '지리', '수학, GK']

['감자', '토마토', '양파$완두콩']

위의 예에서 subj.split(',', 2)는 2를 maxsplit 인수로 정의합니다.따라서 subj 문자열을 2번 분할하고 목록 개체에는 4개의 요소가 포함됩니다. 세 번째 요소는 나머지 문자열을 보여줍니다.

vegetables.split('$', 2) 함수 에서 문자열은 두 번 분할됩니다.반환된 목록은 세 가지 요소로 구성됩니다.

끝에서 문자열 분할

Python에는 문자열의 끝에서 문자열을 분할하는 split 메서드 가 있습니다 .내장 Python 함수 rsplit()은 구분 기호가 마지막으로 나타나는 문자열을 분할합니다.

다음은 rsplit() 함수의 구문입니다.

rsplit("구분 기호", 인수)

예:

rsplit("구분 기호",1)

위의 rsplit() 함수에서 1이 인수로 전달됩니다. 따라서 끝에서 하나의 구분 기호만 취하여 문자열을 끊습니다. 문자열에 둘 이상의 구분 기호가 포함되어 있고 2가 인수로 전달되면 rsplit 함수는 마지막 구분 기호뿐만 아니라 두 번째 마지막 구분 기호에서도 문자열을 분할합니다.

split()으로 공백 제거

다음 단계는 Python에서 split 메서드를 사용하여 공백을 제거하는 데 도움이 됩니다 .

1단계: 문자열 분할 및 공백 제거:

이 단계에서는 str.split() 메서드를 사용하여 문자열을 목록으로 분할합니다. 구분 기호를 사용하여 문자열을 하위 문자열 목록으로 분할합니다.

이 메서드와 관련된 유일한 인수는 구분 기호입니다. 쉼표가 나타날 때마다 문자열을 분할합니다.

2단계: 이해 목록을 사용하여 문자열 목록을 반복합니다.

이 단계를 통해 사용자는 문자열 목록을 반복해야 하는 이해 목록을 정의할 수 있습니다.

3단계: str.strip() 메서드 사용:

이 단계는 모든 반복에서 str.strip() 메서드를 사용하여 문자열에서 선행 또는 후속 공백을 제거합니다. 이 메서드는 선행 및 후행 공백이 제거된 문자열의 복사본을 반환합니다.

업스킬을 배우기 위한 최고의 데이터 과학 기술

SL. 아니요 배워야 할 최고의 데이터 과학 기술
1 데이터 분석 온라인 과정 추론 통계 온라인 과정
2 가설 테스트 온라인 과정 로지스틱 회귀 온라인 과정
선형 회귀 과정 분석 온라인 과정을 위한 선형 대수학

빈 문자열 및 기타 엣지 케이스 처리

.split() 메서드를 사용할 때 출력 목록에 누락된 값이나 빈 문자열이 포함되는 상황이 있을 수 있습니다. split() 메서드는 구분 기호에 빈 문자열이 있는 경우 ValueError를 표시합니다.

다음 예제를 통해 split 함수가 빈 문자열을 처리하는 방법을 이해해 봅시다.

데이터 = “,감자,양파,양배추,,완두콩,”

야채 = data.split(',')

프린트(야채)

산출:

[”, '감자', '양파', '양배추', ”, '완두콩', ”]

위의 출력은 빈 문자열로 인해 이상적이지 않습니다. 이해 목록을 사용하여 정의된 목록에서 빈 문자열을 제거할 수 있습니다. 방법은 다음과 같습니다.

야채 = [”, '양파', '무', '고수', ”]

야채 = [야채라면 야채에 야채 != ”]

프린트(야채)

산출:

['양파', '무', '고수']

성능 고려 사항

Python의 split 함수는 문자열을 구문 분석하는 효율적인 방법을 제공합니다. 이를 최대한 활용하는 가장 좋은 방법은 정확한 구현을 위한 성능 고려 사항을 아는 것입니다. 가장 눈에 띄는 몇 가지를 탐색해 보겠습니다.

문자열의 크기: 특히 문자열이 메모리에 캐시되지 않은 경우 큰 문자열을 분할하는 데 꽤 시간이 걸리는 프로세스가 될 수 있으므로 split() 함수의 성능은 입력 문자열의 크기에 크게 영향을 받습니다.

구분 기호: split() 함수는 정규식을 사용하여 문자열을 분할하므로 복잡한 구분 기호의 경우 속도가 느려질 수 있습니다.공백, 탭 및 쉼표와 같은 간단한 구분 기호는 분할하는 데 시간이 덜 걸립니다.

분할 수: 분할 수가 광범위하면 함수가 더 많은 리소스를 활용하고 실행 속도가 느려질 수 있습니다.분할 수를 제한하려면 선택적 maxsplit 매개변수를 활용할 수 있습니다.

메모리 사용량: split() 함수는 문자열을 분할할 때마다 새 목록 객체를 생성합니다.더 큰 문자열을 처리하는 동안 메모리 문제와 같은 문제가 발생할 수밖에 없습니다. 이를 완화하는 한 가지 방법은 생성기 표현식을 사용하는 것입니다. 이 표현식은 새 목록 객체를 생성하지 않고 대신 즉시 분할 문자열을 생성합니다.

결론 및 추가 학습 기회.

요약하면 split() 함수는 다양한 Python 프로그램 및 응용 프로그램에서 사용할 수 있는 다목적 도구입니다. 텍스트 데이터로 작업하거나 문자열을 조작할 때 특히 유용합니다.

저희 블로그에서 Python 기본 사항을 강화하고 경력을 쌓을 수 있는 충분한 통찰력을 제공하셨기를 바랍니다. 그러나 기본에 충실하는 것이 시작하는 데 필요한 전부라고 생각하십니까?

올바른 접근 방식과 함께 경력을 발전시키는 원동력이 될 수 있는 것은 무엇입니까?

upGrad에서 Python 프로그래밍 부트캠프를 추구하여 데이터 과학 영역에서 뛰어난 경력 기회를 탐색하십시오 !

코딩 초보자가 데이터 과학 분야에서 밝은 경력을 시작하는 것은 매우 유익합니다. 이 과정을 이수하면 얻을 수 있는 탁월한 이점에는 의심 해소 세션, 코딩 연습 문제, 실시간 대화형 수업, 업계 전문가의 학습 등이 포함됩니다.

upGrad는 Python 프로그래밍을 마스터하는 것 외에도 LJMU의 데이터 과학 석사 IIIT Bangalore의 데이터 과학 임원 PG 프로그램과 같은 과정을 이수하여 데이터 과학자로서의 경력을 향상시키는 데 도움을 줍니다 . 이 프로그램을 통해 업계 전문가와 주요 교수진이 사후 및 심층 평가를 확장하는 수요가 많은 기술을 상속받을 수 있습니다.

upGrad와 함께 경력을 시작하세요!