Функция разделения Python: обзор функции разделения ()

Опубликовано: 2023-05-25

Оглавление

Введение в функцию split() в Python

Функция разделения в Python — это инструмент для манипулирования строками, который помогает вам легко обрабатывать большие строки на более мелкие строки, разделяя их.Эта функция работает в отличие от конкатенации строк, которая объединяет различные строки в одну. Он оценивает строку и изолирует ее, когда обнаруживает уже указанный разделитель.

Если функция разделения не находит предопределенного разделителя всписке разделения Python , она по умолчанию использует пробел.Кроме того, функция возвращает список, содержащий слова после разделения строки или строки с помощью строки-разделителя, например символа запятой (,).

Хотите знать,как использовать функцию разделения в Python?Продолжайте читать, чтобы понять все об этой функции для улучшения реализации!

Посетите наши бесплатные курсы, чтобы получить преимущество над конкурентами.

Основной синтаксис и параметры

Вот синтаксис функцииразделения Python :

string.split (разделитель, макс.)

Давайте разберемся со значением каждого из этих параметров:

Разделитель:

Разделитель сообщает Python, где разделить строку. По сути, он работает как разделитель и разделяет строки на основе предопределенного разделителя. Строка разбивается на указанный вами разделитель. Этот параметр является опцией, поэтому, если вы не укажете разделитель, функция разделения будет использовать пробел в качестве разделителя по умолчанию.

Он работает как предопределенная строка разделения Python по символам, которая помещается между каждой переменной, присутствующей в выводе.

Максплитка:

Вы должны понимать важность этого параметра, если хотите научиться использовать функцию разделения в Python.Это число, которое точно сообщает, сколько раз требуется разделить строку. Это необязательно. Таким образом, если он не указан, значение по умолчанию равно -1.

Нет ограничений на значение Maxsplit, что означает, что нет ограничения на то, сколько раз можно разделить строку.

После того, как функция разбивает строку по указанному разделителю, она возвращает разделенный список строкPython .

Обычно эти параметры работают с разделенной строкой Python по символам.

Изучайтеонлайн-курсы по науке о данныхв лучших университетах мира. Участвуйте в программах Executive PG, Advanced Certificate Programs или Master Programs, чтобы ускорить свою карьеру.

Разделение строки на список подстрок

В Python разделение строки на список, состоящий из разделителя, означает, что вывод показывает разделенный список подстрок. Любой разделитель может работать как разделитель в функции разделения строк Python , чтобы разбить список строк.

Вот пример того, как строку можно разбить на список:

str = «Год-Месяц-День»

печать(стр.разделить("-"))

Вот результат:

['Год месяц день']

В приведенном выше примере Python разбивает строку по символу, переменная strобъявляется со строкой, содержащей символы тире (-) между ними, используемые в качестве разделителя. Эта операция разделяет строку каждый раз, когда она видит тире. Соответствующий выводразделенной строки Python по символам представляет собой список подстрок.

Указание разделителя для разделения

Разделителем по умолчанию в разделенной строке Python является любой пробел.

Вот пример, демонстрирующий, как указать разделитель для разделения.

subj = 'Английский язык, география, математика, GK'

печать (subj.split (','))

овощи = 'картошка$лук$капуста$горох'

печать (овощи.split ('$'))

Выход

['Английский', 'География', 'Математика', 'GK']

['картошка', 'лук', 'капуста', 'горох']

В первом примере выше функция subj.split(',') указывает запятую в качестве разделителя.

Во втором приведенном выше примере овощи.split('$') упоминает символ $как разделитель. Следовательно, метод split() разбивает строку по каждому разделителю и включает каждую часть строки в список.

Изучите наши популярные курсы по науке о данных

Высшая программа высшего образования в области науки о данных от IIITB Программа профессиональных сертификатов в области науки о данных для принятия бизнес-решений Магистр наук в области науки о данных Университета Аризоны
Расширенная сертификационная программа в области науки о данных от IIITB Профессиональная сертификационная программа в области науки о данных и бизнес-аналитики Университета Мэриленда. Курсы по науке о данных

Ограничение количества разделений

Вы можете ограничить количество разделений, просто указав число во втором параметре функцииразделения Python .

В приведенном ниже примере разделение ограничивается указанием числа в параметре maxsplit.

subj = 'Английский язык, география, математика, GK'

печать (subj.split (',', 2))

овощи = 'картошка$помидор$лук$горох'

печать (овощи.split ('$', 2))

Выход:

['Английский', 'География', 'Математика, ГК']

['картошка', 'помидор', 'лук$горох']

В приведенном выше примере subj.split(',', 2) определяет 2 как аргумент maxsplit.Следовательно, он разбивает строку subj 2 раза, а объект списка содержит четыре элемента. Третий элемент показывает оставшуюся строку.

В функцииовощи.split('$', 2) строка делится два раза.Возвращаемый список состоит из трех элементов.

Разделение строки с конца

В Python есть метод split , который разделяет строку с конца строки.Встроенная функция Python rsplit() разбивает строку по последнему вхождению разделителя.

Вот синтаксис функции rsplit().

rsplit("разделитель", аргумент)

Пример:

rsplit("разделитель",1)

В приведенной выше функции rsplit() в качестве аргумента передается 1. Следовательно, он разрывает строку, беря только один разделитель с конца. Если строка содержит более одного разделителя и если в качестве аргумента передается 2, то функция rsplit разделит строку на предпоследний разделитель, а также на последний разделитель.

Удаление пробелов с помощью split()

Следующие шаги помогут вам удалить пробелы с помощью метода разделения в Python .

Шаг 1: Разделите строку и удалите пробелы:

Этот шаг включает в себя использование метода str.split() для разделения строки на список. Он использует разделитель для разделения строки на список подстрок.

Единственным аргументом, задействованным в этом методе, является разделитель. Он разбивает строку каждый раз, когда появляется запятая.

Шаг 2: Использование списка понимания для повторения списка строк.

Этот шаг позволяет пользователю определить список понимания, для которого список строк должен быть повторен.

Шаг 3: Использование метода str.strip():

На этом шаге метод str.strip() используется на каждой итерации, чтобы удалить из строки все начальные или последующие пробелы. Метод возвращает копию строки, в которой удалены начальные и конечные пробелы.

Лучшие навыки работы с данными, которым нужно научиться, чтобы повысить квалификацию

Сл. Нет Основные навыки работы с данными
1 Онлайн-курсы по анализу данных Онлайн-курсы по логической статистике
2 Онлайн-курсы по проверке гипотез Онлайн-курсы по логистической регрессии
3 Курсы линейной регрессии Онлайн-курсы по линейной алгебре для анализа

Обработка пустых строк и других пограничных случаев

При использовании метода.split() могут возникать ситуации, когда выходной список включает отсутствующие значения или пустые строки. Метод split() покажет ValueError, если разделитель имеет пустую строку.

Давайте разберемся, как функция разделения обрабатывает пустые строки, на следующем примере.

data = «,картофель,лук,капуста,,горох,»

овощи = data.split(',')

распечатать(овощи)

Выход:

[", 'картошка', 'лук', 'капуста', ”, 'горох', ”]

Приведенный выше вывод не идеален из-за пустых строк. Вы можете использовать список понимания, чтобы удалить эти пустые строки из определенного списка. Вот как это сделать:

овощи = [", 'лук', 'редька', 'кориандр', ”]

овощи = [овощ для овощей в овощах если овощ != ”]

распечатать(овощи)

Выход:

['лук', 'редька', 'кориандр']

Вопросы производительности

Функция split в Python предлагает эффективный способ разбора строк. Лучший способ максимально использовать его — это знать его соображения производительности для точной реализации. Давайте пройдемся по некоторым из наиболее известных из них:

Размер строки. Поскольку разделение большой строки может занять довольно много времени, особенно если строка не кэшируется в памяти, на производительность функции split() существенно влияет размер входной строки.

Разделитель: функция split() использует регулярные выражения для разделения строк, что может замедляться для сложных разделителей.Простые разделители, такие как пробел, табуляция и запятые, разбиваются быстрее.

Количество разбиений: если количество разбиений велико, это может привести к тому, что функция будет использовать больше ресурсов и работать медленнее.Чтобы ограничить количество разделений, вы можете использовать необязательный параметр maxsplit.

Использование памяти: функция split() создает новый объект списка каждый раз, когда она разбивает строку.Такие проблемы, как проблемы с памятью, обязательно возникнут при работе с большими строками. Один из способов смягчить это — использовать выражение генератора, которое не создает новый объект списка, а вместо этого генерирует разделенные строки на лету.

Заключение и возможности дальнейшего обучения.

Подводя итог, можно сказать, что функция split() — это универсальный инструмент, который можно использовать в самых разных программах и приложениях Python. Это особенно полезно при работе с текстовыми данными или при работе со строками.

Мы надеемся, что наш блог дал вам достаточно информации, чтобы укрепить ваши основы Python и продвинуться по карьерной лестнице. Однако вы думаете, что знание основ — это все, что вам нужно для начала?

Наряду с правильным подходом, что еще может стать топливом для продвижения по карьерной лестнице?

Откройте для себя выдающиеся карьерные возможности в области науки о данных, пройдя курс Python Programming Bootcamp от upGrad !

Для начинающих программистов чрезвычайно полезно начать блестящую карьеру в науке о данных. Исключительные преимущества прохождения этого курса включают занятия по устранению сомнений, практические вопросы по программированию, живые интерактивные занятия, обучение у отраслевых экспертов и многое другое.

В дополнение к освоению программирования на Python, upGrad также помогает вам повысить свою карьеру в качестве специалиста по данным, пройдя такие курсы, как Master of Science in Data Science от LJMU и Executive PG Program in Data Science от IIIT Bangalore . Эти программы позволяют вам наследовать востребованные навыки, которые отраслевые эксперты и ведущие преподаватели расширяют после углубленной оценки.

Начните свою карьеру с upGrad!