Python-Split-Funktion: Übersicht über die Split-Funktion ()

Veröffentlicht: 2023-05-25

Inhaltsverzeichnis

Einführung in die Funktion split() in Python

Die Split-Funktion in Python ist ein Tool zur String-Manipulation, mit dem Sie einen großen String durch Aufteilen einfach in kleinere Strings verarbeiten können.Diese Funktion funktioniert im Gegensatz zur Verkettung von Zeichenfolgen, bei der verschiedene Zeichenfolgen zu einer zusammengefasst werden. Es bewertet eine Zeichenfolge und isoliert, wenn ein bereits angegebenes Trennzeichen festgestellt wird.

Wenn die Split-Funktion kein vordefiniertes Trennzeichen in derPython-Split-Liste findet , verwendet sie standardmäßig Leerzeichen.Darüber hinaus gibt die Funktion eine Liste mit Wörtern zurück, die eine Zeile oder Zeichenfolge durch eine Trennzeichenfolge wie das Komma (,) trennen.

Sie fragen sich,wie Sie die Split-Funktion in Python verwenden?Lesen Sie weiter, um alles über diese Funktion zu erfahren und die Implementierung zu verbessern!

Schauen Sie sich unsere kostenlosen Kurse an, um sich von der Konkurrenz abzuheben.

Grundlegende Syntax und Parameter

Hier ist die Syntax derPython-Split- Funktion:

string.split(separator,max)

Lassen Sie uns die Bedeutung jedes dieser Parameter verstehen:

Separator:

Das Trennzeichen teilt Python mit, wo die Zeichenfolge geteilt werden soll. Im Wesentlichen fungiert es als Trennzeichen und trennt Zeichenfolgen basierend auf dem vordefinierten Trennzeichen. Die Zeichenfolge wird an Ihrem genannten Trennzeichen geteilt. Dieser Parameter ist eine Option. Wenn Sie also kein Trennzeichen angeben, nutzt die Teilungsfunktion Leerzeichen als Standardtrennzeichen.

Es funktioniert als vordefinierte Python-Aufteilung einer Zeichenfolge nach Zeichen, die zwischen jeder in der Ausgabe vorhandenen Variablen platziert wird.

Maxsplit:

Sie müssen die Bedeutung dieses Parameters verstehen, wenn Sie lernen möchten, wie man die Split-Funktion in Python verwendet.Dabei handelt es sich um eine Zahl, die genau angibt, wie oft eine Zeichenfolge geteilt werden muss. Es ist optional. Wenn es also nicht angegeben ist, ist der Standardwert -1.

Es gibt keine Begrenzung für den Wert von Maxsplit, was bedeutet, dass es keine Grenze dafür gibt, wie oft eine Zeichenfolge geteilt werden kann.

Nachdem die Funktion die Zeichenfolge durch das erwähnte Trennzeichen unterteilt hat, gibt sie einePython-Split-Liste von Zeichenfolgen zurück.

Normalerweise funktionieren diese Parameter bei der Aufteilung von Zeichenfolgen in Python nach Zeichen.

Lernen SieData-Science-Kurseonline von den besten Universitäten der Welt.Erwerben Sie Executive PG-Programme, Advanced Certificate-Programme oder Master-Programme, um Ihre Karriere zu beschleunigen.

Aufteilen eines Strings in eine Liste von Teilstrings

In Python bedeutet die Aufteilung einer Zeichenfolge in eine Liste bestehend aus einem Trennzeichen, dass die Ausgabe eine unterteilte Liste von Teilzeichenfolgen anzeigt. Jedes Trennzeichen kann wie ein Trennzeichen in der Python-Split-String -Funktion funktionieren, um eine Liste von Strings aufzuteilen.

Hier ist ein Beispiel dafür, wie eine Zeichenfolge in eine Liste aufgeteilt werden kann:

str = „Jahr-Monat-Tag“

print(str.split(“-”))

Hier ist die Ausgabe:

['Jahr Monat Tag']

Im obigen Beispiel, in dem Python Zeichenfolgen nach Zeichen aufteilt, wird die Variable strmit einer Zeichenfolge deklariert, die dazwischen Bindestriche (-) enthält und als Trennzeichen dient. Diese Operation teilt die Zeichenfolge jedes Mal, wenn sie einen Bindestrich sieht. Die entsprechende Ausgabe derZeichenfolgenaufteilung in Python nach Zeichen ist eine Liste von Teilzeichenfolgen.

Angeben des Trennzeichens für die Aufteilung

Das Standardtrennzeichen in der geteilten Python-Zeichenfolge ist ein beliebiges Leerzeichen.

Hier ist ein Beispiel, das zeigt, wie das Trennzeichen für die Aufteilung angegeben wird.

subj = 'Englisch, Geographie, Mathematik, GK'

print(subj.split(','))

Gemüse = 'Kartoffel$Zwiebel$Kohl$Erbsen'

print(vegetables.split('$'))

Ausgang

['Englisch', 'Geographie', 'Mathe', 'GK']

['Kartoffel', 'Zwiebel', 'Kohl', 'Erbsen']

Im ersten Beispiel oben gibt die Funktion subj.split(',') ein Komma als Trennzeichen an.

Im zweiten Beispiel oben wird in „vegeuses.split('$')“ das $-Symbol als Trennzeichen erwähnt. Daher teilt die Methode split() einen String an jedem Trennzeichen auf und fügt jeden Teil eines Strings in eine Liste ein.

Entdecken Sie unsere beliebten Data Science-Kurse

Executive Post Graduate Program in Data Science vom IIITB Professionelles Zertifikatsprogramm in Data Science für geschäftliche Entscheidungsfindung Master of Science in Datenwissenschaft von der University of Arizona
Advanced Certificate Program in Data Science vom IIITB Professionelles Zertifikatsprogramm in Data Science und Business Analytics von der University of Maryland Data Science-Kurse

Begrenzung der Anzahl der Teilungen

Sie können die Anzahl der Teilungen begrenzen, indem Sie einfach die Anzahl im zweiten Parameter derPython-Split- Funktion angeben.

Das folgende Beispiel schränkt die Aufteilung ein, indem die Zahl im Parameter „maxsplit“ angegeben wird.

subj = 'Englisch, Geographie, Mathematik, GK'

print(subj.split(',', 2))

Gemüse = 'Kartoffel$Tomate$Zwiebel$Erbsen'

print(vegetables.split('$', 2))

Ausgang:

['Englisch', 'Geographie', 'Mathe, GK']

['Kartoffel', 'Tomate', 'Zwiebel$Erbsen']

Im obigen Beispiel definiert subj.split(',', 2) 2 als maxsplit-Argument.Daher wird der Subj-String zweimal geteilt und das Listenobjekt enthält vier Elemente. Das dritte Element zeigt die verbleibende Zeichenfolge.

In der Funktion„gemüse.split('$', 2)“ wird die Zeichenfolge zwei Mal aufgeteilt.Die zurückgegebene Liste besteht aus drei Elementen.

Teilen einer Zeichenfolge vom Ende

In Python gibt es eineSplit-Methode , die den String vom Ende des Strings trennt.Die integrierte Python-Funktion rsplit() teilt die Zeichenfolge beim letzten Vorkommen des Trennzeichens.

Hier ist die Syntax der Funktion rsplit().

rsplit(“Trennzeichen”, Argument)

Beispiel:

rsplit(“Trennzeichen”,1)

In der obigen Funktion rsplit() wird 1 als Argument übergeben. Daher wird die Zeichenfolge unterbrochen, indem am Ende nur ein Trennzeichen verwendet wird. Wenn die Zeichenfolge mehr als ein Trennzeichen enthält und 2 als Argument übergeben wird, teilt die Funktion rsplit die Zeichenfolge sowohl vom vorletzten als auch vom letzten Trennzeichen auf.

Leerzeichen mit split() entfernen

Die folgenden Schritte helfen Ihnen, Leerzeichen mithilfe der Split-Methode in Python zu entfernen .

Schritt 1: Teilen Sie eine Zeichenfolge und entfernen Sie Leerzeichen:

In diesem Schritt wird die Methode str.split() verwendet, um eine Zeichenfolge in eine Liste aufzuteilen. Es verwendet ein Trennzeichen, um eine Zeichenfolge in eine Liste von Teilzeichenfolgen aufzuteilen.

Das einzige Argument dieser Methode ist ein Trennzeichen. Die Zeichenfolge wird jedes Mal geteilt, wenn ein Komma erscheint.

Schritt 2: Verwenden einer Verständnisliste zum Durchlaufen der Zeichenfolgenliste.

Dieser Schritt ermöglicht es dem Benutzer, eine Verständnisliste zu definieren, für die die Liste der Zeichenfolgen iteriert werden muss.

Schritt 3: Verwendung der Methode str.strip():

In diesem Schritt wird bei jeder Iteration die Methode str.strip() verwendet, um alle führenden oder folgenden Leerzeichen aus der Zeichenfolge zu entfernen. Die Methode gibt eine Kopie der Zeichenfolge zurück, in der das führende und nachfolgende Leerzeichen entfernt wird.

Top-Data-Science-Fähigkeiten zum Erlernen, um sich weiterzubilden

SL. NEIN Die besten datenwissenschaftlichen Fähigkeiten zum Erlernen
1 Online-Kurse zur Datenanalyse Online-Kurse zur Inferenzstatistik
2 Online-Kurse zum Testen von Hypothesen Online-Kurse zur logistischen Regression
3 Kurse zur linearen Regression Online-Kurse zur linearen Algebra für die Analyse

Umgang mit leeren Zeichenfolgen und anderen Randfällen

Bei Verwendung der Methode.split() kann es vorkommen, dass die Ausgabeliste fehlende Werte oder leere Zeichenfolgen enthält. Die Methode split() zeigt den ValueError an, wenn ein Trennzeichen eine leere Zeichenfolge enthält.

Lassen Sie uns anhand des folgenden Beispiels verstehen, wie die Split-Funktion mit leeren Zeichenfolgen umgeht.

data = „,Kartoffel,Zwiebel,Kohl,,Erbsen“

Gemüse = data.split(',')

drucken(Gemüse)

Ausgang:

[“, „Kartoffel“, „Zwiebel“, „Kohl“, „Erbsen“, „]

Die obige Ausgabe ist aufgrund der leeren Zeichenfolgen nicht ideal. Mithilfe einer Verständnisliste können Sie diese leeren Zeichenfolgen aus der definierten Liste entfernen. So geht's:

Gemüse = [“, „Zwiebel“, „Radieschen“, „Koriander“, „]

Gemüse = [Gemüse für Gemüse in Gemüse, wenn Gemüse != ”]

drucken(Gemüse)

Ausgang:

['Zwiebel', 'Rettich', 'Koriander']

Leistungsüberlegungen

Die Split-Funktion in Python bietet eine effiziente Möglichkeit, Strings zu analysieren. Der beste Weg, das Beste daraus zu machen, besteht darin, die Leistungsaspekte für eine genaue Implementierung zu kennen. Sehen wir uns einige der bekanntesten an:

Größe der Zeichenfolge: Da das Aufteilen einer großen Zeichenfolge ein ziemlich zeitaufwändiger Vorgang sein kann, insbesondere wenn die Zeichenfolge nicht im Speicher zwischengespeichert ist, wird die Leistung einer Funktion „split()“ erheblich von der Größe einer Eingabezeichenfolge beeinflusst.

Trennzeichen: Die Funktion „split()“ verwendet reguläre Ausdrücke zum Teilen von Zeichenfolgen, was bei komplexen Trennzeichen langsamer werden kann.Einfache Trennzeichen wie Leerzeichen, Tabulatorzeichen und Kommas benötigen weniger Zeit zum Teilen.

Anzahl der Teilungen: Wenn die Anzahl der Teilungen zu hoch ist, kann dies dazu führen, dass die Funktion mehr Ressourcen beansprucht und langsamer ausgeführt wird.Um die Anzahl der Teilungen zu begrenzen, können Sie den optionalen Parameter maxsplit verwenden.

Speicherverbrauch: Die Funktion split() generiert jedes Mal ein neues Listenobjekt, wenn sie eine Zeichenfolge teilt.Beim Umgang mit größeren Strings treten zwangsläufig Probleme wie Speicherprobleme auf. Eine Möglichkeit, dies zu mildern, ist die Verwendung eines Generatorausdrucks, der kein neues Listenobjekt erstellt, sondern die geteilten Zeichenfolgen im laufenden Betrieb generiert.

Fazit und weitere Lernmöglichkeiten.

Zusammenfassend lässt sich sagen, dass die Funktion split() ein vielseitiges Werkzeug ist, das in einer Vielzahl von Python-Programmen und -Anwendungen verwendet werden kann. Dies ist besonders nützlich, wenn Sie mit Textdaten arbeiten oder Zeichenfolgen bearbeiten.

Wir hoffen, dass unser Blog Ihnen genügend Einblicke geboten hat, um Ihre Python-Grundlagen zu vertiefen und in Ihre Karriere einzusteigen. Glauben Sie jedoch, dass das Beherrschen der Grundlagen alles ist, was Sie brauchen, um loszulegen?

Was kann neben der richtigen Herangehensweise noch der Treibstoff für Ihre Karriere sein?

Entdecken Sie herausragende Karrieremöglichkeiten im Bereich der Datenwissenschaft, indem Sie das Python Programming Bootcamp von upGrad absolvieren !

Für angehende Programmieranfänger ist es äußerst vorteilhaft, eine glänzende Karriere in der Datenwissenschaft einzuschlagen. Zu den außergewöhnlichen Vorteilen dieses Kurses gehören Sitzungen zur Klärung von Zweifeln, Übungsfragen zum Codieren, interaktive Live-Kurse, Lernen von Branchenexperten und mehr.

Neben der Beherrschung der Python-Programmierung unterstützt Sie upGrad auch dabei, Ihre Karriere als Datenwissenschaftler voranzutreiben, indem es Kurse wie den Master of Science in Data Science an der LJMU und das Executive PG Program in Data Science am IIIT Bangalore absolviert . Diese Programme ermöglichen es Ihnen, gefragte Fähigkeiten zu erwerben, die Branchenexperten und führende Lehrkräfte nachträglich erweitern und einer eingehenden Bewertung unterziehen.

Starten Sie Ihre Karriere mit upGrad!