Die 10 besten Python-String-Methoden [mit Beispielen]
Veröffentlicht: 2021-10-01Inhaltsverzeichnis
Was sind Python-Strings ?
In Python sind Zeichenfolgen eine unveränderliche Folge von Unicode-Zeichen, die in ein, zwei oder drei Anführungszeichen eingeschlossen sind und zur Codierung verwendet werden. Der Hauptzweck von Unicode besteht darin, jedes einzelne Zeichen in allen Sprachen einheitlich zu codieren.
Computer verstehen nur Binärzahlen, und die auf dem Bildschirm erscheinenden Zeichen werden intern als Binärzahlen (Kombination aus 0 und 1) interpretiert und gespeichert. Der Prozess der Umwandlung eines Zeichens in eine Zahl wird als Kodierung bezeichnet, und der umgekehrte Prozess (Zahl zu Zeichen) wird als Dekodierung bezeichnet. Wenn Sie ein Anfänger in Python und Data Science sind, können Ihnen die Data Science-Programme von upGrad definitiv dabei helfen, tiefer in die Welt der Daten und Analysen einzutauchen.
Wie werden Strings in Python erstellt?
Zeichenfolgen werden erstellt, indem die Zeichen in einfache oder doppelte Anführungszeichen geschrieben werden. Es können auch drei Anführungszeichen verwendet werden, aber sie werden im Allgemeinen nur zur Kennzeichnung von Dokumentzeichenfolgen und mehrzeiligen Zeichenfolgen verwendet.
Hier ist ein Programm, das zeigt, wie wir Strings in Python definieren
my_string = 'Willkommen'
print(my_string)
my_string = „Willkommen“
print(my_string)
my_string = ”'Willkommen”'
print(my_string)
# Wir können dreifache Anführungszeichen verwenden, um mehrere Zeilen mit Zeichenfolgen einzuschließen
my_string = „““Willkommen bei
meine Welt"""
print(my_string)
Das obige Programm erzeugt die folgende Ausgabe:
Willkommen
Willkommen
Willkommen
Willkommen in meiner Welt
Wenn ein Text wie „ Sie fragt:“ Wie geht es dir? als solche gedruckt werden muss, führt dies zu einem Syntaxfehler, da die Anweisung sowohl einfache als auch doppelte Anführungszeichen enthält. In diesem Fall sollten dreifache Anführungszeichen verwendet werden.
Anstelle von dreifachen Anführungszeichen können auch Escape-Sequenzen verwendet werden. Eine Escape-Sequenz beginnt mit einem Backlash. Wenn eine Zeichenfolge mit einem einfachen Anführungszeichen dargestellt wird, sollten alle einfachen Anführungszeichen innerhalb einer Zeichenfolge maskiert werden. Dasselbe gilt auch für doppelte Anführungszeichen.
Unten ist ein Programm, das erklärt, wie das Entkommen funktioniert.
print("'Sie sagte: "Was ist los?""')
print('Sie sagte: "Was\ ist los?"')
print("Sie sagte: \"Was ist los?\"")
Ausgang :
Sie sagte: "Was ist los?"
Raw-Strings können auch zum Ignorieren von Escape-Sequenzen innerhalb eines Strings verwendet werden. Dies kann durch Verwendung von r oder R am Anfang der Zeichenfolge erfolgen.
Hier sehen Sie einige der Funktionen, die Sie für Python-Strings ausführen können, ohne Python-Methoden zu verwenden.
1. Zugriff auf einzelne Zeichen in einer Zeichenfolge
Auf einzelne Zeichen kann durch Indizierung zugegriffen werden und auf eine Gruppe von Zeichen mit Hilfe von Slicing. Es gibt zwei Arten von Fehlern, die beim Zugriff auf Zeichenketten auftreten können:
- Der Indexbereich beginnt bei 0. Der Versuch, auf ein Zeichen außerhalb des Indexbereichs zuzugreifen, führt zu IndexError .
- Der Index kann nur eine ganze Zahl sein. Die Einbeziehung von Gleitkommazahlen oder anderen Datentypen führt zu TypeError .
Die negative Indizierung kann für Sequenzen in Python verwendet werden. Der Index -1 bezeichnet das letzte Element, -2 das vorletzte Element und so weiter. Auf eine Reihe von Elementen in einer Zeichenfolge kann mit Hilfe eines Slicing-Operators, Doppelpunkt (:), zugegriffen werden. Der Index wird als zwischen den Elementen zum Spleißen liegend betrachtet.
Hier ist ein Programm für den Zugriff auf Zeichenketten in Python:
str = 'Zeichen'
print('str = ', str)
#1. Charakter
print('str[0] = ', str[0])
#Endzeichen
print('str[-1] = ', str[-1])
Das zweite bis fünfte Zeichen wird geschnitten
print('str[1:5] = ', str[1:5])
Das sechst- bis zweitletzte Zeichen wird in Scheiben geschnitten
print('str[5:-2] = ', str[5:-2])
Die Ausgabe des obigen Programms wird sein:
str = Zeichen
str [0] = c
str [-1] = r
str [1:5] = hara
str[5:-2] = ct
2. Löschen einer Zeichenkette
Strings sind unveränderlich, und ihre Elemente können nicht geändert werden, nachdem sie deklariert oder zugewiesen wurden. Verschiedene Zeichenfolgen können nur demselben Namen neu zugewiesen werden.
Die Zeichen können weder gelöscht noch aus einer Zeichenkette entfernt werden. Mit Hilfe des Schlüsselworts del kann jedoch ein ganzer String gelöscht werden.
Lernen Sie Data Science-Kurse online von den besten Universitäten der Welt. Verdienen Sie Executive PG-Programme, Advanced Certificate-Programme oder Master-Programme, um Ihre Karriere zu beschleunigen.
3. Zeichenfolgen zusammenführen
Der Vorgang des Zusammenführens oder Kombinierens von zwei oder mehr Zeichenfolgen zu einer einzigen Zeichenfolge wird als Verkettung bezeichnet. Der Operator + wird in Python zur Verkettung verwendet. Die einfachste Art der Verkettung besteht darin, zwei Zeichenfolgen zusammenzuschreiben. Der Operator * wird verwendet, um die Zeichenfolge eine bestimmte Anzahl von Malen zu wiederholen.
Unten ist ein Programm, das erklärt, wie Zeichenketten zusammengeführt werden.
str1 = 'Hallo'
str2 ='Hallo'
print('str1 + str2 = ', str1 + str2)
print('str1 * 3 =', str1 * 3)
Ausgabe:
str1 + str2 = HalloHallo
str1 * 3 = HiHiHI
Python-String-Methoden: Wie werden sie verwendet?
Python hat eine Menge eingebauter Methoden, die auf Strings angewendet werden können. Schauen wir uns die verschiedenen Python-String-Methoden an und verstehen, wie sie verwendet werden:
1. Python-Zeichenfolge groß schreiben ()
Diese Zeichenfolgenmethode gibt eine Kopie der Zeichenfolge zurück, nachdem das erste Zeichen großgeschrieben wurde. Die restlichen Zeichen bleiben in Kleinbuchstaben.
Unten ist ein Beispiel dafür, wie capitalize() funktioniert:
>>> mystring = „Hallo“
>>> print(mystring.capitalize())
Ausgang :
Hi
2. Python-String-Casefold ()
Casefold gibt eine case-gefaltete Version der Zeichenfolge zurück. Diese hüllengefalteten Saiten können für hüllenloses Matching verwendet werden.
So funktioniert das:
>>> mystring = „Hallo DORT“
>>> print(mystring.casefold())
Ausgang :
Hi
3. Python String Center(Breite,[Füllzeichen]
Diese Python-String-Methode wird zum Zentrieren des Strings verwendet. Das Füllzeichen soll das Argument übergeben, das das Füll- oder Füllzeichen für die Zeichenfolgen angibt. Die ursprüngliche Zeichenfolge wird zurückgegeben, wenn die Breite kleiner als erforderlich ist.
Hier ist ein Programm, das zeigt, wie das funktioniert:
mystring = 'Zentriert'
x = mystring.center(14, '-')
drucken(x)
Ausgang :
—Zentriert—
4. Anzahl der Python-Strings (sub, [start], [end])
Diese Python-String-Methode gibt die Anzahl der Vorkommen von Teilstrings im Bereich (Anfang bis Ende) aus, die sich nicht überschneiden. Optionale Argumente wie Start und Ende werden in Slice-Notationen dargestellt.
Die Syntax für die Count-Methode lautet:
string.count(substring,start=…,ende=…)
Die Methode string count() benötigt nur einen Parameter zur Ausführung, kann aber auch zwei zusätzliche optionale Parameter haben:
- Python-Teilzeichenfolge : Stellt die Zeichenfolge dar, deren Anzahl bestimmt werden soll.
- start (optional): Der Anfangsindex wird in die Zeichenfolge eingeschlossen, in der die Suche beginnt.
- end (optional): Der letzte Index innerhalb der Zeichenfolge, wo die Suche endet.
5. Python-String-Codierung ()
Diese Python-String-Methode zeigt die codierte Kopie des Strings als Bytes-Objekt an. Die von Python verwendete Standardcodierung ist utf-8. Die Syntax für die Methode encode() ist wie folgt geschrieben.
string.encode(encoding='UTF-8', errors='strict')
Die Zeichenfolge encode () erfordert keinen Standardparameter. Es gibt die utf-8-codierte Kopie der Zeichenfolge zurück. Wenn die Kodierung fehlschlägt, wird UnicodeDecodeError angezeigt. Es gibt zwei Parameter in der Methode encode():
- encoding : Zeigt die Zeichenfolge an, die codiert werden muss.
- errors : Dies ist die Antwort, wenn ein Codierungsfehler auftritt. Es gibt insgesamt sechs Antworten, die gegeben werden, wenn die Codierung fehlschlägt: „strict“, „ignore“, „replace“, „xmlcharrefreplace“, „Backslashreplace“ und „namereplace“.
6. Python-String endet mit ()
Diese Methode zeigt „true“ an, wenn eine Zeichenfolge mit dem erwähnten Suffix endet. Wenn nicht, wird „false“ angezeigt.
Die Syntax für die Methode „endswith()“ lautet:
str.endswith(suffix[, start[, end]])
Die Zeichenkettenmethode "endswith()" hat drei Parameter.
- suffix : Dies bezeichnet eine einzelne Zeichenfolge oder eine Reihe von Suffixen, die überprüft werden sollen.
- start : Dies ist ein optionaler Parameter, der die Anfangsposition angibt, an der das Suffix innerhalb einer Zeichenfolge überprüft werden muss.
- end : Dies ist ein weiterer optionaler Parameter, der die Endstelle angibt, an der das Suffix innerhalb einer Zeichenfolge überprüft werden muss.
7. Python-String expandtabs()
Die Zeichenfolge expandtabs() gibt eine Zeichenfolgenkopie zurück, bei der alle Tabulatorzeichen durch Leerzeichen ersetzt wurden. Die Syntax von expand tabs() lautet:
string.expandtabs (Tabgröße)
Das expand tabs() hat immer ein ganzzahliges Argument für die Tabulatorgröße. Die von dieser String-Methode verwendete Standard-Tabulatorgröße ist 8. In der von expand tab() zurückgegebenen Zeichenfolge sind alle '\t'-Zeichen bis zum nächsten Vielfachen des Tabulatorgrößenparameters durch Leerzeichen ersetzt.
8. Python-Zeichenfolge finden ()
Die Methode find() gibt den Index des ersten Vorkommens der Teilzeichenfolge zurück. Wenn das Substring-Vorkommen nicht gefunden wird, wird -1 zurückgegeben. Die Syntax der Methode find() lautet:
str.find(sub[, start[, end]])
Die Methode find() verwendet drei Parameter.
- sub : Bezeichnet die Teilzeichenfolge, die in der Zeichenfolge str zu finden ist.
- start : Dies ist ein optionaler Parameter, der die Anfangsposition angibt, an der die Zeichenfolge gesucht werden soll.
- end : Dies ist ein weiterer optionaler Parameter, der die Endposition angibt, an der die Zeichenfolge gesucht werden soll.
9. Python-String-Format ()
Diese Python-String-Methode wird verwendet, um den gegebenen String zu formatieren, um eine besser aussehende Ausgabe zu erhalten.
Die Syntax der Methode format() lautet:
template.format (p0,p1,…., k0=v0, k1=v1, …)
- Hier sind p0 und p1 die Positionsargumente.
- k0, k1,.. sind Schlüsselwortargumente.
- v0, v1 ist der Wert der Schlüsselwortargumente.
Diese Python-String-Methode kann eine beliebige Anzahl von Parametern haben, aber sie werden in zwei Kategorien eingeteilt:
- Positionsparameter: Eine Reihe von Parametern, auf die über einen Parameterindex in geschweiften Klammern {} zugegriffen werden kann.
- Schlüsselwortparameter: Eine Reihe von Parametern, auf die über einen in geschweiften Klammern {} eingeschlossenen Schlüsselparameter zugegriffen werden kann.
10. Python-String isalpha()
Diese Methode zeigt True an, wenn alle Zeichen in der Zeichenfolge Alphabete sind. Wenn es sich nicht um Buchstaben handelt, zeigt die Methode False an. Die Syntax der Methode isalpha() lautet:
Schnur. isalpha ()
Die Methode isalpha() verwendet keinen Parameter, und die beiden Rückgabewerte der Methode sind entweder True oder False.
Zeichenfolgenoperationen können mit vielen anderen Operationen gekoppelt werden, was sie zum beliebtesten Datentyp in Python macht. Wenn Sie tief in Python eintauchen und mehr über diese begehrte Data-Science-Fähigkeit erfahren möchten, sollten Sie am Executive PG Program in Data Science von upGrad und IIIT Bangalore teilnehmen, um eine wertvolle Lernerfahrung zu sammeln.
Der 12-monatige Kurs verspricht über 400 Inhaltsstunden mit 25 Experten-Coaching-Sitzungen und über 20 Live-Lernsitzungen. Die über 40.000 Lernenden der Plattform befähigen Studenten mit dem Wissen und der Expertise, um datenwissenschaftliche Anwendungen auf globaler Ebene anzugehen. Also, warte nicht, melde dich noch heute an!
Python unterstützt nur zwei Arten von Zeichenfolgen. Sie sind: Der Typ() gibt den Datentyp des in Form eines Arguments angegebenen Eingabeobjekts zurück. Die Funktion ist entscheidend für das Debugging. Ein String-Datentyp ist ein Satz von Zeichen, die literale Konstanten oder Variablen sein können. Die Variablen könnten die Mutation ihrer Elemente und die Änderung ihrer Länge erlauben, während die Konstanten dies nicht tun.Wie viele Arten von Zeichenfolgen unterstützt Python?
1. Einzeilige Zeichenfolgen
2. Mehrzeilige Zeichenfolgen. Was ist die Funktion von type() in Python?
Was ist ein String-Datentyp?