Funcția Python Split: Prezentare generală a funcției Split ()

Publicat: 2023-05-25

Cuprins

Introducere în funcția split() în Python

Funcția Split din Python este un instrument de manipulare a șirurilor care vă ajută să manipulați cu ușurință un șir mare în șiruri mai mici prin împărțirea lui.Această funcție funcționează spre deosebire de concatenarea șirurilor, care combină diverse șiruri într-unul singur. Evaluează un șir și izolează atunci când observă un separator care a fost deja specificat.

Dacă funcția de împărțire nu găsește niciun separator predefinit dinlista de împărțire Python , aceasta, implicit, utilizează spațiul alb.Mai mult, funcția returnează o listă cuprinzând cuvinte post care separă o linie sau un șir folosind un șir delimitator precum caracterul virgulă (,).

Vă întrebațicum să utilizați funcția split în Python?Continuați să citiți pentru a înțelege totul despre această funcție pentru o implementare îmbunătățită!

Consultați cursurile noastre gratuite pentru a obține un avantaj față de concurență.

Sintaxă și parametri de bază

Iată sintaxa funcțieiPython split :

string.split(separator,max)

Să înțelegem semnificația fiecăruia dintre acești parametri:

Separator:

Separatorul îi spune lui Python unde să împartă șirul. În esență, funcționează ca un delimitator și separă șirurile pe baza separatorului predefinit. Șirul se desparte la separatorul menționat. Acest parametru este o opțiune, așa că dacă nu specificați un separator, funcția de împărțire va folosi spațiul alb ca separator implicit.

Funcționează ca un șir predefinit Python împărțit cu caracter, care este plasat între fiecare variabilă prezentă în ieșire.

Maxsplit:

Trebuie să înțelegeți importanța acestui parametru dacă doriți să învățați cum să utilizați funcția split în Python.Este un număr care informează exact de câte ori este necesar un șir pentru a fi împărțit. Este optional. Deci, dacă nu este specificat, valoarea implicită este -1.

Nu există o limită a valorii lui Maxsplit, ceea ce implică că nu există nicio limită de câte ori poate fi împărțit un șir.

După ce funcția rupe șirul cu separatorul menționat, returnează olistă divizată Python de șiruri.

De obicei, acești parametri funcționează pe Python șir împărțit după caracter.

Învațăcursuri de știință a dateloronline de la cele mai bune universități din lume.Câștigați programe Executive PG, programe avansate de certificat sau programe de master pentru a vă accelera cariera.

Împărțirea unui șir într-o listă de subșiruri

În Python, împărțirea unui șir într-o listă constând dintr-un delimitator înseamnă că rezultatul arată o listă subdivizată de subșiruri. Orice delimitator poate funcționa ca un separator în funcția Python de împărțire a șirurilor de caractere pentru a se rupe într-o listă de șiruri.

Iată un exemplu al modului în care un șir poate fi împărțit într-o listă:

str = „An-Lună-Ziu”

print(str.split(“-”))

Iată rezultatul:

['An lună zi']

În exemplul de mai sus de împărțire Python șir cu caracter, variabila streste declarată cu un șir care conține caractere liniuțe (-) între ele, folosit ca separator. Această operație împarte șirul de fiecare dată când vede o liniuță. Ieșirea corespunzătoare așirului Python împărțit după caracter este o listă de subșiruri.

Specificarea separatorului pentru împărțire

Separatorul implicit în șirul divizat Python este orice spațiu alb.

Iată un exemplu care demonstrează cum să specificați separatorul pentru împărțire.

subj = „Engleză, Geografie, Matematică, GK”

print(subj.split(','))

legume = 'cartof$ceapa$varza$mazare'

print(legume.split('$'))

Ieșire

[„Engleză”, „Geografie”, „Matematică”, „GK”]

['cartof', 'ceapa', 'varza', 'mazare']

În primul exemplu de mai sus, funcția subj.split(',') specifică o virgulă ca separator.

În al doilea exemplu de mai sus, vegetables.split('$') menţionează simbolul $ca separator. Prin urmare, metoda split() împarte un șir la fiecare separator și încorporează fiecare parte a unui șir într-o listă.

Explorați cursurile noastre populare de știință a datelor

Program Executive Postuniversitar în Știința Datelor de la IIITB Program de certificat profesional în știința datelor pentru luarea deciziilor de afaceri Master în Știința Datelor de la Universitatea din Arizona
Program de certificat avansat în știința datelor de la IIITB Program de certificat profesional în știința datelor și analiză de afaceri de la Universitatea din Maryland Cursuri de știință a datelor

Limitarea numărului de împărțiri

Puteți limita numărul de împărțiri prin simpla specificare a numărului în al doilea parametru al funcțieide împărțire Python .

Exemplul de mai jos limitează împărțirea prin menționarea numărului în parametrul maxsplit.

subj = „Engleză, Geografie, Matematică, GK”

print(subj.split(',', 2))

legume = 'cartofi$tomate$ceapa$mazare'

print(legume.split('$', 2))

Ieșire:

[„Engleză”, „Geografie”, „Matematică, GK”]

['cartofi', 'rosii', 'ceapa$mazare']

În exemplul de mai sus, subj.split(',', 2) definește 2 ca argument maxsplit.Prin urmare, împarte șirul subj de 2 ori, iar obiectul listă conține patru elemente. Al treilea element arată șirul rămas.

În funcțiavegetables.split('$', 2) , șirul este împărțit de două ori.Lista returnată constă din trei elemente.

Împărțirea unui șir de la sfârșit

Există ometodă de împărțire în Python care împarte șirul de la sfârșitul șirului.Funcția Python încorporată rsplit() împarte șirul la ultima apariție a delimitatorului.

Iată sintaxa funcției rsplit().

rsplit(„delimitator”, argument)

Exemplu:

rsplit(„delimitator”,1)

În funcția rsplit() de mai sus, 1 este transmis ca argument. Prin urmare, rupe șirul luând doar un delimitator de la sfârșit. Dacă șirul conține mai mult de un delimitator și dacă 2 este trecut ca argument, atunci funcția rsplit va împărți șirul de la ultimul delimitator, precum și de la ultimul delimitator.

Eliminarea spațiului alb cu split()

Următorii pași vă ajută să eliminați spațiile albe folosind metoda split din Python .

Pasul 1: Împărțiți un șir și eliminați spațiul alb:

Acest pas implică utilizarea metodei str.split() pentru a împărți un șir într-o listă. Folosește un delimitator pentru a împărți un șir într-o listă de subșiruri.

Singurul argument implicat în această metodă este un separator. Împarte șirul de fiecare dată când apare o virgulă.

Pasul 2: Folosind o listă de înțelegere pentru a repeta pe lista de șiruri.

Acest pas permite utilizatorului să definească o listă de înțelegere pentru care lista de șiruri trebuie să fie iterată.

Pasul 3: Folosind metoda str.strip():

Acest pas folosește metoda str.strip() la fiecare iterație pentru a elimina orice spațiu alb înainte sau următor din șir. Metoda returnează o copie a șirului în care spațiul alb de început și de final este eliminat.

Cele mai bune abilități de știință a datelor pe care să înveți să-ți perfecționezi

SL. Nu Abilități de top în știința datelor de învățat
1 Cursuri online de analiză a datelor Cursuri online de statistică inferenţială
2 Cursuri online de testare a ipotezelor Cursuri online de regresie logistică
3 Cursuri de regresie liniară Algebră liniară pentru cursuri online de analiză

Manipularea șirurilor goale și a altor cazuri de margine

Când utilizați metoda.split(), pot exista situații în care lista de ieșire încorporează valori lipsă sau șiruri goale. Metoda split() va afișa ValueError dacă un separator are un șir gol.

Să înțelegem cum funcția split gestionează șirurile goale cu următorul exemplu.

date = „,cartofi, ceapă, varză,,mazăre,”

legume = data.split(',')

imprimare (legume)

Ieșire:

[”, „cartof”, „ceapă”, „varză”, „mazăre”, „]

Ieșirea de mai sus nu este ideală din cauza șirurilor goale. Puteți folosi o listă de înțelegere pentru a elimina acele șiruri goale din lista definită. Iată cum să o faci:

legume = [”, „ceapă”, „ridiche”, „coriandru”, ”]

legume = [legumă pentru legume în legume dacă legume != ”]

imprimare (legume)

Ieșire:

['ceapa', 'ridiche', 'coriandru']

Considerații de performanță

Funcția split din Python oferă o modalitate eficientă de a analiza șiruri. Cel mai bun mod de a profita la maximum de acesta este cunoașterea considerațiilor sale de performanță pentru o implementare corectă. Să navigăm pe unele dintre cele mai proeminente:

Dimensiunea șirului: Deoarece împărțirea unui șir mare poate fi un proces destul de lung, mai ales dacă șirul nu este stocat în cache în memorie, performanța unei funcții split() este afectată semnificativ de dimensiunea unui șir de intrare.

Delimitator: funcția split() folosește expresii regulate pentru a împărți șirurile, care pot deveni mai lent pentru delimitatorii complecși.Delimitatorii simpli, cum ar fi spațiul, tabulatorul și virgulele, necesită mai puțin timp pentru a se împărți.

Număr de împărțiri: dacă numărul de împărțiri este expansiv, poate face ca funcția să folosească mai multe resurse și să ruleze mai lent.Pentru a limita numărul de împărțiri, puteți utiliza parametrul opțional maxsplit.

Utilizarea memoriei: Funcția split() generează un nou obiect listă de fiecare dată când împarte un șir.Provocări, cum ar fi problemele de memorie, sunt neapărat să apară atunci când ai de-a face cu șiruri mai mari. O modalitate de a atenua acest lucru este utilizarea unei expresii generatoare, care nu creează un nou obiect listă, ci generează șirurile divizate din mers.

Concluzie și oportunități de învățare ulterioară.

Pentru a rezuma, funcția split() este un instrument versatil care poate fi utilizat într-o gamă largă de programe și aplicații Python. Este deosebit de util atunci când lucrați cu date text sau când manipulați șiruri.

Sperăm că blogul nostru v-a oferit suficientă perspectivă pentru a vă consolida elementele de bază despre Python și pentru a avansa în carieră. Totuși, crezi că ai de bază este tot ceea ce ai nevoie pentru a începe?

Alături de abordarea corectă, ce mai poate fi un combustibil pentru a-ți avansa în carieră?

Explorați oportunități remarcabile de carieră în domeniul științei datelor, urmărind Python Programming Bootcamp de la upGrad !

Este extrem de benefic pentru începătorii care aspiră la codificare să se angajeze într-o carieră strălucitoare în știința datelor. Beneficiile excepționale ale urmăririi acestui curs includ sesiuni de curățare a îndoielilor, întrebări practice de codificare, cursuri interactive live, învățare de la experți din industrie și multe altele.

Pe lângă stăpânirea programării Python, upGrad vă ajută, de asemenea, să vă îmbunătățiți cariera ca om de știință a datelor, urmând cursuri precum Master of Science în Data Science de la LJMU și Executive PG Program in Data Science de la IIIT Bangalore . Aceste programe vă permit să moșteniți abilități solicitate pe care experții din industrie și profesorii de frunte le extind evaluării post și aprofundate.

Începe-ți cariera cu upGrad!