Funkcja Split w Pythonie: Przegląd funkcji Split ()
Opublikowany: 2023-05-25Spis treści
Wprowadzenie do funkcji split() w Pythonie
Funkcja podziału w Pythonie to narzędzie do manipulacji łańcuchami, które pomaga łatwo obsługiwać duży ciąg znaków na mniejsze ciągi, dzieląc go.Ta funkcja działa w przeciwieństwie do konkatenacji ciągów, która łączy różne ciągi w jeden. Ocenia łańcuch i izoluje, gdy obserwuje separator, który został już określony.
Jeśli funkcja split nie znajdzie żadnego predefiniowanego separatora zpodzielonej listy Pythona , domyślnie używa białych znaków.Co więcej, funkcja zwraca listę zawierającą słowa po oddzieleniu linii lub łańcucha za pomocą ciągu ograniczników, takiego jak znak przecinka (,).
Zastanawiasz się,jak używać funkcji podziału w Pythonie?Czytaj dalej, aby zrozumieć wszystko na temat tej funkcji w celu ulepszenia jej implementacji!
Sprawdź nasze bezpłatne kursy, aby uzyskać przewagę nad konkurencją.
Podstawowa składnia i parametry
Oto składnia funkcjipodziału Pythona :
string.split(separator,max)
Zrozummy znaczenie każdego z tych parametrów:
Separator:
Separator mówi Pythonowi, gdzie podzielić łańcuch. Zasadniczo działa jako ogranicznik i oddziela ciągi na podstawie predefiniowanego separatora. Ciąg dzieli się na wspomnianym separatorze. Ten parametr jest opcją, więc jeśli nie określisz separatora, funkcja podziału użyje białego znaku jako domyślnego separatora.
Działa jako predefiniowany ciąg znaków podzielony na znaki w języku Python, który jest umieszczany między każdą zmienną obecną w danych wyjściowych.
Maksymalny podział:
Musisz zrozumieć znaczenie tego parametru, jeśli chcesz nauczyć się używać funkcji podziału w Pythonie.Jest to liczba, która dokładnie informuje, ile razy łańcuch musi zostać podzielony. Jest to opcjonalne. Tak więc, jeśli nie jest określony, domyślną wartością jest -1.
Nie ma limitu wartości Maxsplit, co oznacza, że nie ma ograniczeń co do tego, ile razy łańcuch może zostać podzielony.
Po tym, jak funkcja podzieli łańcuch znaków przez wspomniany separator, zwraca listę łańcuchówpodzieloną przez Pythona .
Zwykle te parametry działają na łańcuchu dzielonym Python według znaku.
Ucz sięonlinena kursach nauki o danychna najlepszych światowych uniwersytetach. Zdobądź programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.
Dzielenie łańcucha na listę podciągów
W Pythonie podzielenie łańcucha na listę składającą się z ogranicznika oznacza, że dane wyjściowe przedstawiają podzieloną listę podciągów. Dowolny ogranicznik może działać jak separator w funkcji podzielonego łańcucha Pythona , aby podzielić listę ciągów.
Oto przykład, w jaki sposób łańcuch można podzielić na listę:
str = „rok-miesiąc-dzień”
print(str.split(“-”))
Oto dane wyjściowe:
['Rok miesiąc dzień']
W powyższym przykładzie Pythona, który dzieli ciąg znaków na znak, zmienna strjest zadeklarowana z łańcuchem zawierającym znaki myślnika (-) pomiędzy nimi, używane jako separator. Ta operacja dzieli łańcuch za każdym razem, gdy widzi myślnik. Odpowiednim wyjściempodzielonego ciągu Python według znaku jest lista podciągów.
Określanie separatora do podziału
Domyślnym separatorem w dzielonym łańcuchu Pythona jest dowolna biała spacja.
Oto przykład pokazujący, jak określić separator do podziału.
subj = 'Angielski,Geografia,Math, GK'
print(subj.split(','))
warzywa = 'ziemniak$cebula$kapusta$groszek'
print(warzywa.split('$'))
Wyjście
['Angielski', 'Geografia', 'Matematyka', 'GK']
['ziemniak', 'cebula', 'kapusta', 'groszek']
W pierwszym powyższym przykładzie funkcja subj.split(',') określa przecinek jako separator.
W drugim przykładzie powyżej funkcja vegetables.split('$') wymienia symbol $jako separator. W związku z tym metoda split() dzieli ciąg znaków na każdym separatorze i włącza każdą część ciągu znaków do listy.
Zapoznaj się z naszymi popularnymi kursami Data Science
Executive Post Graduate Program in Data Science z IIITB | Profesjonalny program certyfikatów w dziedzinie nauki o danych w podejmowaniu decyzji biznesowych | Master of Science in Data Science na University of Arizona |
Zaawansowany program certyfikacji w nauce o danych z IIITB | Profesjonalny program certyfikatów w dziedzinie nauki o danych i analityki biznesowej na University of Maryland | Kursy nauki o danych |
Ograniczenie liczby podziałów
Możesz ograniczyć liczbę podziałów, po prostu określając liczbę w drugim parametrze funkcjisplit w Pythonie .
Poniższy przykład ogranicza podział, wymieniając liczbę w parametrze maxsplit.
subj = 'Angielski,Geografia,Math, GK'
print(subj.split(',', 2))
warzywa = 'ziemniak$pomidor$cebula$groszek'
print(warzywa.split('$', 2))
Wyjście:
['Angielski', 'Geografia', 'Matematyka, GK']
['ziemniak', 'pomidor', 'cebula$groszek']
W powyższym przykładzie subj.split(',', 2) definiuje 2 jako argument maxsplit.W związku z tym dzieli łańcuch subj 2 razy, a obiekt listy zawiera cztery elementy. Trzeci element pokazuje pozostały ciąg.
W funkcjivegetables.split('$', 2) łańcuch jest dzielony dwa razy.Zwrócona lista składa się z trzech elementów.
Dzielenie łańcucha od końca
W Pythonie istniejemetoda split , która dzieli łańcuch od końca łańcucha.Wbudowana funkcja Pythona rsplit() dzieli łańcuch na ostatnie wystąpienie ogranicznika.
Oto składnia funkcji rsplit().
rsplit("ogranicznik", argument)
Przykład:
rsplit("separator",1)
W powyższej funkcji rsplit() argumentem jest 1. W związku z tym przerywa łańcuch, biorąc tylko jeden ogranicznik od końca. Jeśli łańcuch zawiera więcej niż jeden ogranicznik, a jako argument podano 2, funkcja rsplit podzieli ciąg od przedostatniego ogranicznika, a także od ostatniego ogranicznika.
Usuwanie spacji za pomocą split()
Poniższe kroki pomogą Ci usunąć spacje przy użyciu metody split w Pythonie .
Krok 1: Podziel łańcuch i usuń spacje:
Ten krok obejmuje użycie metody str.split() w celu podzielenia łańcucha na listę. Używa ogranicznika do podzielenia ciągu na listę podciągów.
Jedynym argumentem związanym z tą metodą jest separator. Dzieli łańcuch za każdym razem, gdy pojawia się przecinek.
Krok 2: Używanie listy rozumienia do iteracji na liście ciągów.
Ten krok umożliwia użytkownikowi zdefiniowanie listy rozumienia, dla której lista łańcuchów musi być iterowana.
Krok 3: Korzystanie z metody str.strip():
W tym kroku metoda str.strip() jest używana w każdej iteracji w celu wyeliminowania z ciągu znaków wszelkich początkowych lub następujących po nich białych znaków. Metoda zwraca kopię ciągu, w którym usunięto spacje wiodące i końcowe.
Najważniejsze umiejętności Data Science, aby nauczyć się podnosić umiejętności
SL. NIE | Najważniejsze umiejętności związane z nauką o danych do nauczenia | |
1 | Kursy online dotyczące analizy danych | Statystyki wnioskowania Kursy online |
2 | Kursy online do testowania hipotez | Kursy online dotyczące regresji logistycznej |
3 | Kursy regresji liniowej | Kursy online z algebry liniowej do analizy |
Postępowanie z pustymi strunami i innymi skrzynkami krawędziowymi
Podczas korzystania z metody.split() mogą wystąpić sytuacje, w których lista wyjściowa zawiera brakujące wartości lub puste łańcuchy. Metoda split() wyświetli błąd ValueError, jeśli separator ma pusty łańcuch.
Zobaczmy, jak funkcja split obsługuje puste łańcuchy, korzystając z poniższego przykładu.
dane = „,ziemniak,cebula,kapusta,,groszek,”
warzywa = dane.split(',')
druk (warzywa)
Wyjście:
[”, „ziemniak”, „cebula”, „kapusta”, „groszek”, „]
Powyższe wyjście nie jest idealne ze względu na puste łańcuchy. Możesz użyć listy zrozumienia, aby usunąć te puste ciągi ze zdefiniowanej listy. Oto jak to zrobić:
warzywa = [”, „cebula”, „rzodkiewka”, „kolendra”, ”]
warzywa = [warzywa za warzywa w warzywach, jeśli warzywo != ”]
druk (warzywa)
Wyjście:
['cebula', 'rzodkiewka', 'kolendra']
Rozważania dotyczące wydajności
Funkcja split w Pythonie oferuje efektywny sposób analizowania ciągów znaków. Najlepszym sposobem na maksymalne wykorzystanie tego jest poznanie kwestii związanych z wydajnością w celu dokładnego wdrożenia. Przejdźmy do niektórych z najbardziej znanych:
Rozmiar łańcucha: ponieważ dzielenie dużego łańcucha może być dość czasochłonnym procesem, zwłaszcza jeśli łańcuch nie jest buforowany w pamięci — na wydajność funkcji split() znacząco wpływa rozmiar ciągu wejściowego.
Ogranicznik: Funkcja split() używa wyrażeń regularnych do dzielenia łańcuchów, co może być wolniejsze w przypadku złożonych ograniczników.Proste ograniczniki, takie jak spacja, tabulator i przecinek, dzielą mniej czasu.
Liczba podziałów: jeśli liczba podziałów jest duża, może to spowodować, że funkcja będzie wykorzystywać więcej zasobów i działać wolniej.Aby ograniczyć liczbę podziałów, możesz użyć opcjonalnego parametru maxsplit.
Wykorzystanie pamięci: Funkcja split() generuje nowy obiekt listy za każdym razem, gdy dzieli ciąg znaków.Wyzwania, takie jak problemy z pamięcią, muszą wystąpić podczas pracy z większymi łańcuchami. Jednym ze sposobów złagodzenia tego jest użycie wyrażenia generatora, które nie tworzy nowego obiektu listy, ale zamiast tego generuje podzielone łańcuchy w locie.
Wnioski i możliwości dalszej nauki.
Podsumowując, funkcja split() jest wszechstronnym narzędziem, którego można używać w wielu programach i aplikacjach Pythona. Jest to szczególnie przydatne podczas pracy z danymi tekstowymi lub manipulowania ciągami znaków.
Mamy nadzieję, że nasz blog dostarczył Ci wystarczających informacji, aby utrwalić podstawy Pythona i zrobić postęp w karierze. Czy jednak uważasz, że opanowanie podstaw to wszystko, czego potrzebujesz, aby zacząć?
Co oprócz odpowiedniego podejścia może być paliwem do rozwoju kariery?
Odkryj wyjątkowe możliwości kariery w dziedzinie nauki o danych, biorąc udział w kursie programowania w języku Python od upGrad !
Rozpoczęcie błyskotliwej kariery w nauce o danych jest niezwykle korzystne dla początkujących programistów. Wyjątkowe korzyści z kontynuowania tego kursu obejmują sesje wyjaśniające wątpliwości, ćwiczenia kodowania pytań, interaktywne zajęcia na żywo, uczenie się od ekspertów branżowych i nie tylko.
Oprócz opanowania programowania w Pythonie, upGrad pomaga również w rozwoju kariery jako naukowiec zajmujący się danymi, realizując kursy takie jak Master of Science in Data Science z LJMU i Executive PG Program in Data Science z IIIT Bangalore . Programy te pozwalają odziedziczyć pożądane umiejętności, które eksperci branżowi i wiodący wykładowcy rozszerzają post i dogłębną ocenę.
Rozpocznij swoją karierę z upGrad!