Fonction Split Python : Présentation de la fonction Split ()

Publié: 2023-05-25

Table des matières

Introduction à la fonction split() en Python

La fonction Split en Python est un outil de manipulation de chaînes qui vous aide à gérer facilement une grande chaîne en chaînes plus petites en la divisant.Cette fonction fonctionne par opposition à la concaténation de chaînes, qui combine plusieurs chaînes en une seule. Il évalue une chaîne et isole lorsqu'il observe un séparateur qui a déjà été spécifié.

Si la fonction split ne trouve aucun séparateur prédéfini dans laliste de séparation Python , elle utilise par défaut un espace blanc.De plus, la fonction renvoie une liste comprenant des mots post-séparant une ligne ou une chaîne à l'aide d'une chaîne de délimitation comme le caractère virgule (,).

Vous vous demandezcomment utiliser la fonction split en Python ?Continuez à lire pour tout comprendre sur cette fonction pour une mise en œuvre améliorée !

Consultez nos cours gratuits pour vous démarquer de la concurrence.

Syntaxe et paramètres de base

Voici la syntaxe de la fonctionPython split :

string.split(séparateur,max)

Comprenons la signification de chacun de ces paramètres :

Séparateur:

Le séparateur indique à Python où diviser la chaîne. Essentiellement, il fonctionne comme un délimiteur et sépare les chaînes en fonction du séparateur prédéfini. La chaîne se divise au niveau du séparateur mentionné. Ce paramètre est une option, donc si vous ne spécifiez pas de séparateur, la fonction split utilisera l'espace blanc comme séparateur par défaut.

Cela fonctionne comme une chaîne de séparation Python prédéfinie par caractère, qui est placée entre chaque variable présente dans la sortie.

Fractionnement maximal :

Vous devez comprendre l'importance de ce paramètre si vous voulez apprendre à utiliser la fonction split en Python.C'est un nombre qui indique exactement combien de fois une chaîne doit être divisée. C'est facultatif. Ainsi, s'il n'est pas spécifié, la valeur par défaut est -1.

Il n'y a pas de limite sur la valeur de Maxsplit, ce qui implique qu'il n'y a pas de limite sur le nombre de fois qu'une chaîne peut être divisée.

Une fois que la fonction a coupé la chaîne par le séparateur mentionné, elle renvoie uneliste de chaînes divisée Python .

Habituellement, ces paramètres fonctionnent sur une chaîne divisée Python par caractère.

Apprenezdes cours de science des donnéesen ligne dans les meilleures universités du monde.Gagnez des programmes Executive PG, des programmes de certificat avancés ou des programmes de maîtrise pour accélérer votre carrière.

Fractionner une chaîne en une liste de sous-chaînes

En Python, diviser une chaîne en une liste composée d'un délimiteur signifie que la sortie affiche une liste subdivisée de sous-chaînes. N'importe quel délimiteur peut fonctionner comme un séparateur dans la fonction Python split string pour se diviser en une liste de chaînes.

Voici un exemple de la façon dont une chaîne peut être divisée en une liste :

str = "Année-Mois-Jour"

print(str.split("-"))

Voici la sortie :

['Année mois jour']

Dans l'exemple ci-dessus de chaîne de séparation Python par caractère, la variable strest déclarée avec une chaîne contenant des tirets (-) entre eux, utilisés comme séparateur. Cette opération divise la chaîne chaque fois qu'elle voit un tiret. La sortie correspondante dela chaîne divisée Python par caractère est une liste de sous-chaînes.

Spécification du séparateur pour le fractionnement

Le séparateur par défaut dans la chaîne de séparation Python est n'importe quel espace.

Voici un exemple montrant comment spécifier le séparateur pour le fractionnement.

subj = 'Anglais, Géographie, Mathématiques, GK'

print(subj.split(','))

légumes = 'pomme de terre$oignon$chou$pois'

print(legumes.split('$'))

Sortir

['Anglais', 'Géographie', 'Maths', 'GK']

['pomme de terre', 'oignon', 'chou', 'petits pois']

Dans le premier exemple ci-dessus, la fonction subj.split(',') spécifie une virgule comme séparateur.

Dans le deuxième exemple ci-dessus, le légumes.split('$') mentionne le symbole $comme séparateur. Par conséquent, la méthode split () divise une chaîne à chaque séparateur et incorpore chaque partie d'une chaîne dans une liste.

Explorez nos cours populaires en science des données

Programme exécutif de troisième cycle en science des données de l'IIITB Programme de certificat professionnel en science des données pour la prise de décision commerciale Master of Science en science des données de l'Université de l'Arizona
Programme de certificat avancé en science des données de l'IIITB Programme de certificat professionnel en science des données et analyse commerciale de l'Université du Maryland Cours de science des données

Limiter le nombre de fractionnements

Vous pouvez limiter le nombre de divisions en spécifiant simplement le nombre dans le deuxième paramètre de la fonctionPython split .

L'exemple ci-dessous limite le fractionnement en mentionnant le nombre dans le paramètre maxsplit.

subj = 'Anglais, Géographie, Mathématiques, GK'

print(subj.split(',', 2))

légumes = 'pomme de terre$tomate$oignon$pois'

print(legumes.split('$', 2))

Sortir:

['Anglais', 'Géographie', 'Maths, GK']

['pomme de terre', 'tomate', 'oignon$pois']

Dans l'exemple ci-dessus, subj.split(',', 2) définit 2 comme argument maxsplit.Par conséquent, il divise la chaîne subj 2 fois et l'objet de liste contient quatre éléments. Le troisième élément montre la chaîne restante.

Dans la fonctionVegetables.split('$', 2) , la chaîne est divisée deux fois.La liste renvoyée se compose de trois éléments.

Fractionner une chaîne à partir de la fin

Il existe uneméthode split en Python qui sépare la chaîne à partir de la fin de la chaîne.La fonction Python intégrée rsplit() divise la chaîne à la dernière occurrence du délimiteur.

Voici la syntaxe de la fonction rsplit().

rsplit("délimiteur", argument)

Exemple:

rsplit("délimiteur",1)

Dans la fonction rsplit() ci-dessus, 1 est passé comme argument. Par conséquent, il casse la chaîne en ne prenant qu'un seul délimiteur à partir de la fin. Si la chaîne contient plus d'un délimiteur et si 2 est passé en argument, alors la fonction rsplit séparera la chaîne de l'avant-dernier délimiteur ainsi que du dernier délimiteur.

Suppression des espaces blancs avec split()

Les étapes suivantes vous aident à supprimer les espaces blancs à l'aide de la méthode split en Python .

Étape 1 : Divisez une chaîne et supprimez les espaces :

Cette étape implique l'utilisation de la méthode str.split() pour diviser une chaîne en une liste. Il utilise un délimiteur pour diviser une chaîne en une liste de sous-chaînes.

Le seul argument impliqué dans cette méthode est un séparateur. Il divise la chaîne chaque fois qu'une virgule apparaît.

Étape 2 : Utilisation d'une liste de compréhension pour itérer sur la liste de chaînes.

Cette étape permet à l'utilisateur de définir une liste de compréhension pour laquelle la liste de chaînes doit être itérée.

Étape 3 : Utilisation de la méthode str.strip() :

Cette étape utilise la méthode str.strip() à chaque itération pour éliminer tout espace blanc avant ou après de la chaîne. La méthode renvoie une copie de la chaîne dans laquelle les espaces de début et de fin sont supprimés.

Les meilleures compétences en science des données pour apprendre à se perfectionner

SL. Non Principales compétences en science des données à acquérir
1 Cours en ligne sur l'analyse des données Cours en ligne sur les statistiques inférentielles
2 Cours en ligne sur les tests d'hypothèses Cours en ligne sur la régression logistique
3 Cours de régression linéaire Cours en ligne d'algèbre linéaire pour l'analyse

Gestion des chaînes vides et autres cas extrêmes

Lors de l'utilisation de la méthode.split(), il peut y avoir des situations dans lesquelles la liste de sortie intègre des valeurs manquantes ou des chaînes vides. La méthode split() affichera la ValueError si un séparateur a une chaîne vide.

Comprenons comment la fonction split gère les chaînes vides avec l'exemple suivant.

data = ", pomme de terre, oignon, chou,, pois, "

légumes = data.split(',')

imprimer (légumes)

Sortir:

[”, 'pomme de terre', 'oignon', 'chou', ”, 'petits pois', ”]

La sortie ci-dessus n'est pas idéale en raison des chaînes vides. Vous pouvez utiliser une liste de compréhension pour supprimer ces chaînes vides de la liste définie. Voici comment procéder :

légumes = [", 'oignon', 'radis', 'coriandre', ”]

légumes = [légume pour légume dans légumes si légume != ”]

imprimer (légumes)

Sortir:

['oignon', 'radis', 'coriandre']

Considérations relatives aux performances

La fonction split en Python offre un moyen efficace d'analyser les chaînes. La meilleure façon d'en tirer le meilleur parti est de connaître ses considérations de performances pour une mise en œuvre précise. Voyons quelques-uns des plus importants :

Taille de la chaîne : comme le fractionnement d'une grande chaîne peut être un processus assez long, surtout si la chaîne n'est pas mise en cache en mémoire, les performances d'une fonction split() sont considérablement affectées par la taille d'une chaîne d'entrée.

Délimiteur : la fonction split() utilise des expressions régulières pour diviser les chaînes, ce qui peut être plus lent pour les délimiteurs complexes.Les délimiteurs simples comme l'espace, la tabulation et les virgules prennent moins de temps à se séparer.

Nombre de divisions : si le nombre de divisions est élevé, la fonction peut exploiter davantage de ressources et s'exécuter plus lentement.Pour limiter le nombre de fractionnements, vous pouvez utiliser le paramètre facultatif maxsplit.

Utilisation de la mémoire : la fonction split() génère un nouvel objet de liste chaque fois qu'elle divise une chaîne.Des défis tels que des problèmes de mémoire sont inévitables lors du traitement de chaînes plus grandes. Une façon d'atténuer cela consiste à utiliser une expression de générateur, qui ne crée pas un nouvel objet de liste mais génère à la place les chaînes fractionnées à la volée.

Conclusion et opportunités d'apprentissage.

Pour résumer, la fonction split() est un outil polyvalent qui peut être utilisé dans un large éventail de programmes et d'applications Python. Il est particulièrement utile lorsque vous travaillez avec des données textuelles ou lorsque vous manipulez des chaînes.

Nous espérons que notre blog vous a fourni suffisamment d'informations pour renforcer vos bases Python et progresser dans votre carrière. Cependant, pensez-vous que maîtriser les bases est tout ce dont vous avez besoin pour commencer ?

En plus de la bonne approche, quoi de plus peut être un carburant pour faire avancer votre carrière ?

Explorez des opportunités de carrière exceptionnelles dans le domaine de la science des données en poursuivant Python Programming Bootcamp de upGrad !

Il est extrêmement avantageux pour les aspirants débutants en codage de se lancer dans une brillante carrière en science des données. Les avantages exceptionnels de la poursuite de ce cours comprennent des séances de clarification des doutes, des questions de codage pratiques, des cours interactifs en direct, l'apprentissage d'experts de l'industrie, et plus encore.

En plus de maîtriser la programmation Python, upGrad vous aide également à élever votre carrière en tant que data scientist en suivant des cours tels que Master of Science in Data Science de LJMU et Executive PG Program in Data Science de IIIT Bangalore . Ces programmes vous permettent d'hériter des compétences recherchées que les experts de l'industrie et les professeurs de premier plan étendent après une évaluation approfondie.

Lancez votre carrière avec upGrad !