Função Split do Python: visão geral da função Split ()

Publicados: 2023-05-25

Índice

Introdução à função split() em Python

A função Split em Python é uma ferramenta de manipulação de strings que ajuda você a manipular facilmente uma string grande em strings menores, dividindo-a.Essa função funciona em oposição à concatenação de strings, que combina várias strings em uma. Ele avalia uma string e isola quando observa um separador que já foi especificado.

Se a função de divisão não encontrar nenhum separador predefinido nalista de divisão do Python , ela, por padrão, utilizará espaço em branco.Além disso, a função retorna uma lista contendo palavras pós-separando uma linha ou string usando uma string delimitadora como a vírgula (,).

Quer sabercomo usar a função split em Python?Continue lendo para entender tudo sobre esta função para melhor implementação!

Confira nossos cursos gratuitos para obter uma vantagem sobre a concorrência.

Sintaxe e parâmetros básicos

Aqui está a sintaxe da funçãosplit do Python :

string.split(separador,max)

Vamos entender o significado de cada um desses parâmetros:

Separador:

O separador diz ao Python onde dividir a string. Essencialmente, ele funciona como um delimitador e separa strings com base no separador predefinido. A string se divide no separador mencionado. Este parâmetro é uma opção, portanto, se você não especificar um separador, a função split utilizará o espaço em branco como separador padrão.

Ele funciona como uma string pré-definida do Python dividida por caractere, que é colocada entre cada variável presente na saída.

Maxsplit:

Você deve entender a importância desse parâmetro se quiser aprender como usar a função split em Python.É um número que informa exatamente quantas vezes uma string precisa ser dividida. É opcional. Portanto, se não for especificado, o valor padrão é -1.

Não há limite no valor de Maxsplit, o que implica que não há limite de quantas vezes uma string pode ser dividida.

Depois que a função quebra a string pelo separador mencionado, ela retorna umalista de strings dividida em Python.

Normalmente, esses parâmetros funcionam em Python de string dividida por caractere.

Aprendacursos de ciência de dadoson-line nas principais universidades do mundo.Ganhe Programas Executivos de PG, Programas de Certificado Avançado ou Programas de Mestrado para acelerar sua carreira.

Dividindo uma String em uma Lista de Substrings

Em Python, dividir uma string em uma lista que consiste em um delimitador significa que a saída mostra uma lista subdividida de substrings. Qualquer delimitador pode funcionar como um separador na função split string do Python para dividir em uma lista de strings.

Aqui está uma instância de como uma string pode ser dividida em uma lista:

str = “Ano-Mês-Dia”

print(str.split(“-”))

Aqui está a saída:

['Ano mês dia']

No exemplo acima de Python dividir string por caractere, a variável stré declarada com uma string contendo traços (-) no meio, usados ​​como um separador. Esta operação divide a string toda vez que vê um traço. A saída correspondente dastring dividida Python por caractere é uma lista de substrings.

Especificando o separador para divisão

O separador padrão na sequência de divisão do Python é qualquer espaço em branco.

Aqui está um exemplo demonstrando como especificar o separador para divisão.

subj = 'Inglês,Geografia,Matemática, GK'

print(subj.split(','))

legumes = 'batata$cebola$repolho$ervilhas'

print(legumes.split('$'))

Saída

['Inglês', 'Geografia', 'Matemática', 'GK']

['batata', 'cebola', 'repolho', 'ervilha']

No primeiro exemplo acima, a função subj.split(',') especifica uma vírgula como separador.

No segundo exemplo acima, o vegetables.split('$') menciona o símbolo $como separador. Portanto, o método split() divide uma string em cada separador e incorpora cada parte de uma string em uma lista.

Explore nossos cursos populares de ciência de dados

Programa Executivo de Pós-Graduação em Ciência de Dados do IIITB Programa de Certificação Profissional em Ciência de Dados para Tomada de Decisões de Negócios Mestre em Ciência de Dados pela University of Arizona
Programa de Certificação Avançada em Ciência de Dados do IIITB Programa de certificação profissional em ciência de dados e análise de negócios da Universidade de Maryland Cursos de ciência de dados

Limitando o Número de Divisões

Você pode limitar o número de divisões simplesmente especificando o número no segundo parâmetro da funçãosplit do Python .

O exemplo abaixo limita a divisão mencionando o número no parâmetro maxsplit.

subj = 'Inglês,Geografia,Matemática, GK'

print(subj.split(',', 2))

vegetais = 'batata$tomate$cebola$ervilhas'

print(legumes.split('$', 2))

Saída:

['Inglês', 'Geografia', 'Matemática, GK']

['batata', 'tomate', 'cebola$ervilhas']

No exemplo acima, o subj.split(',', 2) define 2 como argumento maxsplit.Portanto, ele divide a string subj 2 vezes e o objeto de lista contém quatro elementos. O terceiro elemento mostra a string restante.

Na funçãovegetables.split('$', 2) , a string é dividida duas vezes.A lista retornada consiste em três elementos.

Separando uma String do Fim

Existe ummétodo split em Python que divide a string do final da string.A função interna do Python rsplit() divide a string na última ocorrência do delimitador.

Aqui está a sintaxe da função rsplit().

rsplit(“delimitador”, argumento)

Exemplo:

rsplit(“delimitador”,1)

Na função rsplit() acima, 1 é passado como argumento. Portanto, ele quebra a string tirando apenas um delimitador do final. Se a string contiver mais de um delimitador e se 2 for passado como um argumento, a função rsplit dividirá a string do penúltimo delimitador, bem como do último delimitador.

Removendo espaços em branco com split ()

As etapas a seguir ajudam a remover espaços em branco usando o método split em Python .

Etapa 1: divida uma string e remova os espaços em branco:

Esta etapa envolve o uso do método str.split() para dividir uma string em uma lista. Ele usa um delimitador para dividir uma string em uma lista de substrings.

O único argumento envolvido neste método é um separador. Ele divide a string toda vez que uma vírgula aparece.

Passo 2: Usando uma lista de compreensão para iterar na lista de strings.

Esta etapa permite ao usuário definir uma lista de compreensão para a qual a lista de strings deve ser iterada.

Passo 3: Usando o método str.strip():

Esta etapa usa o método str.strip() em cada iteração para eliminar qualquer espaço em branco inicial ou posterior da string. O método retorna uma cópia da string na qual os espaços em branco iniciais e finais são removidos.

Principais habilidades de ciência de dados para aprender a melhorar

SL. Não Principais habilidades de ciência de dados para aprender
1 Cursos Online de Análise de Dados Cursos Online de Estatística Inferencial
2 Cursos Online de Teste de Hipóteses Cursos Online de Regressão Logística
3 Cursos de Regressão Linear Cursos Online de Álgebra Linear para Análise

Manipulando strings vazias e outros casos extremos

Ao usar o método.split(), pode haver situações em que a lista de saída incorpore valores ausentes ou strings vazias. O método split() mostrará o ValueError se um separador tiver uma string vazia.

Vamos entender como a função split lida com strings vazias com o exemplo a seguir.

data = “,batata,cebola,repolho,,ervilhas,”

vegetais = data.split(',')

imprimir (legumes)

Saída:

[”, 'batata', 'cebola', 'repolho', ”, 'ervilhas', ”]

A saída acima não é ideal devido às strings vazias. Você pode usar uma lista de compreensão para remover essas strings vazias da lista definida. Veja como fazer:

vegetais = [”, 'cebola', 'rabanete', 'coentro', ”]

vegetais = [vegetal para vegetal em vegetais se vegetal! = ”]

imprimir (legumes)

Saída:

['cebola', 'rabanete', 'coentro']

Considerações de desempenho

A função split em Python oferece uma maneira eficiente de analisar strings. A melhor maneira de aproveitá-lo ao máximo é conhecendo suas considerações de desempenho para uma implementação precisa. Vamos navegar por alguns dos mais proeminentes:

Tamanho da String: Como dividir uma string grande pode ser um processo bastante demorado, especialmente se a string não for armazenada em cache na memória - o desempenho de uma função split() é significativamente afetado pelo tamanho de uma string de entrada.

Delimitador: A função split() usa expressões regulares para dividir strings, o que pode ficar mais lento para delimitadores complexos.Delimitadores simples como espaço, tabulação e vírgulas levam menos tempo para serem divididos.

Número de divisões: se o número de divisões for expansivo, isso pode fazer com que a função aproveite mais recursos e seja executada mais lentamente.Para limitar o número de divisões, você pode utilizar o parâmetro opcional maxsplit.

Uso de memória: A função split() gera um novo objeto de lista toda vez que divide uma string.Desafios como problemas de memória podem ocorrer ao lidar com strings maiores. Uma maneira de mitigar isso é usar uma expressão geradora, que não cria um novo objeto de lista, mas gera as sequências de divisão dinamicamente.

Conclusão e Oportunidades de Aprendizagem Adicional.

Resumindo, a função split() é uma ferramenta versátil que pode ser usada em uma ampla variedade de programas e aplicativos Python. É particularmente útil ao trabalhar com dados de texto ou ao manipular strings.

Esperamos que nosso blog tenha oferecido informações suficientes para fortalecer seus fundamentos do Python e avançar em sua carreira. No entanto, você acha que aprender o básico é tudo o que você precisa para começar?

Junto com a abordagem certa, o que mais pode ser um combustível para avançar em sua carreira?

Explore excelentes oportunidades de carreira no domínio da ciência de dados, seguindo o Python Programming Bootcamp da upGrad !

É extremamente benéfico para aspirantes a iniciantes em codificação embarcar em uma carreira brilhante em ciência de dados. Os benefícios excepcionais de seguir este curso incluem sessões de esclarecimento de dúvidas, questões práticas de codificação, aulas interativas ao vivo, aprendizado com especialistas do setor e muito mais.

Além de dominar a programação Python, o upGrad também ajuda você a elevar sua carreira como cientista de dados, fazendo cursos como Master of Science em Data Science da LJMU e Executive PG Program in Data Science do IIIT Bangalore . Esses programas permitem que você herde as habilidades sob demanda que os especialistas do setor e os principais professores estendem à avaliação posterior e aprofundada.

Comece sua carreira com upGrad!