Función de división de Python: descripción general de la función de división ()
Publicado: 2023-05-25Tabla de contenido
Introducción a la función split() en Python
La función de división en Python es una herramienta de manipulación de cadenas que lo ayuda a manejar fácilmente una cadena grande en cadenas más pequeñas al dividirla.Esta función funciona a diferencia de la concatenación de cadenas, que combina varias cadenas en una sola. Evalúa una cadena y aísla cuando observa un separador que ya se ha especificado.
Si la función de división no encuentra ningún separador predefinido de lalista dividida de Python , utiliza espacios en blanco de forma predeterminada.Además, la función devuelve una lista que comprende palabras posteriores que separan una línea o cadena usando una cadena delimitadora como el carácter de coma (,).
¿Se preguntacómo usar la función de división en Python?¡Siga leyendo para entender todo sobre esta función para una mejor implementación!
Consulte nuestros cursos gratuitos para obtener una ventaja sobre la competencia.
Sintaxis básica y parámetros
Aquí está la sintaxis de la funciónde división de Python :
string.split(separador,max)
Entendamos el significado de cada uno de estos parámetros:
Separador:
El separador le dice a Python dónde dividir la cadena. Esencialmente, funciona como un delimitador y separa cadenas en función del separador predefinido. La cadena se divide en el separador mencionado. Este parámetro es una opción, por lo que si no especifica un separador, la función de división aprovechará el espacio en blanco como separador predeterminado.
Funciona como una cadena dividida predefinida de Python por carácter, que se coloca entre cada variable presente en la salida.
Maxsplit:
Debe comprender la importancia de este parámetro si desea aprender a usar la función de división en Python.Es un número que informa exactamente cuántas veces se requiere dividir una cadena. es opcional Entonces, si no se especifica, el valor predeterminado es -1.
No hay límite en el valor de Maxsplit, lo que implica que no hay límite en la cantidad de veces que se puede dividir una cadena.
Después de que la función rompe la cadena por el separador mencionado, devuelve unalista dividida de cadenas de Python.
Por lo general, estos parámetros funcionan en Python de cadena dividida por carácter.
Aprendacursos de ciencia de datosen línea de las mejores universidades del mundo.Obtenga programas Executive PG, programas de certificados avanzados o programas de maestría para acelerar su carrera.
Dividir una cadena en una lista de subcadenas
En Python, dividir una cadena en una lista que consta de un delimitador significa que la salida muestra una lista subdividida de subcadenas. Cualquier delimitador puede funcionar como un separador en la función de cadena dividida de Python para dividir una lista de cadenas.
Aquí hay una instancia de cómo una cadena se puede dividir en una lista:
str = “Año-Mes-Día”
imprimir(str.split(“-”))
Aquí está la salida:
['Año mes dia']
En el ejemplo anterior de cadena dividida por carácter de Python, la variable strse declara con una cadena que contiene caracteres de guión (-) en el medio, que se usa como separador. Esta operación divide la cadena cada vez que ve un guión. La salida correspondiente dePython de cadena dividida por carácter es una lista de subcadenas.
Especificación del separador para dividir
El separador predeterminado en la cadena dividida de Python es cualquier espacio en blanco.
Aquí hay un ejemplo que demuestra cómo especificar el separador para dividir.
subj = 'Inglés, Geografía, Matemáticas, GK'
imprimir(subj.split(','))
vegetales = 'papa$cebolla$col$guisantes'
imprimir (verduras. dividir ('$'))
Producción
['Inglés', 'Geografía', 'Matemáticas', 'GK']
['papa', 'cebolla', 'repollo', 'guisantes']
En el primer ejemplo anterior, la función subj.split(',') especifica una coma como separador.
En el segundo ejemplo anterior, las verduras.split('$') menciona el símbolo $como separador. Por lo tanto, el método split() divide una cadena en cada separador e incorpora cada parte de una cadena en una lista.
Explore nuestros cursos populares de ciencia de datos
Programa Ejecutivo de Postgrado en Data Science del IIITB | Programa de Certificado Profesional en Ciencia de Datos para la Toma de Decisiones Empresariales | Maestría en Ciencias en Ciencia de Datos de la Universidad de Arizona |
Programa de Certificado Avanzado en Ciencia de Datos de IIITB | Programa de certificado profesional en ciencia de datos y análisis empresarial de la Universidad de Maryland | Cursos de ciencia de datos |
Limitar el número de divisiones
Puede limitar el número de divisiones simplemente especificando el número en el segundo parámetro de la funciónde división de Python .
El siguiente ejemplo limita la división al mencionar el número en el parámetro maxsplit.
subj = 'Inglés, Geografía, Matemáticas, GK'
imprimir(subj.split(',', 2))
vegetales = 'papa$tomate$cebolla$guisantes'
imprimir (verduras. dividir ('$', 2))
Producción:
['Inglés', 'Geografía', 'Matemáticas, GK']

['papa', 'tomate', 'cebolla$guisantes']
En el ejemplo anterior, subj.split(',', 2) define 2 como argumento maxsplit.Por lo tanto, divide la cadena subj 2 veces y el objeto de lista contiene cuatro elementos. El tercer elemento muestra la cadena restante.
En la funciónvegetales.split('$', 2) , la cadena se divide dos veces.La lista devuelta consta de tres elementos.
Dividir una cadena desde el final
Hay unmétodo de división en Python que divide la cadena desde el final de la cadena.La función integrada de Python rsplit() divide la cadena en la última aparición del delimitador.
Esta es la sintaxis de la función rsplit().
rsplit(“delimitador”, argumento)
Ejemplo:
rsplit(“delimitador”,1)
En la función rsplit() anterior, se pasa 1 como argumento. Por lo tanto, rompe la cadena tomando solo un delimitador del final. Si la cadena contiene más de un delimitador y si se pasa 2 como argumento, entonces la función rsplit dividirá la cadena desde el penúltimo delimitador como también desde el último delimitador.
Eliminar espacios en blanco con split ()
Los siguientes pasos lo ayudan a eliminar los espacios en blanco usando el método de división en Python .
Paso 1: divide una cadena y elimina los espacios en blanco:
Este paso implica usar el método str.split() para dividir una cadena en una lista. Utiliza un delimitador para dividir una cadena en una lista de subcadenas.
El único argumento involucrado en este método es un separador. Divide la cadena cada vez que aparece una coma.
Paso 2: usar una lista de comprensión para iterar en la lista de cadenas.
Este paso permite al usuario definir una lista de comprensión para la cual se debe iterar la lista de cadenas.
Paso 3: Usando el método str.strip():
Este paso utiliza el método str.strip() en cada iteración para eliminar cualquier espacio en blanco inicial o posterior de la cadena. El método devuelve una copia de la cadena en la que se eliminan los espacios en blanco iniciales y finales.
Principales habilidades de ciencia de datos para aprender a mejorar
SL. No | Principales habilidades de ciencia de datos para aprender | |
1 | Cursos en línea de análisis de datos | Cursos en línea de estadística inferencial |
2 | Cursos en línea de prueba de hipótesis | Cursos en línea de regresión logística |
3 | Cursos de regresión lineal | Álgebra lineal para análisis Cursos en línea |
Manejo de cadenas vacías y otros casos extremos
Al usar el método.split(), puede haber situaciones en las que la lista de salida incorpore valores faltantes o cadenas vacías. El método split() mostrará ValueError si un separador tiene una cadena vacía.
Comprendamos cómo la función dividir maneja cadenas vacías con el siguiente ejemplo.
data = “,papa,cebolla,col,,guisantes,”
vegetales = datos.split(',')
imprimir (verduras)
Producción:
[”, 'papa', 'cebolla', 'col', ”, 'guisantes', ”]
La salida anterior no es ideal debido a las cadenas vacías. Puede usar una lista de comprensión para eliminar esas cadenas vacías de la lista definida. Aquí está cómo hacerlo:
verduras = [”, 'cebolla', 'rábano', 'cilantro', ”]
verduras = [verdura por verdura en verduras si verdura != ”]
imprimir (verduras)
Producción:
['cebolla', 'rábano', 'cilantro']
Consideraciones de rendimiento
La función de división en Python ofrece una forma eficiente de analizar cadenas. La mejor manera de aprovecharlo al máximo es conocer sus consideraciones de rendimiento para una implementación precisa. Naveguemos por algunos de los más destacados:
Tamaño de la cadena: ya que dividir una cadena grande puede ser un proceso bastante lento, especialmente si la cadena no está almacenada en la memoria caché, el rendimiento de una función split() se ve significativamente afectado por el tamaño de una cadena de entrada.
Delimitador: la función split() usa expresiones regulares para dividir cadenas, lo que puede volverse más lento para delimitadores complejos.Los delimitadores simples como el espacio, el tabulador y las comas tardan menos tiempo en dividirse.
Número de divisiones: si el número de divisiones es elevado, puede hacer que la función aproveche más recursos y se ejecute más lentamente.Para limitar el número de divisiones, puede utilizar el parámetro maxsplit opcional.
Uso de memoria: la función split() genera un nuevo objeto de lista cada vez que divide una cadena.Desafíos tales como problemas de memoria seguramente ocurrirán al tratar con cadenas más grandes. Una forma de mitigar esto es mediante el uso de una expresión de generador, que no crea un nuevo objeto de lista, sino que genera las cadenas divididas sobre la marcha.
Conclusión y más oportunidades de aprendizaje.
En resumen, la función split() es una herramienta versátil que se puede utilizar en una amplia gama de programas y aplicaciones de Python. Es particularmente útil cuando se trabaja con datos de texto o cuando se manipulan cadenas.
Esperamos que nuestro blog le haya ofrecido suficiente información para fortalecer sus conceptos básicos de Python y avanzar en su carrera. Sin embargo, ¿crees que dominar los conceptos básicos es todo lo que necesitas para empezar?
Junto con el enfoque correcto, ¿qué más puede ser un combustible para avanzar en su carrera?
¡Explore oportunidades de carrera sobresalientes en el dominio de la ciencia de datos siguiendo el curso intensivo de programación de Python de upGrad !
Es extremadamente beneficioso para los aspirantes a principiantes en codificación embarcarse en una brillante carrera en ciencia de datos. Los beneficios excepcionales de seguir este curso incluyen sesiones de aclaración de dudas, preguntas de codificación de práctica, clases interactivas en vivo, aprendizaje de expertos de la industria y más.
Además de dominar la programación de Python, upGrad también lo ayuda a mejorar su carrera como científico de datos al seguir cursos como la Maestría en Ciencias en Ciencia de Datos de LJMU y el Programa Ejecutivo PG en Ciencia de Datos de IIIT Bangalore . Estos programas le permiten heredar habilidades en demanda que los expertos de la industria y los profesores líderes amplían la evaluación posterior y en profundidad.
¡Comienza tu carrera con upGrad!