Python Split Function: ภาพรวมของ Split Function ()

เผยแพร่แล้ว: 2023-05-25

สารบัญ

รู้เบื้องต้นเกี่ยวกับฟังก์ชัน split() ใน Python

ฟังก์ชันแยกใน Python เป็นเครื่องมือจัดการสตริงที่ช่วยให้คุณจัดการสตริงขนาดใหญ่ให้เป็นสตริงขนาดเล็กได้อย่างง่ายดายโดยการแยกฟังก์ชันนี้ทำงานตรงข้ามกับการต่อสตริง ซึ่งรวมสตริงต่างๆ เข้าเป็นหนึ่งเดียว จะประเมินสตริงและแยกเมื่อสังเกตตัวคั่นที่ได้รับการระบุแล้ว

หากฟังก์ชันแยกไม่พบตัวคั่นที่กำหนดไว้ล่วงหน้าใดๆ จากรายการแยกของ Python ฟังก์ชันนี้จะใช้พื้นที่สีขาวตามค่าเริ่มต้นยิ่งไปกว่านั้น ฟังก์ชันส่งคืนรายการที่ประกอบด้วยคำที่โพสต์แยกบรรทัดหรือสตริงโดยใช้สตริงตัวคั่น เช่น อักขระลูกน้ำ (,)

สงสัยว่าจะใช้ split function ใน Python ได้อย่างไร?อ่านต่อเพื่อทำความเข้าใจเกี่ยวกับฟังก์ชันนี้เพื่อการใช้งานที่ดีขึ้น!

ตรวจสอบหลักสูตรฟรีของเราเพื่อรับความได้เปรียบเหนือการแข่งขัน

ไวยากรณ์และพารามิเตอร์พื้นฐาน

นี่คือไวยากรณ์ของ ฟังก์ชันแยก Python :

string.split (คั่นสูงสุด)

มาทำความเข้าใจความหมายของแต่ละพารามิเตอร์เหล่านี้กัน:

ตัวคั่น:

ตัวคั่นบอก Python ว่าจะแยกสตริงที่ใด โดยพื้นฐานแล้ว จะทำหน้าที่เป็นตัวคั่นและแยกสตริงตามตัวคั่นที่กำหนดไว้ล่วงหน้า สตริงแยกที่ตัวคั่นที่คุณกล่าวถึง พารามิเตอร์นี้เป็นตัวเลือก ดังนั้นหากคุณไม่ระบุตัวคั่น ฟังก์ชันแยกจะใช้ช่องว่างสีขาวเป็นตัวคั่นเริ่มต้น

มันทำงานเป็น Python แยกสตริงตามอักขระ ที่กำหนดไว้ล่วงหน้า ซึ่งอยู่ระหว่างตัวแปรแต่ละตัวที่อยู่ในเอาต์พุต

แยกสูงสุด:

คุณต้องเข้าใจถึงความสำคัญของพารามิเตอร์นี้หากคุณต้องการเรียนรู้ วิธีใช้ฟังก์ชันแยกใน Pythonเป็นตัวเลขที่แจ้งว่าต้องแยกสตริงกี่ครั้ง เป็นทางเลือก ดังนั้น หากไม่ได้ระบุ ค่าดีฟอลต์คือ -1

ไม่มีการจำกัดค่าของ Maxsplit ซึ่งหมายความว่าไม่มีการจำกัดจำนวนครั้งที่สามารถแยกสตริงได้

หลังจากที่ฟังก์ชันแบ่งสตริงโดยตัวคั่นที่กล่าวถึง ฟังก์ชันจะส่งคืน รายการ สตริงของPython ที่แยกออก มา

โดยปกติแล้ว พารามิเตอร์เหล่านี้จะทำงานกับ Python แบบแยกสตริงตามอักขระ

เรียนรู้หลักสูตรวิทยาศาสตร์ข้อมูลออนไลน์จากมหาวิทยาลัยชั้นนำของโลกรับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโทเพื่อความก้าวหน้าในอาชีพของคุณ

การแยกสตริงออกเป็นรายการของสตริงย่อย

ใน Python การแยกสตริงออกเป็นรายการที่ประกอบด้วยตัวคั่นหมายความว่าเอาต์พุตจะแสดงรายการย่อยของสตริงย่อย ตัวคั่นใด ๆ สามารถทำงานเหมือนตัวคั่นใน ฟังก์ชัน Python split string เพื่อแบ่งเป็นรายการของสตริง

นี่คือตัวอย่างวิธีแยกสตริงออกเป็นรายการ :

str = “ปี-เดือน-วัน”

พิมพ์ (str.split ("-"))

นี่คือผลลัพธ์:

['ปี', 'เดือน', 'วัน']

ในตัวอย่างข้างต้นของ Python แยกสตริงตามอักขระ ตัวแปร str ถูกประกาศด้วยสตริงที่มีอักขระขีดกลาง (-) คั่นกลาง ใช้เป็นตัว คั่นการดำเนินการนี้จะแบ่งสตริงทุกครั้งที่เห็นเส้นประ เอาต์พุตที่สอดคล้องกันของสตริง Python แยกตามอักขระ คือรายการของสตริงย่อย

การระบุตัวคั่นสำหรับการแยก

ตัวคั่นเริ่มต้นใน Python split string คือช่องว่างใดๆ

ต่อไปนี้คือตัวอย่างที่แสดงวิธีระบุตัวคั่นสำหรับการแยก

subj = 'ภาษาอังกฤษ ภูมิศาสตร์ คณิตศาสตร์ GK'

พิมพ์ (subj.split (','))

ผัก = 'มันฝรั่ง$หัวหอม$กะหล่ำปลี$ถั่วลันเตา'

พิมพ์ (vegetables.split ('$'))

เอาต์พุต

['ภาษาอังกฤษ', 'ภูมิศาสตร์', 'คณิตศาสตร์', 'GK']

['มันฝรั่ง', 'หัวหอม', 'กะหล่ำปลี', 'ถั่วลันเตา']

ในตัวอย่างแรกข้างต้น ฟังก์ชัน subj.split(',') ระบุเครื่องหมายจุลภาคเป็นตัวคั่น

ในตัวอย่างที่สองด้านบนนั้น Vegetable.split('$') กล่าวถึง สัญลักษณ์ $เป็นตัวคั่น ดังนั้น เมธอด split() จะแยกสตริงที่ตัวคั่นแต่ละอันและรวมแต่ละส่วนของสตริงไว้ในรายการ

สำรวจหลักสูตรวิทยาศาสตร์ข้อมูลยอดนิยมของเรา

หลักสูตรบริหารธุรกิจบัณฑิตสาขาวิทยาศาสตร์ข้อมูลจาก IIITB หลักสูตรประกาศนียบัตรวิชาชีพด้านวิทยาศาสตร์ข้อมูลเพื่อการตัดสินใจทางธุรกิจ วิทยาศาสตรมหาบัณฑิต สาขา Data Science จาก University of Arizona
หลักสูตรประกาศนียบัตรขั้นสูงด้านวิทยาศาสตร์ข้อมูลจาก IIITB หลักสูตรประกาศนียบัตรวิชาชีพด้าน Data Science and Business Analytics จาก University of Maryland หลักสูตรวิทยาศาสตร์ข้อมูล

การจำกัดจำนวนการแยก

คุณสามารถจำกัดจำนวนการแยกได้โดยระบุตัวเลขในพารามิเตอร์ที่สองของ ฟังก์ชันการแยก Python

ตัวอย่างด้านล่างจำกัดการแยกโดยระบุตัวเลขในพารามิเตอร์ maxsplit

subj = 'ภาษาอังกฤษ ภูมิศาสตร์ คณิตศาสตร์ GK'

พิมพ์ (subj.split (',', 2))

ผัก = 'มันฝรั่ง$มะเขือเทศ$หัวหอม$ถั่วลันเตา'

พิมพ์ (vegetables.split ('$', 2))

เอาท์พุต:

['ภาษาอังกฤษ', 'ภูมิศาสตร์', 'คณิตศาสตร์, GK']

['มันฝรั่ง', 'มะเขือเทศ', 'หัวหอม$ถั่วลันเตา']

ในตัวอย่างข้างต้น subj.split(',', 2) กำหนด 2 เป็นอาร์กิวเมนต์ maxsplitดังนั้นจึงแยกสตริง subj 2 ครั้ง และวัตถุรายการมีสี่องค์ประกอบ องค์ประกอบที่สามแสดงสตริงที่เหลือ

ใน ฟังก์ชันVegetable.split('$', 2) สตริงจะถูกแบ่งสองครั้งรายการที่ส่งคืนประกอบด้วยสามองค์ประกอบ

การแยกสตริงออกจากจุดสิ้นสุด

มีวิธีการแยกใน Python ที่แยกสตริงออกจากส่วนท้ายของสตริงฟังก์ชัน Python ในตัว rsplit() แยกสตริงที่เกิดขึ้นครั้งล่าสุดของตัวคั่น

นี่คือไวยากรณ์ของฟังก์ชัน rsplit()

rsplit("ตัวคั่น", อาร์กิวเมนต์)

ตัวอย่าง:

rsplit("ตัวคั่น",1)

ในฟังก์ชัน rsplit() ข้างต้น 1 ถูกส่งผ่านเป็นอาร์กิวเมนต์ ดังนั้นจึงแบ่งสตริงโดยใช้ตัวคั่นเพียงตัวเดียวจากจุดสิ้นสุด ถ้าสตริงมีตัวคั่นมากกว่าหนึ่งตัว และถ้า 2 ถูกส่งผ่านเป็นอาร์กิวเมนต์ ฟังก์ชัน rsplit จะแยกสตริงออกจากตัวคั่นสุดท้ายตัวที่สองเช่นเดียวกับตัวคั่นสุดท้าย

การลบช่องว่างด้วย split()

ขั้นตอนต่อ ไป นี้ ช่วยให้คุณลบช่องว่างโดยใช้ วิธีการแยกใน Python

ขั้นตอนที่ 1: แยกสตริงและลบช่องว่าง:

ขั้นตอนนี้เกี่ยวข้องกับการใช้เมธอด str.split() เพื่อแยกสตริงออกเป็นรายการ ใช้ตัวคั่นเพื่อแยกสตริงออกเป็นรายการของสตริงย่อย

อาร์กิวเมนต์เดียวที่เกี่ยวข้องกับวิธีนี้คือตัวคั่น แยกสตริงทุกครั้งที่เครื่องหมายจุลภาคปรากฏขึ้น

ขั้นตอนที่ 2: ใช้รายการความเข้าใจเพื่อวนซ้ำในรายการสตริง

ขั้นตอนนี้อนุญาตให้ผู้ใช้กำหนดรายการของความเข้าใจซึ่งรายการของสตริงต้องวนซ้ำ

ขั้นตอนที่ 3: ใช้ str.strip() วิธีการ:

ขั้นตอนนี้ใช้เมธอด str.strip() ในการวนซ้ำทุกครั้งเพื่อกำจัดช่องว่างที่นำหน้าหรือตามหลังออกจากสตริง เมธอดส่งคืนสำเนาของสตริงที่ช่องว่างนำหน้าและต่อท้ายถูกลบออก

ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ เพื่อเรียนรู้เพื่อเพิ่มพูนทักษะ

ส. เลขที่ ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ ที่ต้องเรียนรู้
1 หลักสูตรออนไลน์การวิเคราะห์ข้อมูล หลักสูตรออนไลน์สถิติเชิงอนุมาน
2 หลักสูตรออนไลน์การทดสอบสมมติฐาน หลักสูตรออนไลน์การถดถอยโลจิสติก
3 หลักสูตร การถดถอยเชิงเส้น พีชคณิตเชิงเส้นสำหรับหลักสูตรออนไลน์การวิเคราะห์

การจัดการสตริงว่างและกรณีขอบอื่น ๆ

เมื่อใช้เมธอด the.split() อาจมีสถานการณ์ที่รายการเอาต์พุตรวมค่าที่ขาดหายไปหรือสตริงว่าง เมธอด split() จะแสดง ValueError ถ้าตัวคั่นมีสตริงว่าง

มาทำความเข้าใจว่าฟังก์ชันแยกจัดการกับสตริงว่างอย่างไรด้วยตัวอย่างต่อไปนี้

data = “,มันฝรั่ง,หัวหอม,กะหล่ำปลี,,ถั่วลันเตา”

ผัก = data.split (',')

พิมพ์(ผัก)

เอาท์พุต:

[”, 'มันฝรั่ง', 'หัวหอม', 'กะหล่ำปลี', ”, 'ถั่วลันเตา', ”]

เอาต์พุตด้านบนไม่เหมาะเนื่องจากสตริงว่าง คุณสามารถใช้รายการความเข้าใจเพื่อลบสตริงว่างเหล่านั้นออกจากรายการที่กำหนดไว้ นี่คือวิธีการ:

ผัก = [”, 'หัวหอม', 'หัวไชเท้า', 'ผักชี', ”]

ผัก = [ผักสำหรับผักในผัก ถ้าผัก != ”]

พิมพ์(ผัก)

เอาท์พุต:

['หัวหอม', 'หัวไชเท้า', 'ผักชี']

การพิจารณาประสิทธิภาพ

ฟังก์ชันแยกใน Python มีวิธีที่มีประสิทธิภาพในการแยกวิเคราะห์สตริง วิธีที่ดีที่สุดในการใช้ประโยชน์สูงสุดคือการทราบข้อควรพิจารณาด้านประสิทธิภาพเพื่อการใช้งานที่ถูกต้อง มาสำรวจบางส่วนที่โดดเด่นที่สุดกัน:

ขนาดของสตริง: เนื่องจากการแยกสตริงขนาดใหญ่อาจเป็นกระบวนการที่ค่อนข้างใช้เวลานาน โดยเฉพาะอย่างยิ่งหากสตริงไม่ได้แคชไว้ในหน่วยความจำ ประสิทธิภาพของฟังก์ชัน split() จะได้รับผลกระทบอย่างมากจากขนาดของสตริงอินพุต

ตัวคั่น: ฟังก์ชัน split() ใช้นิพจน์ทั่วไปเพื่อแยกสตริง ซึ่งอาจช้าลงสำหรับตัวคั่นที่ซับซ้อนตัวคั่นอย่างง่าย เช่น ช่องว่าง แท็บ และเครื่องหมายจุลภาคใช้เวลาในการแยกน้อยกว่า

จำนวนการแยก: หากจำนวนการแยกมีมาก อาจทำให้ฟังก์ชันใช้ประโยชน์จากทรัพยากรมากขึ้นและทำงานช้าลงหากต้องการจำกัดจำนวนการแยก คุณสามารถใช้พารามิเตอร์ maxsplit ที่เป็นทางเลือกได้

การใช้หน่วยความจำ: ฟังก์ชัน split() สร้างรายการใหม่ทุกครั้งที่แยกสตริงความท้าทายเช่นปัญหาหน่วยความจำมักจะเกิดขึ้นในขณะที่จัดการกับสตริงที่ใหญ่ขึ้น วิธีหนึ่งในการบรรเทาปัญหานี้คือการใช้นิพจน์ตัวสร้าง ซึ่งจะไม่สร้างวัตถุรายการใหม่ แต่สร้างสตริงแยกทันทีแทน

บทสรุปและโอกาสในการเรียนรู้เพิ่มเติม

กล่าวโดยสรุป ฟังก์ชัน split() เป็นเครื่องมืออเนกประสงค์ที่สามารถใช้ในโปรแกรมและแอปพลิเคชัน Python ที่หลากหลาย มีประโยชน์อย่างยิ่งเมื่อทำงานกับข้อมูลข้อความหรือเมื่อจัดการกับสตริง

เราหวังว่าบล็อกของเราจะให้ข้อมูลเชิงลึกที่เพียงพอแก่คุณเพื่อเสริมสร้างพื้นฐาน Python และก้าวไปสู่อาชีพการงานของคุณ อย่างไรก็ตาม คุณคิดว่าการปฏิบัติตามพื้นฐานเป็นสิ่งที่คุณจำเป็นต้องเริ่มต้นหรือไม่?

นอกจากแนวทางที่ถูกต้องแล้ว มีอะไรอีกบ้างที่สามารถเป็นแรงผลักดันให้คุณก้าวหน้าในอาชีพการงาน

สำรวจโอกาสทางอาชีพที่โดดเด่นในโดเมนวิทยาศาสตร์ข้อมูลโดยติดตาม Python Programming Bootcamp จาก upGrad !

เป็นประโยชน์อย่างยิ่งสำหรับผู้เริ่มต้นเขียนโค้ดที่ต้องการเริ่มต้นอาชีพที่สดใสในด้านวิทยาศาสตร์ข้อมูล ประโยชน์ที่โดดเด่นของการเรียนหลักสูตรนี้ ได้แก่ เซสชันการไขข้อสงสัย ฝึกเขียนคำถาม ชั้นเรียนแบบโต้ตอบสด การเรียนรู้จากผู้เชี่ยวชาญในอุตสาหกรรม และอื่นๆ

นอกเหนือจากการเขียนโปรแกรม Python อย่างเชี่ยวชาญแล้ว upGrad ยังช่วยคุณในการยกระดับอาชีพของคุณในฐานะนักวิทยาศาสตร์ข้อมูลโดยการเรียนหลักสูตรต่างๆ เช่น Master of Science in Data Science จาก LJMU และ Executive PG Program in Data Science จาก IIIT Bangalore โปรแกรมเหล่านี้ช่วยให้คุณสามารถสืบทอดทักษะที่เป็นที่ต้องการซึ่งผู้เชี่ยวชาญในอุตสาหกรรมและคณาจารย์ชั้นนำขยายเพิ่มเติมภายหลังและการประเมินเชิงลึก

เริ่มต้นอาชีพของคุณด้วย upGrad!