Python Split Function: ภาพรวมของ Split Function ()
เผยแพร่แล้ว: 2023-05-25สารบัญ
รู้เบื้องต้นเกี่ยวกับฟังก์ชัน split() ใน Python
ฟังก์ชันแยกใน Python เป็นเครื่องมือจัดการสตริงที่ช่วยให้คุณจัดการสตริงขนาดใหญ่ให้เป็นสตริงขนาดเล็กได้อย่างง่ายดายโดยการแยกฟังก์ชันนี้ทำงานตรงข้ามกับการต่อสตริง ซึ่งรวมสตริงต่างๆ เข้าเป็นหนึ่งเดียว จะประเมินสตริงและแยกเมื่อสังเกตตัวคั่นที่ได้รับการระบุแล้ว
หากฟังก์ชันแยกไม่พบตัวคั่นที่กำหนดไว้ล่วงหน้าใดๆ จากรายการแยกของ Python ฟังก์ชันนี้จะใช้พื้นที่สีขาวตามค่าเริ่มต้นยิ่งไปกว่านั้น ฟังก์ชันส่งคืนรายการที่ประกอบด้วยคำที่โพสต์แยกบรรทัดหรือสตริงโดยใช้สตริงตัวคั่น เช่น อักขระลูกน้ำ (,)
สงสัยว่าจะใช้ split function ใน Python ได้อย่างไร?อ่านต่อเพื่อทำความเข้าใจเกี่ยวกับฟังก์ชันนี้เพื่อการใช้งานที่ดีขึ้น!
ตรวจสอบหลักสูตรฟรีของเราเพื่อรับความได้เปรียบเหนือการแข่งขัน
ไวยากรณ์และพารามิเตอร์พื้นฐาน
นี่คือไวยากรณ์ของ ฟังก์ชันแยก Python :
string.split (คั่นสูงสุด)
มาทำความเข้าใจความหมายของแต่ละพารามิเตอร์เหล่านี้กัน:
ตัวคั่น:
ตัวคั่นบอก Python ว่าจะแยกสตริงที่ใด โดยพื้นฐานแล้ว จะทำหน้าที่เป็นตัวคั่นและแยกสตริงตามตัวคั่นที่กำหนดไว้ล่วงหน้า สตริงแยกที่ตัวคั่นที่คุณกล่าวถึง พารามิเตอร์นี้เป็นตัวเลือก ดังนั้นหากคุณไม่ระบุตัวคั่น ฟังก์ชันแยกจะใช้ช่องว่างสีขาวเป็นตัวคั่นเริ่มต้น
มันทำงานเป็น Python แยกสตริงตามอักขระ ที่กำหนดไว้ล่วงหน้า ซึ่งอยู่ระหว่างตัวแปรแต่ละตัวที่อยู่ในเอาต์พุต
แยกสูงสุด:
คุณต้องเข้าใจถึงความสำคัญของพารามิเตอร์นี้หากคุณต้องการเรียนรู้ วิธีใช้ฟังก์ชันแยกใน Pythonเป็นตัวเลขที่แจ้งว่าต้องแยกสตริงกี่ครั้ง เป็นทางเลือก ดังนั้น หากไม่ได้ระบุ ค่าดีฟอลต์คือ -1
ไม่มีการจำกัดค่าของ Maxsplit ซึ่งหมายความว่าไม่มีการจำกัดจำนวนครั้งที่สามารถแยกสตริงได้
หลังจากที่ฟังก์ชันแบ่งสตริงโดยตัวคั่นที่กล่าวถึง ฟังก์ชันจะส่งคืน รายการ สตริงของPython ที่แยกออก มา
โดยปกติแล้ว พารามิเตอร์เหล่านี้จะทำงานกับ Python แบบแยกสตริงตามอักขระ
เรียนรู้หลักสูตรวิทยาศาสตร์ข้อมูลออนไลน์จากมหาวิทยาลัยชั้นนำของโลกรับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโทเพื่อความก้าวหน้าในอาชีพของคุณ
การแยกสตริงออกเป็นรายการของสตริงย่อย
ใน Python การแยกสตริงออกเป็นรายการที่ประกอบด้วยตัวคั่นหมายความว่าเอาต์พุตจะแสดงรายการย่อยของสตริงย่อย ตัวคั่นใด ๆ สามารถทำงานเหมือนตัวคั่นใน ฟังก์ชัน Python split string เพื่อแบ่งเป็นรายการของสตริง
นี่คือตัวอย่างวิธีแยกสตริงออกเป็นรายการ :
str = “ปี-เดือน-วัน”
พิมพ์ (str.split ("-"))
นี่คือผลลัพธ์:
['ปี', 'เดือน', 'วัน']
ในตัวอย่างข้างต้นของ Python แยกสตริงตามอักขระ ตัวแปร str ถูกประกาศด้วยสตริงที่มีอักขระขีดกลาง (-) คั่นกลาง ใช้เป็นตัว คั่นการดำเนินการนี้จะแบ่งสตริงทุกครั้งที่เห็นเส้นประ เอาต์พุตที่สอดคล้องกันของสตริง Python แยกตามอักขระ คือรายการของสตริงย่อย
การระบุตัวคั่นสำหรับการแยก
ตัวคั่นเริ่มต้นใน Python split string คือช่องว่างใดๆ
ต่อไปนี้คือตัวอย่างที่แสดงวิธีระบุตัวคั่นสำหรับการแยก
subj = 'ภาษาอังกฤษ ภูมิศาสตร์ คณิตศาสตร์ GK'
พิมพ์ (subj.split (','))
ผัก = 'มันฝรั่ง$หัวหอม$กะหล่ำปลี$ถั่วลันเตา'
พิมพ์ (vegetables.split ('$'))
เอาต์พุต
['ภาษาอังกฤษ', 'ภูมิศาสตร์', 'คณิตศาสตร์', 'GK']
['มันฝรั่ง', 'หัวหอม', 'กะหล่ำปลี', 'ถั่วลันเตา']
ในตัวอย่างแรกข้างต้น ฟังก์ชัน subj.split(',') ระบุเครื่องหมายจุลภาคเป็นตัวคั่น
ในตัวอย่างที่สองด้านบนนั้น Vegetable.split('$') กล่าวถึง สัญลักษณ์ $เป็นตัวคั่น ดังนั้น เมธอด split() จะแยกสตริงที่ตัวคั่นแต่ละอันและรวมแต่ละส่วนของสตริงไว้ในรายการ
สำรวจหลักสูตรวิทยาศาสตร์ข้อมูลยอดนิยมของเรา
หลักสูตรบริหารธุรกิจบัณฑิตสาขาวิทยาศาสตร์ข้อมูลจาก IIITB | หลักสูตรประกาศนียบัตรวิชาชีพด้านวิทยาศาสตร์ข้อมูลเพื่อการตัดสินใจทางธุรกิจ | วิทยาศาสตรมหาบัณฑิต สาขา Data Science จาก University of Arizona |
หลักสูตรประกาศนียบัตรขั้นสูงด้านวิทยาศาสตร์ข้อมูลจาก IIITB | หลักสูตรประกาศนียบัตรวิชาชีพด้าน Data Science and Business Analytics จาก University of Maryland | หลักสูตรวิทยาศาสตร์ข้อมูล |
การจำกัดจำนวนการแยก
คุณสามารถจำกัดจำนวนการแยกได้โดยระบุตัวเลขในพารามิเตอร์ที่สองของ ฟังก์ชันการแยก Python
ตัวอย่างด้านล่างจำกัดการแยกโดยระบุตัวเลขในพารามิเตอร์ maxsplit
subj = 'ภาษาอังกฤษ ภูมิศาสตร์ คณิตศาสตร์ GK'
พิมพ์ (subj.split (',', 2))
ผัก = 'มันฝรั่ง$มะเขือเทศ$หัวหอม$ถั่วลันเตา'
พิมพ์ (vegetables.split ('$', 2))
เอาท์พุต:
['ภาษาอังกฤษ', 'ภูมิศาสตร์', 'คณิตศาสตร์, GK']
['มันฝรั่ง', 'มะเขือเทศ', 'หัวหอม$ถั่วลันเตา']
ในตัวอย่างข้างต้น subj.split(',', 2) กำหนด 2 เป็นอาร์กิวเมนต์ maxsplitดังนั้นจึงแยกสตริง subj 2 ครั้ง และวัตถุรายการมีสี่องค์ประกอบ องค์ประกอบที่สามแสดงสตริงที่เหลือ
ใน ฟังก์ชันVegetable.split('$', 2) สตริงจะถูกแบ่งสองครั้งรายการที่ส่งคืนประกอบด้วยสามองค์ประกอบ
การแยกสตริงออกจากจุดสิ้นสุด
มีวิธีการแยกใน Python ที่แยกสตริงออกจากส่วนท้ายของสตริงฟังก์ชัน Python ในตัว rsplit() แยกสตริงที่เกิดขึ้นครั้งล่าสุดของตัวคั่น
นี่คือไวยากรณ์ของฟังก์ชัน rsplit()
rsplit("ตัวคั่น", อาร์กิวเมนต์)
ตัวอย่าง:
rsplit("ตัวคั่น",1)
ในฟังก์ชัน rsplit() ข้างต้น 1 ถูกส่งผ่านเป็นอาร์กิวเมนต์ ดังนั้นจึงแบ่งสตริงโดยใช้ตัวคั่นเพียงตัวเดียวจากจุดสิ้นสุด ถ้าสตริงมีตัวคั่นมากกว่าหนึ่งตัว และถ้า 2 ถูกส่งผ่านเป็นอาร์กิวเมนต์ ฟังก์ชัน rsplit จะแยกสตริงออกจากตัวคั่นสุดท้ายตัวที่สองเช่นเดียวกับตัวคั่นสุดท้าย
การลบช่องว่างด้วย split()
ขั้นตอนต่อ ไป นี้ ช่วยให้คุณลบช่องว่างโดยใช้ วิธีการแยกใน Python
ขั้นตอนที่ 1: แยกสตริงและลบช่องว่าง:
ขั้นตอนนี้เกี่ยวข้องกับการใช้เมธอด str.split() เพื่อแยกสตริงออกเป็นรายการ ใช้ตัวคั่นเพื่อแยกสตริงออกเป็นรายการของสตริงย่อย
อาร์กิวเมนต์เดียวที่เกี่ยวข้องกับวิธีนี้คือตัวคั่น แยกสตริงทุกครั้งที่เครื่องหมายจุลภาคปรากฏขึ้น
ขั้นตอนที่ 2: ใช้รายการความเข้าใจเพื่อวนซ้ำในรายการสตริง
ขั้นตอนนี้อนุญาตให้ผู้ใช้กำหนดรายการของความเข้าใจซึ่งรายการของสตริงต้องวนซ้ำ
ขั้นตอนที่ 3: ใช้ str.strip() วิธีการ:
ขั้นตอนนี้ใช้เมธอด str.strip() ในการวนซ้ำทุกครั้งเพื่อกำจัดช่องว่างที่นำหน้าหรือตามหลังออกจากสตริง เมธอดส่งคืนสำเนาของสตริงที่ช่องว่างนำหน้าและต่อท้ายถูกลบออก
ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ เพื่อเรียนรู้เพื่อเพิ่มพูนทักษะ
ส. เลขที่ | ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ ที่ต้องเรียนรู้ | |
1 | หลักสูตรออนไลน์การวิเคราะห์ข้อมูล | หลักสูตรออนไลน์สถิติเชิงอนุมาน |
2 | หลักสูตรออนไลน์การทดสอบสมมติฐาน | หลักสูตรออนไลน์การถดถอยโลจิสติก |
3 | หลักสูตร การถดถอยเชิงเส้น | พีชคณิตเชิงเส้นสำหรับหลักสูตรออนไลน์การวิเคราะห์ |
การจัดการสตริงว่างและกรณีขอบอื่น ๆ
เมื่อใช้เมธอด the.split() อาจมีสถานการณ์ที่รายการเอาต์พุตรวมค่าที่ขาดหายไปหรือสตริงว่าง เมธอด split() จะแสดง ValueError ถ้าตัวคั่นมีสตริงว่าง
มาทำความเข้าใจว่าฟังก์ชันแยกจัดการกับสตริงว่างอย่างไรด้วยตัวอย่างต่อไปนี้
data = “,มันฝรั่ง,หัวหอม,กะหล่ำปลี,,ถั่วลันเตา”
ผัก = data.split (',')
พิมพ์(ผัก)
เอาท์พุต:
[”, 'มันฝรั่ง', 'หัวหอม', 'กะหล่ำปลี', ”, 'ถั่วลันเตา', ”]
เอาต์พุตด้านบนไม่เหมาะเนื่องจากสตริงว่าง คุณสามารถใช้รายการความเข้าใจเพื่อลบสตริงว่างเหล่านั้นออกจากรายการที่กำหนดไว้ นี่คือวิธีการ:
ผัก = [”, 'หัวหอม', 'หัวไชเท้า', 'ผักชี', ”]
ผัก = [ผักสำหรับผักในผัก ถ้าผัก != ”]
พิมพ์(ผัก)
เอาท์พุต:
['หัวหอม', 'หัวไชเท้า', 'ผักชี']
การพิจารณาประสิทธิภาพ
ฟังก์ชันแยกใน Python มีวิธีที่มีประสิทธิภาพในการแยกวิเคราะห์สตริง วิธีที่ดีที่สุดในการใช้ประโยชน์สูงสุดคือการทราบข้อควรพิจารณาด้านประสิทธิภาพเพื่อการใช้งานที่ถูกต้อง มาสำรวจบางส่วนที่โดดเด่นที่สุดกัน:
ขนาดของสตริง: เนื่องจากการแยกสตริงขนาดใหญ่อาจเป็นกระบวนการที่ค่อนข้างใช้เวลานาน โดยเฉพาะอย่างยิ่งหากสตริงไม่ได้แคชไว้ในหน่วยความจำ ประสิทธิภาพของฟังก์ชัน split() จะได้รับผลกระทบอย่างมากจากขนาดของสตริงอินพุต
ตัวคั่น: ฟังก์ชัน split() ใช้นิพจน์ทั่วไปเพื่อแยกสตริง ซึ่งอาจช้าลงสำหรับตัวคั่นที่ซับซ้อนตัวคั่นอย่างง่าย เช่น ช่องว่าง แท็บ และเครื่องหมายจุลภาคใช้เวลาในการแยกน้อยกว่า
จำนวนการแยก: หากจำนวนการแยกมีมาก อาจทำให้ฟังก์ชันใช้ประโยชน์จากทรัพยากรมากขึ้นและทำงานช้าลงหากต้องการจำกัดจำนวนการแยก คุณสามารถใช้พารามิเตอร์ maxsplit ที่เป็นทางเลือกได้
การใช้หน่วยความจำ: ฟังก์ชัน split() สร้างรายการใหม่ทุกครั้งที่แยกสตริงความท้าทายเช่นปัญหาหน่วยความจำมักจะเกิดขึ้นในขณะที่จัดการกับสตริงที่ใหญ่ขึ้น วิธีหนึ่งในการบรรเทาปัญหานี้คือการใช้นิพจน์ตัวสร้าง ซึ่งจะไม่สร้างวัตถุรายการใหม่ แต่สร้างสตริงแยกทันทีแทน
บทสรุปและโอกาสในการเรียนรู้เพิ่มเติม
กล่าวโดยสรุป ฟังก์ชัน split() เป็นเครื่องมืออเนกประสงค์ที่สามารถใช้ในโปรแกรมและแอปพลิเคชัน Python ที่หลากหลาย มีประโยชน์อย่างยิ่งเมื่อทำงานกับข้อมูลข้อความหรือเมื่อจัดการกับสตริง
เราหวังว่าบล็อกของเราจะให้ข้อมูลเชิงลึกที่เพียงพอแก่คุณเพื่อเสริมสร้างพื้นฐาน Python และก้าวไปสู่อาชีพการงานของคุณ อย่างไรก็ตาม คุณคิดว่าการปฏิบัติตามพื้นฐานเป็นสิ่งที่คุณจำเป็นต้องเริ่มต้นหรือไม่?
นอกจากแนวทางที่ถูกต้องแล้ว มีอะไรอีกบ้างที่สามารถเป็นแรงผลักดันให้คุณก้าวหน้าในอาชีพการงาน
สำรวจโอกาสทางอาชีพที่โดดเด่นในโดเมนวิทยาศาสตร์ข้อมูลโดยติดตาม Python Programming Bootcamp จาก upGrad !
เป็นประโยชน์อย่างยิ่งสำหรับผู้เริ่มต้นเขียนโค้ดที่ต้องการเริ่มต้นอาชีพที่สดใสในด้านวิทยาศาสตร์ข้อมูล ประโยชน์ที่โดดเด่นของการเรียนหลักสูตรนี้ ได้แก่ เซสชันการไขข้อสงสัย ฝึกเขียนคำถาม ชั้นเรียนแบบโต้ตอบสด การเรียนรู้จากผู้เชี่ยวชาญในอุตสาหกรรม และอื่นๆ
นอกเหนือจากการเขียนโปรแกรม Python อย่างเชี่ยวชาญแล้ว upGrad ยังช่วยคุณในการยกระดับอาชีพของคุณในฐานะนักวิทยาศาสตร์ข้อมูลโดยการเรียนหลักสูตรต่างๆ เช่น Master of Science in Data Science จาก LJMU และ Executive PG Program in Data Science จาก IIIT Bangalore โปรแกรมเหล่านี้ช่วยให้คุณสามารถสืบทอดทักษะที่เป็นที่ต้องการซึ่งผู้เชี่ยวชาญในอุตสาหกรรมและคณาจารย์ชั้นนำขยายเพิ่มเติมภายหลังและการประเมินเชิงลึก
เริ่มต้นอาชีพของคุณด้วย upGrad!