13 โครงการ Python ที่น่าตื่นเต้นบน Github ที่คุณควรลองวันนี้ [2022]

เผยแพร่แล้ว: 2021-01-08

Python เป็นหนึ่งในตัวเลือกอันดับต้น ๆ ในภาษาการเขียนโปรแกรมในหมู่มืออาชีพทั่วโลก ไวยากรณ์ตรงไปตรงมาช่วยให้นักพัฒนาซอฟต์แวร์และนักวิทยาศาสตร์ข้อมูลสามารถรับทักษะใหม่ ๆ ได้อย่างง่ายดาย คุณยังสามารถค้นหา โครงการ Python จำนวนมากบน GitHub เพื่อ ฝึกฝนและเรียนรู้ในขณะทำ

สารบัญ

ทำไมต้องเป็นโครงการ Python

ตลาดงานมีความต้องการมืออาชีพที่มีทักษะ Python สูง แต่มีผู้สมัครไม่มากที่ให้ความสนใจกับข้อดีของการใช้งาน มีห้องสมุดสนับสนุนที่กว้างขวางและโครงสร้างข้อมูลที่ใช้งานง่าย และในช่วงหลายปีที่ผ่านมา เครื่องมือนี้ได้กลายเป็นเครื่องมือที่ยอดเยี่ยมสำหรับการสร้างแอปพลิเคชันบรรทัดคำสั่ง การเรียนรู้หลามเป็นส่วนสำคัญของหลักสูตรวิทยาศาสตร์ข้อมูลที่ดี

คุณจะพบตัวอย่างโอเพนซอร์ซต่างๆ หากคุณดู โปรเจ็ก ต์ Python บน GitHub ที่เก็บข้อมูลมีบางอย่างสำหรับทุกคน ตั้งแต่การสร้างเครื่องกำเนิดรหัสผ่านอย่างง่ายไปจนถึงงานประจำอัตโนมัติและการขุดข้อมูล Twitter สำหรับผู้เริ่มต้น วิธีการเรียนรู้ตามกิจกรรมสามารถทำสิ่งมหัศจรรย์ได้ มันสามารถช่วยให้คุณเข้าใจถึงส่วนลึกของภาษา เช่น เฟรมเวิร์กเว็บของ Pandas และ Django และสถาปัตยกรรมหลายกระบวนการ งั้นก็ดำดิ่งลงไปเลย

โครงการ Python บน GitHub

1. สีม่วงแดง

โครงการวิจัย Python นี้เข้าใกล้การเรียนรู้ด้วยเครื่องผ่านการแสดงออกทางศิลปะ เริ่มต้นโดยทีมงานที่ Google Brain โดย Magenta มีศูนย์กลางอยู่ที่อัลกอริธึมการเรียนรู้เชิงลึกและการเสริมแรงที่สามารถสร้างภาพวาด ดนตรี และอื่นๆ ได้ สมุดบันทึกสำหรับการทำงานร่วมกันจะแนะนำให้คุณรู้จักกับรายละเอียดทางเทคนิคของเครื่องมืออัจฉริยะนี้ซึ่งมีจุดมุ่งหมายเพื่อขยายผลงานของผู้สร้างดั้งเดิม

Modiply เป็นอีกตัวอย่างหนึ่งของเซิร์ฟเวอร์เพลงที่ขยายได้ซึ่งคุณสามารถค้นหาได้อย่างอิสระบน GitHub

2. โฟตอน

เป็นโปรแกรมรวบรวมข้อมูลที่รวดเร็วซึ่งออกแบบมาสำหรับเครื่องมือ โอเพ่นซอร์สอัจฉริยะ (OSINT) แนวคิด OSINT เกี่ยวข้องกับการรวบรวมข้อมูลจากแหล่งที่เปิดเผยต่อสาธารณะเพื่อใช้ในบริบทของข่าวกรอง ด้วย Photon คุณสามารถดำเนินการฟังก์ชันรวบรวมข้อมูลได้หลายอย่าง รวมถึงการดึงข้อมูลต่อไปนี้:

  • URL ที่อยู่ในขอบเขตและนอกขอบเขต
  • URL ที่มีพารามิเตอร์
  • อีเมลและบัญชีโซเชียลมีเดีย
  • XML, pdf, png และไฟล์อื่นๆ
  • ถังอเมซอน ฯลฯ

3. Mailpile

โครงการ GitHub นี้เป็นที่รู้จักในด้านฟังก์ชันการเข้ารหัสที่ล้ำสมัย เป็นเครื่องมือความเป็นส่วนตัวที่ได้รับการสนับสนุนจากชุมชนขนาดใหญ่ โดยหลักแล้ว จะอนุญาตให้คุณส่งและรับอีเมลอิเล็กทรอนิกส์ที่เข้ารหัส PGP

เสิร์ชเอ็นจิ้นที่รวดเร็วของ Mailpile สามารถจัดการข้อมูลอีเมลจำนวนมากและจัดระเบียบในอินเทอร์เฟซเว็บที่สะอาดตา ใช้กฎคงที่หรือตัวแยกประเภทแบบเบย์สำหรับการติดแท็กอัตโนมัติ ดูซอฟต์แวร์ฟรีและการสาธิตสดบนเว็บไซต์เพื่อหาข้อมูลเพิ่มเติม!

อ่านเกี่ยวกับ: Git vs Github: ความแตกต่างระหว่าง Git และ Github

4. XSStrike

การเขียนสคริปต์ข้ามไซต์หรือ XSS เป็นช่องโหว่ด้านความปลอดภัยที่พบในเว็บแอปพลิเคชัน การโจมตี XSS จะแทรกสคริปต์ฝั่งไคลเอ็นต์ซึ่งมักจะเป็นอันตรายลงในหน้าเว็บที่ไม่เป็นอันตราย ดังนั้น ชุด XSStrike ได้รับการพัฒนาเพื่อตรวจจับและใช้ประโยชน์จากการโจมตีดังกล่าว เครื่องมือโอเพนซอร์ซนี้มีคุณสมบัติดังต่อไปนี้:

  • สี่ parsers ที่เขียนด้วยลายมือ
  • เครื่องกำเนิดน้ำหนักบรรทุกอัจฉริยะ
  • เครื่องยนต์ฟัซซิ่งที่มีประสิทธิภาพ
  • โปรแกรมรวบรวมข้อมูลที่รวดเร็ว

ด้วยส่วนต่างๆ ข้างต้น จะวิเคราะห์การตอบสนองและน้ำหนักบรรทุกของงานฝีมือ นอกจากนี้ยังสามารถทำการวิเคราะห์บริบทอย่างมีประสิทธิภาพด้วยฟิวเซอร์ในตัว

5. ดาวน์โหลด Google รูปภาพ

โปรแกรมหลามบรรทัดคำสั่งนี้สามารถค้นหาและดาวน์โหลดภาพ Google ได้หลายร้อยภาพ สคริปต์สามารถค้นหาคำสำคัญและวลีและดาวน์โหลดไฟล์รูปภาพได้ ดาวน์โหลด Google รูปภาพเข้ากันได้กับ Python เวอร์ชัน 2.x และ 3.x คุณสามารถจำลองซอร์สโค้ดของโปรเจ็กต์นี้เพื่อฝึกฝนทักษะการเขียนโปรแกรมของคุณและทำความเข้าใจการนำไปใช้ในโลกแห่งความเป็นจริง

6. โครงการหมีแพนด้า

เมื่อพูดถึงการวิเคราะห์และจัดการข้อมูลที่ยืดหยุ่น ไลบรารี Pandas พิสูจน์ได้ว่าเป็นแหล่งข้อมูลที่ยอดเยี่ยม โครงสร้างข้อมูลที่แสดงออกมีประโยชน์มากกว่าทางเลือกอื่นๆ ลองดูที่บางส่วนของพวกเขาด้านล่าง

  • ความยืดหยุ่นในการทำงานกับข้อมูลเชิงสัมพันธ์/ติดฉลาก
  • การจัดการข้อมูลที่ขาดหายไปและการเปลี่ยนแปลงขนาดที่สะดวก
  • การทำงานของชุดข้อมูลที่ใช้งานง่าย รวมถึงการผสาน การปรับรูปร่าง และการหมุนรอบ
  • คุณสมบัติการจัดตำแหน่งข้อมูลอัตโนมัติพร้อมความสามารถเพิ่มเติม

ขณะดูโค้ดเบสของแพนด้า คุณจะพบปัญหาต่างๆ ในเอกสารประกอบ นี้อาจแจ้งให้คุณร่วมคิดของคุณเองและปรับปรุงเครื่องมือที่มีอยู่ คุณสามารถค้นหาแพ็คเกจโอเพ่นซอร์สบน GitHub พร้อมกับแพ็คเกจอื่นๆ เช่น Django และ Keras ที่เปิดใช้งานการทดลองอย่างรวดเร็ว

7. Xonsh

แอปพลิเคชันแบบโต้ตอบต้องการล่ามบรรทัดคำสั่งเช่น Unix ระบบปฏิบัติการดังกล่าวควบคุมการดำเนินการโดยใช้เชลล์สคริปต์ ตอนนี้ แทนที่จะทำการแลกเปลี่ยน มันจะสะดวกกว่านี้ไหมถ้าเชลล์ของคุณสามารถเข้าใจภาษาการเขียนโปรแกรมที่ปรับขนาดได้มากกว่านี้ ในที่นี้เข้าสู่ Xonsh (ออกเสียงว่า 'Konk')

เป็นภาษาเชลล์ที่ขับเคลื่อนด้วย Python และสั่งการได้ทันที ภาษาข้ามแพลตฟอร์มนี้สามารถเขียนสคริปต์ได้อย่างง่ายดายและมาพร้อมกับไลบรารีมาตรฐานและประเภทของตัวแปรมากมาย Xonsh ยังมีระบบการจัดการสภาพแวดล้อมเสมือนของตัวเองที่เรียกว่า vox

8. มานิม

Manim ย่อมาจาก Mathematical Animation Engine โปรเจ็กต์นี้เกี่ยวกับการสร้างวิดีโออธิบายโดยทางโปรแกรม โปรแกรมทำงานบน Python 3.7 และสร้างเนื้อหาวิดีโอแอนิเมชั่น ครอบคลุมหัวข้อที่ซับซ้อนด้วยภาพประกอบและกราฟที่แสดง คุณสามารถรับชมวิดีโอเหล่านี้ได้ที่ช่อง 3Blue1Brown YouTube

ซอร์สโค้ดสำหรับ Manim มีให้ใช้ฟรีบน GitHub คุณยังสามารถอ้างถึงบทช่วยสอนออนไลน์เพื่อเรียนรู้วิธีติดตั้งแพ็คเกจ เรียกใช้โครงการ และสร้างโครงการส่วนบุคคลอย่างง่าย

อ่าน: แนวคิดและหัวข้อโครงการวิทยาศาสตร์ข้อมูล

9. การวิเคราะห์บาสเก็ตบอล AI

โปรเจ็กต์นี้สร้างขึ้นจากแนวคิดการตรวจจับวัตถุ แอปพลิเคชั่นปัญญาประดิษฐ์ขุดลงในข้อมูลที่รวบรวมเพื่อวิเคราะห์ภาพบาสเก็ตบอล คุณสามารถค้นหาเว็บแอป AI และ API ได้อย่างง่ายดายภายใต้ โครงการ Python บน GitHub ให้เราดูว่าเครื่องมือทำงานอย่างไร:

  • คุณอัปโหลดไฟล์ไปยังเว็บแอป
  • หรือคุณสามารถส่งคำขอ POST ไปยัง API
  • ไลบรารี OpenPose ใช้การคำนวณ
  • เว็บแอปสร้างผลลัพธ์ตามข้อมูลท่าถ่ายภาพ

10. รีบาวน์

เป็นเรื่องปกติที่ซอร์สโค้ดของโปรแกรมคอมพิวเตอร์จะพบข้อผิดพลาดของคอมไพเลอร์ การรีบาวด์สามารถดึงผลลัพธ์ของ StackOverflow ในสถานการณ์ดังกล่าวได้ทันที เป็นเครื่องมือบรรทัดคำสั่งที่เขียนด้วยภาษา Python และสร้างขึ้นบนอินเทอร์เฟซผู้ใช้คอนโซล Urwid หากคุณเลือกที่จะใช้โปรเจ็กต์นี้ คุณสามารถเรียนรู้ว่าแพ็คเกจ Beautiful Soup ขูดเนื้อหา StackOverflow ได้อย่างไร คุณยังสามารถทำความคุ้นเคยกับกระบวนการย่อยที่จับข้อผิดพลาดของคอมไพเลอร์ได้อีกด้วย

11. NeutralTalk

คุณสามารถปรับแต่งความรู้ของคุณเกี่ยวกับโครงข่ายประสาทเทียมที่เกิดซ้ำต่อเนื่องหลายรูปแบบด้วย NeutralTalk เป็นโปรเจ็กต์ Python และ NumPy ที่เน้นการอธิบายรูปภาพ

โดยทั่วไป วิธีการสร้างคำบรรยายภาพจะเกี่ยวข้องกับการมองเห็นด้วยคอมพิวเตอร์และการประมวลผลภาษาธรรมชาติ ระบบสามารถเข้าใจฉากและสร้างคำอธิบายของเนื้อหาที่สังเกตได้ในรูปภาพ

หากคุณกำลังมองหาโค้ดคำอธิบายภาพล่าสุด คุณสามารถอ้างอิงถึง NeutralTalk2 โปรเจ็กต์นี้เขียนด้วยภาษา Lua ซึ่งเป็นภาษาโปรแกรมระดับสูงที่มีน้ำหนักเบาและเร็วกว่าเวอร์ชันดั้งเดิม

12. โครงการ TensorFlow

TensorFlow เป็นไลบรารี Python ที่ใช้สำหรับสร้างโมเดลการเรียนรู้เชิงลึก ที่เก็บ Model Garden รวบรวมตัวอย่างโค้ดจำนวนมากสำหรับผู้ใช้ TensorFlow ไว้ในที่เดียว โดยมีจุดมุ่งหมายเพื่อแสดงแนวทางปฏิบัติที่ดีที่สุดสำหรับการวิจัยและพัฒนาผลิตภัณฑ์ในขณะที่จัดเตรียมแบบจำลองสำเร็จรูปที่พร้อมใช้งาน ด้วยความช่วยเหลือจากแหล่งข้อมูลอย่างเป็นทางการนี้ คุณสามารถสำรวจวิธีการใช้การฝึกอบรมแบบกระจายและแก้ปัญหาคอมพิวเตอร์วิทัศน์และปัญหา NLP

13. ผู้นำเข้าโมเดลแผนที่

Maps Models Importer ทำงานโดยการนำเข้าโมเดล 3 มิติจากแผนที่ที่กว้างขวาง เป็นเครื่องมือทดลองที่มีเพียง Add-on ของ Blender และกระบวนการนี้ต้องใช้ซอฟต์แวร์เนื้อหา 3 มิติ เช่น Google Maps ในโครงการนี้ คุณจะคุ้นเคยกับการนำเข้าโมเดลจาก Google Maps

อ่านเพิ่มเติม: แนวคิดและหัวข้อโครงการ Python สำหรับผู้เริ่มต้น

ขอบเขตในอนาคตสำหรับ Python

อุตสาหกรรมสมัยใหม่กำลังมองหาการค้นหารูปแบบที่ซ่อนอยู่จากกลุ่มข้อมูลมากขึ้น นอกจากนี้ เทคโนโลยีเกิดใหม่ เช่น ปัญญาประดิษฐ์และแมชชีนเลิร์นนิงยังเพิ่มความสามารถและความซับซ้อนใหม่ๆ ให้กับภูมิทัศน์ และภาษาระดับสูงอย่าง Python ก็เป็นส่วนสำคัญในการพัฒนาซอฟต์แวร์และขั้นตอนการวิเคราะห์

โดยปกติ ผู้สรรหาบุคลากรในปัจจุบันให้ความสำคัญกับทักษะ Python อย่างมาก เมื่อพวกเขาจ้างสำหรับบทบาทเช่นนักวิทยาศาสตร์ข้อมูล นักวิเคราะห์ข้อมูล/การวิจัย นักพัฒนา Python วิศวกร DevOps ฯลฯ ข้อเสนอด้านเทคโนโลยีอย่าง Google, Facebook, Spotify, Netflix, Dropbox และ Reddit ตัวเลือกอาชีพที่ร่ำรวยสำหรับผู้สมัครด้วยการฝึกอบรมภาคปฏิบัติ

เราหวังว่าคุณจะสามารถขัดเกลาทักษะการเขียนโปรแกรมของคุณด้วยรายการด้านบนใน โครงการ Python บน GitHub ในขณะที่ตลาดบิ๊กดาต้ามีวิวัฒนาการและขยายตัวต่อไป ชุมชนโอเพ่นซอร์สของ Python คาดว่าจะปล่อยไลบรารี่เพิ่มมากขึ้นในอีกไม่กี่ปีข้างหน้า ดังนั้นติดตามข่าวสารและเรียนรู้ต่อไป!

หากคุณอยากเรียนรู้เกี่ยวกับวิทยาศาสตร์ข้อมูล ลองดูโปรแกรม Executive PG ของ IIIT-B & upGrad ใน Data Science ซึ่งสร้างขึ้นสำหรับมืออาชีพที่ทำงานและมีกรณีศึกษาและโครงการมากกว่า 10 รายการ เวิร์กช็อปภาคปฏิบัติจริง การให้คำปรึกษากับผู้เชี่ยวชาญในอุตสาหกรรม 1 -on-1 พร้อมที่ปรึกษาในอุตสาหกรรม การเรียนรู้มากกว่า 400 ชั่วโมงและความช่วยเหลือด้านงานกับบริษัทชั้นนำ

แนวคิดโครงงานแมชชีนเลิร์นนิงสำหรับผู้เริ่มต้นมีอะไรบ้าง

ด้านล่างนี้คือโปรเจ็กต์ Ml ที่น่าสนใจบางโปรเจ็กต์ที่ใช้ Python เป็นภาษาโปรแกรมหลัก: ทวีตบางรายการอาจดูไม่เหมาะสมสำหรับผู้ชมแต่ละกลุ่ม และสามารถใช้ Tweets Sorting Tool เพื่อหลีกเลี่ยงปัญหาเหล่านั้นได้ โปรเจ็กต์แมชชีนเลิร์นนิงนี้จะกรองทวีตตามคีย์เวิร์ดบางคำ การทำงานกับโครงข่ายประสาทเทียมเป็นหนึ่งในโดเมนที่ดีที่สุดในการทดสอบแนวคิดการเรียนรู้ของเครื่อง ตัวแยกประเภทอักขระที่เขียนด้วยลายมือทำงานบนโครงข่ายประสาทเทียมเพื่อระบุตัวอักษรภาษาอังกฤษที่เขียนด้วยลายมือจาก AZ โมเดลการวิเคราะห์ความรู้สึกใช้เพื่อตรวจจับและระบุความรู้สึกและความรู้สึกของบุคคลหลังโพสต์หรือรูปภาพที่โพสต์บนโซเชียลมีเดีย นี่เป็นโครงการระดับเริ่มต้นที่ดีและคุณสามารถรับข้อมูลจาก Reddit หรือ Twitter ได้

อธิบายองค์ประกอบหลักที่โครงการ Python ควรมี

ส่วนประกอบต่อไปนี้เน้นสถาปัตยกรรมทั่วไปที่สุดของโครงการ Python - คำชี้แจงปัญหาเป็นองค์ประกอบพื้นฐานที่ใช้โครงการทั้งหมด กำหนดปัญหาที่แบบจำลองของคุณจะแก้ไขและอภิปรายถึงแนวทางที่โครงการของคุณจะปฏิบัติตาม ชุดข้อมูลเป็นองค์ประกอบที่สำคัญมากสำหรับโครงการของคุณ และควรเลือกอย่างระมัดระวัง ควรใช้ชุดข้อมูลที่ใหญ่เพียงพอจากแหล่งที่เชื่อถือได้สำหรับโปรเจ็กต์เท่านั้น อัลกอริทึมที่คุณใช้ในการวิเคราะห์ข้อมูลและคาดการณ์ผลลัพธ์ เทคนิคอัลกอริทึมยอดนิยม ได้แก่ อัลกอริทึมการถดถอย ต้นไม้การถดถอย อัลกอริธึม Naive Bayes และการหาปริมาณเวกเตอร์

Python สามารถใช้สำหรับโปรเจ็กต์การประมวลผลภาพได้หรือไม่ และถ้าใช่ สามารถใช้ไลบรารี Python ใดได้บ้าง

ต่อไปนี้เป็นไลบรารี Python ชั้นนำบางส่วนที่ทำให้การสร้างโปรเจ็กต์การประมวลผลภาพสะดวกมาก OpenCV เป็นไลบรารี Python ที่ได้รับความนิยมและใช้กันอย่างแพร่หลายสำหรับงานด้านการมองเห็นเช่นการประมวลผลภาพและวัตถุและการตรวจจับใบหน้า การสนทนาผ่านไลบรารีการประมวลผลภาพ Python จะไม่สมบูรณ์หากไม่มี Sci-Kit Image เป็นไลบรารีที่เรียบง่ายและตรงไปตรงมาที่สามารถใช้กับงานวิชันซิสเต็มคอมพิวเตอร์ได้ SciPy ใช้เป็นหลักในการคำนวณทางคณิตศาสตร์ แต่ก็สามารถประมวลผลภาพได้เช่นกัน การตรวจจับใบหน้า Convolution และ Image Segmentation เป็นคุณสมบัติบางอย่างที่ SciPy มีให้