Library di Python Dijelaskan: Daftar Library Penting

Diterbitkan: 2021-06-14

Daftar isi

Apa itu perpustakaan?

Pustaka adalah kumpulan kode yang sebelumnya digabungkan yang dapat digunakan secara berulang, sehingga mengurangi waktu. Seperti yang disarankan oleh istilah itu, ini mirip dengan perpustakaan fisik yang menyimpan sumber daya yang dapat digunakan kembali. Python telah mendirikan beberapa perpustakaan sumber terbuka berdasarkan fakta bahwa setiap perpustakaan memiliki sumber root.

Apa itu Library Python?

Python telah banyak digunakan di masa sekarang sebagai bahasa pemrograman tingkat tinggi. Kemudahan penggunaan terletak pada sintaksnya yang menggunakan lebih sedikit kode untuk mengekspresikan suatu konsep. Oleh karena itu, ini memungkinkan pengguna untuk menerapkan python dan menulis program pada skala besar dan kecil. Bahasa ini mendukung manajemen memori otomatis dan memiliki perpustakaan standar yang besar.

Pustaka Python mendefinisikan baris kode yang dapat digunakan kembali di program lain. Ini pada dasarnya adalah kumpulan modul. Kegunaannya terletak pada kenyataan bahwa kode baru tidak perlu ditulis setiap kali proses yang sama diperlukan untuk dijalankan. Perpustakaan di Python memainkan peran penting dalam bidang ilmu data, pembelajaran mesin, aplikasi manipulasi data, dll.

Pustaka standar Python

Kehidupan seorang programmer menjadi mudah dengan tersedianya sejumlah besar library standar di python. Ini terutama karena programmer tidak diharuskan untuk terus menulis kode. Misalnya, seorang programmer dapat menggunakan perpustakaan MySQLdb untuk menghubungkan database MySQL ke server. Pustaka python sebagian besar ditulis dalam bahasa pemrograman C yang menangani operasi seperti I/O dan modul inti lainnya. Pustaka standar terdiri dari lebih dari 200 modul inti dan sekitar 137.000 pustaka python telah dikembangkan hingga saat ini.

Pustaka Python Penting

1. Matplotlib

Pustaka ini digunakan untuk memplot data numerik dan digunakan dalam analisis data. Pustaka sumber terbuka ini digunakan untuk menerbitkan gambar berkualitas tinggi seperti grafik, diagram lingkaran, sebar, histogram, dll.

2. Panda

Panda adalah perpustakaan sumber terbuka dan berlisensi BSD. Perpustakaan banyak digunakan di bidang ilmu data. Mereka sebagian besar digunakan untuk analisis, manipulasi, dan pembersihan data. Tanpa perlu mengalihkannya ke bahasa lain seperti R, panda memungkinkan pengoperasian pemodelan dan analisis data yang mudah.

Data yang digunakan oleh library di python adalah:

  • Data tabel
  • Deret waktu dengan data berurutan dan tidak berurutan.
  • Data matriks melabeli baris dan kolom.
  • Data tidak berlabel
  • Bentuk lain dari data statistik

Pemasangan Panda

Pengguna harus mengetikkan "pip install pandas" di baris perintah atau ketik "conda install pandas" jika anaconda telah terinstal di sistem. Setelah instalasi selesai, itu dapat diimpor ke IDE dengan mengetikkan perintah “import pandas as pd”.

Operasi di Panda

Sejumlah besar operasi dapat dilakukan di panda:

  • Mengiris bingkai data
  • Menggabungkan dan menggabungkan bingkai data
  • Penggabungan kolom dari dua bingkai data
  • Mengubah nilai indeks dalam bingkai data.
  • Mengubah header dalam kolom.
  • Konversi data ke dalam format yang berbeda.

3. lumpuh

Menyimpang ke area komputasi ilmiah, NumPy adalah paket open-source yang paling banyak digunakan yang ditawarkan oleh python. Ini mendukung matriks besar dan data multidimensi dan memiliki fungsi matematika bawaan untuk perhitungan yang mudah. Nama "NumPy" mendefinisikan "Python Numerik". Ini dapat digunakan dalam aljabar linier, kemampuan bilangan acak, dll., dan dapat bertindak sebagai wadah multidimensi untuk data umum. Python NumPy Array adalah sebuah objek yang mendefinisikan array berdimensi-N dalam bentuk baris dan kolom.

NumPy lebih disukai daripada daftar dengan python karena:

  • Kurang memori
  • Cepat
  • Nyaman

Instalasi

Instalasi paket NumPy dilakukan dengan mengetikkan perintah “pip install numpy” pada command prompt. Impor paket dalam IDE dapat dilakukan melalui perintah “import numpy as np”. Paket instalasi di NumPy dapat ditemukan di tautan

4. Scipy (Python Ilmiah)

Scipy adalah pustaka python open-source yang digunakan untuk komputasi ilmiah, komputasi data, dan komputasi performa tinggi. Sejumlah besar rutinitas yang ramah pengguna hadir di perpustakaan untuk memudahkan perhitungan. Paket ini dibangun di atas ekstensi NumPy yang memungkinkan manipulasi dan visualisasi data dengan ketersediaan perintah tingkat tinggi. Seiring dengan NumPy, Scipy digunakan untuk perhitungan matematis. NumPy memungkinkan pengurutan, pengindeksan data array, sementara kode numerik disimpan di SciPy.

Sejumlah besar subpaket tersedia di SciPy yaitu: cluster, constants, fftpack, integrate, interpolate, io, linalg, ndimage, odr, optimize, signal, sparse, spatial, special, dan stats. Ini dapat diimpor dari SciPy melalui "from scipy import subpackage-name".

Namun, paket inti SciPy adalah NumPy, perpustakaan SciPy, Matplotlib, IPython, Sympy, dan Pandas.

5. SQLAlchemy

Pustaka python ini sebagian besar digunakan untuk mengakses informasi dari basis data yang mendukung berbagai basis data dan tata letak. Untuk pemahaman yang mudah, SQLAlchemy dapat digunakan di tingkat pemula. Sejumlah besar platform didukung olehnya seperti Python 2.5, Jython, dan Pypy membuat komunikasi yang cepat antara bahasa Python dan database.

Paket dapat diinstal dari tautan

6. Tergores

Scrapy adalah kerangka kerja sumber terbuka di Python untuk ekstraksi data dari situs web. Ini adalah perpustakaan pengikisan dan perayapan web yang cepat dan tingkat tinggi di bawah "Scrapinghub ltd". Menggores beberapa halaman dalam satu menit, Scrapy adalah pendekatan yang lebih cepat untuk pengikisan web.

Ini dapat digunakan untuk:

  • Perbandingan harga di portal web untuk produk tertentu.
  • Penambangan data untuk pencarian informasi.
  • Perhitungan data pada alat analisis data.
  • Pengumpulan data dan penyajiannya ke pusat informasi seperti portal berita.

Instalasi

Untuk lingkungan conda, instalasi dapat dilakukan melalui perintah “conda install -c conda-forge scrapy”. Jika conda tidak diinstal, maka perintah "pip install scrapy" digunakan.

7. Sup Cantik

Mirip dengan Scrapy, BeautifulSoup adalah perpustakaan di bawah pemrograman Python yang digunakan untuk ekstraksi dan pengumpulan informasi dari situs web. Ini memiliki perpustakaan XML-HTML yang sangat baik untuk pemula.

8. Scikit- belajar

Scikit-belajar adalah perpustakaan sumber terbuka di bawah lingkungan pemrograman Python yang digunakan untuk pendekatan pembelajaran mesin. Ini mendukung berbagai algoritma pembelajaran yang diawasi dan tidak diawasi. Pustaka berisi algoritme populer bersama dengan paket NumPy, Matplotlib, dan SciPy. Aplikasi Scikit-learn yang terkenal ada di Spotify untuk rekomendasi musik.

Instalasi

Untuk menginstall Scikit-learn, paket-paket di atas harus diinstal terlebih dahulu. Karena Scikit-learn dibangun di atas platform SciPy, SciPy harus diinstal terlebih dahulu. Instalasi kemudian dapat dilakukan melalui pip.

8. Ramp

Pustaka Ramp digunakan untuk pembuatan prototipe cepat model pembelajaran mesin dengan sintaks sederhana untuk menjelajahi algoritme, fitur, dan transformasi. Ini dapat digunakan dengan paket pembelajaran mesin dan alat statistik. Ini terdiri dari berbagai pembelajaran mesin dan perpustakaan statistik seperti; pandas, scikit-learn, dll. Koleksi pustaka python ini menyediakan sintaks sederhana yang membantu dalam eksplorasi fitur dan transformasi secara efisien.

Detail perpustakaan Ramp dapat diakses dari tautan

9. Seaborn

Paket tersebut dapat digunakan untuk visualisasi model statistik. Pustaka didasarkan pada Matplotlib dan memungkinkan pembuatan grafik statistik melalui:

  • Perbandingan variabel melalui API berdasarkan kumpulan data.
  • Pembuatan visualisasi kompleks yang mudah mendukung grid multi-plot.
  • Perbandingan subset data melalui visualisasi univariat dan bivariat.
  • Pilihan berbagai palet warna untuk menampilkan pola.
  • Estimasi otomatis regresi linier dan plotnya.

Instalasi

Perintah berikut dapat digunakan untuk menginstal Seaborn:

  • instal pip seaborn
  • conda install seaborn (untuk lingkungan conda)

Instalasi perpustakaan diikuti dengan instalasi dependensinya: NumPy , SciPy , Matplotlib , dan Pandas . Ketergantungan lain yang direkomendasikan adalah statsmodels.

Semua jenis dataset dapat diimpor dari GIT, melalui seaborn menggunakan fungsi load_dataset(). Dataset dapat dilihat melalui fungsi get_dataset_names().

10. Model statistik

Statsmodels adalah pustaka python yang berguna dalam analisis dan estimasi model statistik. Perpustakaan digabungkan untuk melakukan uji statistik, dll. yang memberikan hasil kinerja tinggi.

11. TensorFlow

TensorFlow adalah library open-source yang digunakan untuk komputasi numerik berperforma tinggi. Ini juga digunakan dalam pendekatan pembelajaran mesin dan algoritma pembelajaran mendalam. Dikembangkan oleh para peneliti dari tim Google Brain dalam organisasi Google AI, sekarang banyak digunakan oleh para peneliti dari matematika, fisika, dan pembelajaran mesin untuk perhitungan matematika yang kompleks. TensorFlow didukung oleh macOS 10.12.6 (Sierra) atau lebih baru; Windows 7 atau lebih tinggi; Ubuntu 16.04 atau lebih baru; dan Raspbian 9.0 atau lebih baru

12. PyGame

Paket PyGame menyediakan antarmuka ke perpustakaan grafis, audio, dan input platform Simple Directmedia Library (SDL).

Instalasi

Instalasi Python 2.7 adalah suatu keharusan sebelum instalasi PyGame. Setelah Python 2.7 diinstal, penginstal resmi PyGame perlu diunduh. File yang sesuai akan dieksekusi.

  • Perintah "import pygame" diperlukan untuk mengimpor modul yang diperlukan untuk PyGame.
  • Perintah "pygame.init()" diperlukan untuk inisialisasi modul yang diperlukan untuk PyGame.
  • Fungsi "pygame.display.set_mode((width, height))" akan meluncurkan jendela di mana operasi grafis akan dilakukan.
  • Perintah "pygame.event.get()" membantu mengosongkan acara yang diantrekan jika tidak, acara akan menumpuk yang menyebabkan risiko game menjadi tidak responsif.
  • Pertama keluar dari game "pygame.QUIT" fungsi digunakan
  • Perintah “pygame.display.flip()” digunakan untuk menampilkan pembaruan yang dibuat untuk game.

13. PyTorch

PyTorch adalah pustaka berbasis python yang memadukan dua fitur tingkat tinggi:

  • Komputasi tensor (seperti NumPy) dengan akselerasi GPU yang kuat
  • Platform Deep Neural Network memberikan fleksibilitas dan kecepatan.

Itu diperkenalkan oleh Facebook pada tahun 2017. Beberapa fitur PyTorch adalah:

  • Mendukung Python dan perpustakaannya.
  • Digunakan dalam pengembangan Facebook untuk persyaratan Deep Learning-nya.
  • API yang mudah digunakan untuk kegunaan dan pemahaman yang lebih baik.
  • Pada setiap titik eksekusi kode, grafik dapat dibangun secara dinamis dan dapat dihitung secara dinamis pada saat run-time.
  • Pengkodean mudah dan pemrosesan cepat.
  • Dapat dieksekusi di mesin GPU karena didukung oleh CUDA.

Instalasi

PyTorch dapat diinstal melalui command prompt atau dalam IDE.

14. Theano

Mirip dengan perpustakaan lain yang digunakan untuk operasi matematika, Theano memungkinkan pengguna untuk mendefinisikan, mengoptimalkan, dan mengevaluasi ekspresi matematika. Ini melibatkan array multi-dimensi besar untuk perhitungan matematis yang efisien. Kode berbasis C normal menjadi lebih lambat mengingat volume data yang sangat besar. Namun, dengan ketersediaan perpustakaan, Theano memungkinkan implementasi kode dengan cepat. Ekspresi yang tidak stabil dapat dikenali dan dihitung, membuat perpustakaan lebih berguna daripada NumPy.

15. SymPy

Paket tersebut adalah yang paling dekat dengan perpustakaan Theano dan digunakan dalam semua matematika simbolik. Dengan kode sederhana yang disediakan oleh paket, perpustakaan dapat digunakan secara efektif untuk sistem aljabar komputer. Ditulis dalam python saja, SymPy dapat dikustomisasi dan diterapkan di aplikasi lain. Kode sumber paket dapat ditemukan di GitHub.

16. Kafe2

Caffe2 adalah kerangka kerja berbasis python untuk pembelajaran mendalam. Beberapa fitur dari paket Caffe2 adalah:

  • Mendukung pelatihan terdistribusi skala besar.
  • Dukungan untuk perangkat keras baru.
  • Penerapan untuk beberapa komputasi seperti komputasi terkuantisasi.

Paket ini kompatibel dengan sistem operasi seperti MacOSX, Ubuntu, CentOS, Windows, iOS, Android, Raspbian, dan Tegra. Itu dapat diinstal dari perpustakaan Pra-Built, dibangun dari sumber, gambar buruh pelabuhan, atau Cloud. Panduan instalasi tersedia

17. NuPIC

Perpustakaan adalah singkatan dari Numenta Platform for Intelligent Computing (NuPIC). Ini menyediakan platform untuk implementasi algoritma pembelajaran HTM. Algoritma pembelajaran mesin masa depan dapat didirikan di perpustakaan ini berdasarkan neokorteks. HTM berisi algoritma pembelajaran berkelanjutan berbasis waktu dan merupakan teori komputasi rinci dari neokorteks. Algoritma terkait dengan penyimpanan dan penarikan kembali pola spasial dan temporal. Masalah seperti deteksi anomali, dll dapat diselesaikan melalui penggunaan NuPIC.

File dapat diunduh dari tautan "https://pypi.org/project/nupic/".

18. Pipenv

Pipenv secara resmi disertakan dalam pustaka python pada tahun 2017. Ini adalah alat pengemasan python yang memecahkan masalah alur kerja. Tujuan utama paket adalah untuk menyediakan lingkungan yang mudah diatur oleh pengguna. Ini mengumpulkan semua dunia pengemasan yaitu bundler, komposer, npm, kargo, benang, dll., Dan terintegrasi ke dalam lingkungan python. Beberapa masalah yang diselesaikan oleh Pipenv adalah:

  • Pengguna tidak lagi harus menggunakan "pip" dan "virtualenv" secara terpisah untuk bekerja secara kolektif.
  • Pengguna bisa mendapatkan wawasan yang tepat tentang grafik ketergantungan.
  • Sederhanakan alur kerja pengembangan melalui file .env.

Instalasi

  • Melalui perintah “$ sudo apt install pipenv” di Debian Buster.
  • Melalui perintah “$ sudo dnf install pipenv” di Fedora.
  • Melalui perintah “pkg install py36-pipenv” di FreeBSD.
  • Melalui Pipx menggunakan “$ pipx install pipenv”.

19. PyBrain

PyBrain adalah perpustakaan sumber terbuka dari perpustakaan yang tersedia dalam python yang digunakan untuk algoritma Pembelajaran Mesin untuk setiap siswa tingkat pemula dalam penelitian. Tujuan PyBrain adalah untuk menawarkan algoritme yang fleksibel dan mudah digunakan untuk tugas pembelajaran mesin. Ini juga menyediakan lingkungan yang telah ditentukan untuk membandingkan algoritma. PyBrain adalah singkatan dari Python-Based Reinforcement Learning, Artificial Intelligence, dan Neural Network Library. Dibandingkan dengan perpustakaan pembelajaran mesin lain yang disediakan oleh python, PyBrain cepat dan mudah dimengerti.

Beberapa fitur dari PyBrain adalah:

  1. Jaringan: Jaringan didefinisikan sebagai modul yang terhubung melalui tautan. Beberapa jaringan yang didukung oleh PyBrain adalah Feed-Forward Network, Recurrent Network, dll.
    • Jaringan di mana informasi dilewatkan dari satu node ke node lain dalam arah maju disebut jaringan Feed-Forward. Informasi tidak akan berjalan mundur dalam jenis jaringan ini. Ini adalah salah satu jaringan pertama dan paling sederhana yang ditawarkan oleh jaringan saraf tiruan. Aliran data dari node input ke node tersembunyi dan terakhir ke node output.
    • Mirip dengan node Feed-Forward adalah node berulang, di mana informasi harus diingat dalam setiap langkah.
  1. Kumpulan data: Kumpulan data mencakup data yang akan diberikan ke jaringan untuk pengujian, validasi, dan pelatihan jaringan. Itu tergantung pada tugas yang harus dilakukan dengan pembelajaran mesin. Dua jenis dataset yang paling banyak didukung oleh PyBrain yaitu SupervisedDataSet dan ClassificationDataSet.
    • SupervisedDataSet: Jenis kumpulan data ini sebagian besar digunakan untuk tugas pembelajaran yang diawasi. Bidang dalam kumpulan data adalah "input" dan "target".
    • ClassificationDataSet: Jenis kumpulan data ini sebagian besar digunakan untuk tugas klasifikasi. Selain kolom "input" dan "target", ada kolom tambahan yaitu "kelas". "Kelas' mencakup pencadangan target secara otomatis.
  1. Pelatih: Data dalam jaringan saraf dilatih dengan data pelatihan yang diberikan ke jaringan. Untuk memeriksa apakah jaringan dilatih dengan benar, prediksi data uji pada jaringan tersebut dianalisis. Dua jenis pelatih yang paling banyak digunakan di PyBrain adalah:
    • Backprop Trainer: parameter dalam jaringan dilatih berdasarkan dataset yang diawasi atau ClassificationDataSet dengan menyebarkan kembali kesalahan.
    • TrainUntilConvergence: Modul dilatih hingga konvergensi
  1. Visualisasi : visualisasi data dapat dilakukan melalui framework lain seperti Mathplotlib, pyplot, dll.

20. SUSU

Paket pembelajaran mesin "SUSU" dalam python berfokus pada penggunaan pengklasifikasi yang tersedia untuk klasifikasi yang diawasi. Pengklasifikasi yang tersedia adalah SVM, k-NN, hutan acak, dan pohon keputusan. Seiring dengan klasifikasi, MILK membantu dalam proses pemilihan fitur. Kombinasi pengklasifikasi bervariasi pada sistem klasifikasi.

  • Untuk masalah klasifikasi tak terawasi, MILK menggunakan -means clustering dan affinity propagation.
  • Masukan untuk SUSU bervariasi. Sebagian besar dioptimalkan untuk array NumPy, tetapi bentuk input lain dapat diterima.
  • Kode dalam SUSU ditulis dalam C++ yang menggunakan memori rendah dan berkecepatan tinggi.

Instalasi

Kode instalasi untuk MILK dapat diambil dari Github. Perintah yang digunakan untuk instalasi adalah “easy_install milk” atau “pip install milk”.

Informasi lebih lanjut tentang toolkit dapat diambil dari link.

Kesimpulan

Bahasa python yang mudah digunakan telah membuat aplikasi luas di beberapa area dunia nyata. Dengan menjadi bahasa tingkat tinggi, diketik secara dinamis, dan diinterpretasikan, bahasa tersebut berkembang pesat di bidang kesalahan debug. Beberapa aplikasi global di mana python semakin banyak digunakan adalah YouTube, DropBox, dll. Selanjutnya, dengan ketersediaan perpustakaan di python , pengguna dapat melakukan banyak tugas tanpa harus menulis kode mereka sendiri.

Jika Anda penasaran untuk belajar tentang perpustakaan Python dan ilmu data, lihat Program PG Eksekutif IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan industri pakar, tatap muka dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.

Apa perpustakaan teratas untuk ilmu data dengan Python?

- Pandas adalah pustaka Python yang sebagian besar digunakan untuk analisis data. Ini adalah salah satu perpustakaan Python yang paling banyak digunakan. Ini memberi Anda akses ke beberapa alat paling penting untuk menjelajahi, membersihkan, dan menganalisis data Anda.
- NumPy terkenal dengan dukungan array N-dimensinya. NumPy adalah favorit di antara para ilmuwan data karena array multi-dimensi ini 50 kali lebih tangguh daripada daftar Python.
- Scikit-learn kemungkinan merupakan perpustakaan pembelajaran mesin yang paling penting di Python. Scikit-learn digunakan untuk membuat model pembelajaran mesin setelah membersihkan dan memproses data Anda dengan Pandas atau NumPy. Ini berisi banyak alat untuk pemodelan dan analisis prediktif.
- TensorFlow adalah salah satu library Python yang paling banyak digunakan untuk membuat jaringan saraf. Itu menggunakan array multi-dimensi, juga dikenal sebagai tensor, untuk menjalankan beberapa operasi pada satu input.
- Keras banyak digunakan untuk membangun model pembelajaran yang mendalam, terutama jaringan saraf. Ini didasarkan pada TensorFlow dan Theano dan memungkinkan Anda membuat jaringan saraf dengan cepat.
- SciPy sebagian besar digunakan untuk fungsi ilmiah dan matematika yang dihasilkan dari NumPy, seperti namanya. Fungsi statistik, fungsi pengoptimalan, dan fungsi pemrosesan sinyal adalah beberapa fitur bermanfaat yang disediakan oleh perpustakaan ini.

Apa pentingnya pustaka modul di Python?

Modul membantu Anda untuk mengatur kode Python Anda secara logis. Kode lebih mudah dipahami dan digunakan jika disusun menjadi modul. Anda dapat dengan mudah mengikat dan mereferensikan sebuah modul. Modul hanyalah objek Python yang berisi atribut bernama arbitrer.
Modul hanyalah sebuah file yang berisi kode Python. Variabel, kelas, dan fungsi semua dapat didefinisikan dalam modul. Kode yang dapat dijalankan juga dapat dimasukkan dalam modul.

Bagaimana cara mengimpor perpustakaan Python?

Untuk memanfaatkan fungsi modul, Anda harus mengimpor modul terlebih dahulu melalui pernyataan impor. Kata kunci import diikuti dengan nama modul dalam pernyataan impor. Ini akan dinyatakan di bagian atas program, di bawah baris Shebang atau komentar umum apa pun, dalam file Python.