Bibliotecile în Python explicate: Lista bibliotecilor importante

Publicat: 2021-06-14

Cuprins

Ce este o bibliotecă?

O bibliotecă este un set combinat anterior de coduri care pot fi utilizate iterativ, reducând astfel timpul. După cum sugerează termenul, este similar cu biblioteca fizică care deține resurse reutilizabile. Python a fondat mai multe biblioteci open source pe baza faptului că fiecare bibliotecă are o sursă rădăcină.

Ce sunt bibliotecile Python?

Python a fost utilizat pe scară largă în prezent fiind un limbaj de programare de nivel înalt. Ușurința de utilizare constă în sintaxa sa care folosește un număr mai mic de coduri pentru a exprima un concept. Prin urmare, acest lucru permite utilizatorului să aplice python și să scrie programe atât la scară mare, cât și la scară mică. Limbajul acceptă gestionarea automată a memoriei și are o bibliotecă standard mare.

O bibliotecă Python definește linii de cod care pot fi reutilizate în alte programe. Este practic o colecție de module. Utilitatea lor constă în faptul că nu este necesar să fie scrise coduri noi de fiecare dată când este necesar să ruleze același proces. Bibliotecile din Python joacă un rol important în domeniile științei datelor, învățării automate, aplicațiilor de manipulare a datelor etc.

Bibliotecă standard Python

Viața unui programator devine ușoară odată cu disponibilitatea unui număr mare de biblioteci standard în python. Acest lucru se întâmplă în principal pentru că programatorul nu este obligat să scrie codurile în continuare. De exemplu, un programator poate folosi biblioteca MySQLdb pentru a conecta o bază de date MySQL la un server. Bibliotecile Python sunt scrise în mare parte în limbajul de programare C care se ocupă de operațiuni precum I/O și alte module de bază. Biblioteca standard constă din peste 200 de module de bază și aproximativ 137.000 de biblioteci Python au fost dezvoltate până în prezent.

Biblioteci importante Python

1. Matplotlib

Această bibliotecă este utilizată pentru reprezentarea grafică a datelor numerice și utilizată în analiza datelor. Această bibliotecă open-source este folosită pentru publicarea de cifre de înaltă calitate, cum ar fi grafice, diagrame circulare, diagrame de dispersie, histograme etc.

2. Panda

Panda este o bibliotecă open-source și licențiată BSD. Biblioteca este utilizată pe scară largă în domeniul științei datelor. Ele sunt utilizate în principal pentru analiza, manipularea și curățarea datelor. Fără a fi necesară trecerea la o altă limbă precum R, panda face posibilă operațiunile ușoare de modelare și analiză a datelor.

Datele folosite de bibliotecile din python sunt:

  • Date tabelare
  • Serii temporale cu date ordonate și neordonate.
  • Etichetarea datelor matriceale pentru rânduri și coloane.
  • Date neetichetate
  • Orice altă formă de date statistice

Instalarea panda

Utilizatorul trebuie să tastați „pip install pandas” în linia de comandă sau să tastați „conda install pandas” dacă o anaconda a fost deja instalată în sistem. Odată terminată instalarea, aceasta poate fi importată în IDE tastând comanda „import panda as pd”.

Operațiuni în Panda

Un număr mare de operațiuni pot fi efectuate în panda:

  • Tăierea cadrului de date
  • Îmbinarea și unirea cadrelor de date
  • Concatenarea coloanelor din două cadre de date
  • Modificarea valorilor indexului într-un cadru de date.
  • Schimbarea antetelor dintr-o coloană.
  • Conversia datelor în diferite formate.

3. Numpy

Deviându-se către domeniile de calcul științific, NumPy este cel mai folosit pachet open-source oferit de python. Acceptă matrici mari și date multidimensionale și are funcții matematice încorporate pentru calcule ușoare. Numele „NumPy” definește „Python numeric”. Poate fi folosit în algebra liniară, capacitatea de numere aleatoare etc. și poate acționa ca un container multidimensional pentru date generice. Python NumPy Array este un obiect care definește o matrice N-dimensională sub formă de rânduri și coloane.

NumPy este preferat față de liste în python din cauza:

  • Mai puțină memorie
  • Rapid
  • Convenabil

Instalare

Instalarea pachetului NumPy se face prin tastarea comenzii „“pip install numpy” în promptul de comandă. Importul pachetului în IDE se poate face prin comanda „import numpy as np”. Pachetele de instalare pe NumPy pot fi găsite în link

4. Scipy (Python științific)

Scipy este o bibliotecă python open-source folosită pentru calcul științific, calcul de date și calcul de înaltă performanță. Un număr mare de rutine ușor de utilizat sunt prezente în bibliotecă pentru calcule ușoare. Pachetul este construit peste extensia NumPy permițând manipularea și vizualizarea datelor cu disponibilitatea comenzilor de nivel înalt. Împreună cu NumPy, Scipy este folosit pentru calculul matematic. NumPy permite sortarea, indexarea datelor matricei, în timp ce codul numeric este stocat în SciPy.

Un număr mare de subpachete sunt disponibile în SciPy, care sunt: ​​cluster, constante, fftpack, integrate, interpolate, io, linalg, ndimage, odr, optimize, signal, sparse, spațial, special și statistics. Acestea pot fi importate din SciPy prin „from scipy import subpackage-name”.

Cu toate acestea, pachetele de bază ale SciPy sunt NumPy, biblioteca SciPy, Matplotlib, IPython, Sympy și Pandas.

5. SQLAlchemy

Această bibliotecă de python este folosită în principal pentru accesarea informațiilor din bazele de date care acceptă o gamă largă de baze de date și machete. Pentru o înțelegere ușoară, SQLAlchemy poate fi folosit la nivel de începător. Un număr mare de platforme sunt suportate de acesta, cum ar fi Python 2.5, Jython și Pypy, care fac o comunicare rapidă între limbajul Python și baza de date.

Pachetul poate fi instalat din link

6. Scrapy

Scrapy este un cadru open-source în Python pentru extragerea datelor de pe site-uri web. Este o bibliotecă rapidă, de nivel înalt de scraping și crawling web sub „Scrapinghub ltd”. Scrapying mai multe pagini într-un minut, Scrapy este o abordare mai rapidă pentru web scraping.

Poate fi folosit pentru:

  • Compararea prețurilor în portaluri web pentru anumite produse.
  • Exploatarea datelor pentru regăsirea informațiilor.
  • Calculul datelor în instrumentele de analiză a datelor.
  • Colectarea datelor și difuzarea acestora către centrele de informații precum portalurile de știri.

Instalare

Pentru mediul conda, instalarea se poate face prin comanda „conda install -c conda-forge scrapy”. Dacă conda nu este instalat, atunci se folosește comanda „pip install scrapy”.

7. BeautifulSup

Similar cu Scrapy, BeautifulSoup este o bibliotecă sub programare Python folosită pentru extragerea și colectarea de informații de pe site-uri web. Are o bibliotecă excelentă XML-HTML pentru începători.

8. Scikit- învață

Scikit-learn este o bibliotecă open-source în mediul de programare Python, utilizată pentru abordări de învățare automată. Acceptă o gamă largă de algoritmi de învățare supravegheați și nesupravegheați. Biblioteca conține algoritmi populari împreună cu pachetele NumPy, Matplotlib și SciPy. Celebra aplicație Scikit-learn se află în Spotify pentru recomandări muzicale.

Instalare

Pentru a instala Scikit-learn, pachetele de mai sus trebuie instalate mai întâi. Deoarece Scikit-learn este construit pe platforma SciPy, SciPy trebuie instalat mai întâi. Instalarea se poate face apoi prin pip.

8. Rampa

Biblioteca Ramp este utilizată pentru prototiparea rapidă a modelelor de învățare automată cu o sintaxă simplă pentru explorarea algoritmilor, caracteristicilor și transformărilor. Poate fi folosit cu pachete de învățare automată și instrumente statistice. Constă din diverse biblioteci de învățare automată și statistică, cum ar fi; panda, scikit-learn, etc. Colecția acestor biblioteci Python oferă o sintaxă simplă care ajută la explorarea funcțiilor și transformărilor în mod eficient.

Detaliile bibliotecii Ramp pot fi accesate din link

9. Născut pe mare

Pachetul poate fi utilizat pentru vizualizarea modelelor statistice. Biblioteca se bazează pe Matplotlib și permite crearea de grafice statistice prin:

  • Compararea variabilelor printr-un API bazat pe seturi de date.
  • Generare ușoară de vizualizare complexă care acceptă grile cu mai multe parcele.
  • Compararea subseturilor de date prin vizualizări univariate și bivariate.
  • Opțiuni de diverse palete de culori pentru afișarea modelelor.
  • Estimarea automată a regresiei liniare și reprezentarea grafică a acesteia.

Instalare

Următoarele comenzi pot fi utilizate pentru instalarea Seaborn:

  • pip install seaborn
  • conda install seaborn (pentru mediul conda)

Instalarea bibliotecii este urmată de instalarea dependențelor acesteia: NumPy , SciPy , Matplotlib și Pandas . O altă dependență recomandată este statmodels.

Orice tip de set de date poate fi importat din GIT, prin seaborn folosind funcția load_dataset(). Setul de date poate fi vizualizat prin funcția get_dataset_names().

10. Statmodele

Statsmodels este o bibliotecă python utilă în analiza și estimarea modelelor statistice. Biblioteca este încorporată pentru efectuarea testelor statistice etc. oferind rezultate de înaltă performanță.

11. TensorFlow

TensorFlow este o bibliotecă open-source folosită pentru calcule numerice de înaltă performanță. Este, de asemenea, utilizat în abordări de învățare automată și algoritmi de învățare profundă. Dezvoltat de cercetătorii echipei Google Brain din cadrul organizației Google AI, este acum utilizat pe scară largă de cercetătorii din matematică, fizică și învățarea automată pentru calcule matematice complexe. TensorFlow este acceptat de macOS 10.12.6 (Sierra) sau o versiune ulterioară; Windows 7 sau mai nou; Ubuntu 16.04 sau o versiune ulterioară; și Raspbian 9.0 sau o versiune ulterioară

12. PyGame

Pachetul PyGame oferă o interfață către bibliotecile grafice, audio și de intrare independente de platformă Simple Directmedia Library (SDL).

Instalare

Instalarea Python 2.7 este o necesitate înainte de instalarea PyGame. Odată ce Python 2.7 este instalat, programul de instalare oficial PyGame trebuie descărcat. Fișierele corespunzătoare urmează să fie executate.

  • Comanda „import pygame” este necesară pentru a importa modulele necesare pentru PyGame.
  • Comanda „pygame.init()” este necesară pentru inițializarea modulelor necesare pentru PyGame.
  • Funcția „pygame.display.set_mode((lățime, înălțime))” va lansa o fereastră în care vor fi efectuate operațiunile grafice.
  • Comanda „pygame.event.get()” ajută la golirea evenimentelor din coadă, altfel evenimentele se vor acumula, ceea ce duce la riscul ca jocul să nu mai răspundă.
  • Se folosește funcția „pygame.QUIT” pentru a părăsi jocul
  • Comanda „pygame.display.flip()” este folosită pentru afișarea oricăror actualizări aduse jocului.

13. PyTorch

PyTorch este o bibliotecă bazată pe python care combină două caracteristici de nivel înalt:

  • Calcul tensor (cum ar fi NumPy) cu accelerare GPU puternică
  • Platformele Deep Neural Network oferă flexibilitate și viteză.

A fost introdus de Facebook în 2017. Unele dintre caracteristicile PyTorch sunt:

  • Suportă Python și bibliotecile sale.
  • Folosit în dezvoltarea Facebook pentru cerințele sale de Deep Learning.
  • Un API ușor de utilizat pentru o mai bună utilizare și înțelegere.
  • În orice moment al execuției codului, graficele pot fi construite dinamic și pot fi calculate dinamic în timpul execuției.
  • Codare ușoară și procesare rapidă.
  • Poate fi executat pe mașini GPU, deoarece este acceptat de CUDA.

Instalare

PyTorch poate fi instalat prin promptul de comandă sau într-un IDE.

14. Theano

Similar cu alte biblioteci utilizate pentru operații matematice, Theano permite utilizatorului să definească, să optimizeze și să evalueze expresii matematice. Acesta implică matrice mari multidimensionale pentru calcul matematic eficient. Codurile normale bazate pe C devin mai lente, având în vedere volume uriașe de date. Cu toate acestea, odată cu disponibilitatea bibliotecii, Theano permite implementarea rapidă a codului. Expresiile instabile pot fi recunoscute și calculate, făcând biblioteca mai utilă față de NumPy.

15. SymPy

Pachetul este cel mai apropiat de biblioteca Theano și este folosit în toată matematica simbolică. Cu codul simplu furnizat de pachet, biblioteca poate fi utilizată eficient pentru sistemul de algebră computerizată. Scris doar în python, SymPy poate fi personalizat și aplicat în alte aplicații. Codul sursă al pachetului poate fi găsit în GitHub.

16. Cafea2

Caffe2 este un cadru bazat pe python pentru învățare profundă. Unele dintre caracteristicile pachetului Caffe2 sunt:

  • Sprijină instruirea distribuită la scară largă.
  • Suport pentru hardware nou.
  • Aplicabilitate la mai multe calcule, cum ar fi calculul cuantificat.

Pachetul este compatibil cu sisteme de operare precum MacOSX, Ubuntu, CentOS, Windows, iOS, Android, Raspbian și Tegra. Poate fi instalat din biblioteci Pre-Built, construite din sursă, imagini docker sau Cloud. Ghidul de instalare este disponibil

17. NuPIC

Biblioteca înseamnă Numenta Platform for Intelligent Computing (NuPIC). Acesta oferă o platformă pentru implementarea algoritmului de învățare HTM. Viitorii algoritmi de învățare automată pot fi bazați pe această bibliotecă bazată pe neocortex. HTM conține algoritmi de învățare continuă bazați pe timp și este o teorie computațională detaliată a neocortexului. Algoritmii sunt asociați cu stocarea și retragerea tiparelor spațiale și temporale. Probleme precum detectarea anomaliilor etc. pot fi rezolvate prin utilizarea NuPIC.

Fișierele pot fi descărcate de la linkul „https://pypi.org/project/nupic/”.

18. Pipenv

Pipenv a fost inclus oficial în bibliotecile Python în 2017. Este un instrument de ambalare Python care rezolvă problemele fluxului de lucru. Scopul principal al pachetului este de a oferi un mediu ușor de configurat de către utilizatori. Colectează toate lumile de ambalare, adică bundler, compozitor, npm, încărcătură, fire etc. și se integrează în mediul python. Unele dintre problemele rezolvate de Pipenv sunt:

  • Utilizatorii nu mai trebuie să folosească „pip” și „virtualenv” separat pentru a lucra colectiv.
  • Utilizatorii pot obține o perspectivă adecvată asupra graficului de dependență.
  • Simplificați fluxul de lucru de dezvoltare prin fișiere .env.

Instalare

  • Prin comanda „$ sudo apt install pipenv” într-un Debian Buster.
  • Prin comanda „$ sudo dnf install pipenv” din Fedora.
  • Prin comanda „pkg install py36-pipenv” în FreeBSD.
  • Prin Pipx folosind „$ pipx install pipenv”.

19. PyBrain

PyBrain este o bibliotecă open source din bibliotecile disponibile în python, utilizată pentru algoritmii de învățare automată pentru fiecare student la nivel de intrare în cercetare. Scopul PyBrain este de a oferi algoritmi flexibili și ușor de utilizat pentru sarcinile de învățare automată. De asemenea, oferă medii predefinite pentru compararea algoritmilor. PyBrain înseamnă Python-Based Reinforcement Learning, Artificial Intelligence și Neural Network Library. În comparație cu celelalte biblioteci de învățare automată furnizate de python, PyBrain este rapid și ușor de înțeles.

Unele dintre caracteristicile PyBrain sunt:

  1. Rețele: O rețea este definită ca module conectate prin legături. Puține rețele acceptate de PyBrain sunt rețelele Feed-Forward, rețelele recurente etc.
    • Rețeaua în care informațiile sunt transmise de la un nod la altul într-o direcție înainte se numește rețea Feed-Forward. Informațiile nu vor călători înapoi în acest tip de rețea. Este una dintre primele și cele mai simple rețele oferite de rețeaua neuronală artificială. Fluxul de date este de la nodurile de intrare la nodurile ascunse și, în sfârșit, la nodurile de ieșire.
    • Similar cu nodurile Feed-Forward sunt nodurile recurente, unde informația trebuie reținută în fiecare pas.
  1. Seturi de date: seturile de date includ datele care urmează să fie furnizate rețelelor pentru testarea, validarea și instruirea rețelelor. Depinde de sarcina care trebuie efectuată cu machine learning. Două tipuri de seturi de date sunt în mare parte acceptate de PyBrain, adică SupervisedDataSet și ClassificationDataSet.
    • SupervisedDataSet: Aceste tipuri de seturi de date sunt utilizate în principal pentru sarcini de învățare supravegheată. Câmpurile din seturile de date sunt „intrare” și „țintă”.
    • ClassificationDataSet: Aceste tipuri de seturi de date sunt utilizate în principal pentru sarcini de clasificare. Alături de câmpurile „input” și „țintă”, există un câmp suplimentar și anume „clasă”. „Clasa” include backup-ul automat al țintelor.
  1. Trainer: Datele dintr-o rețea neuronală sunt antrenate cu datele de antrenament furnizate rețelelor. Pentru a verifica dacă rețeaua este antrenată corespunzător, se analizează predicția datelor de testare pe acea rețea. Două tipuri de antrenor utilizate cel mai mult în PyBrain sunt:
    • Backprop Trainer: parametrii dintr-o rețea sunt antrenați pe baza setului de date supravegheat sau ClassificationDataSet prin propagarea înapoi a erorilor.
    • TrainUntilConvergence: Modulul este antrenat până la convergență
  1. Vizualizare : vizualizarea datelor poate fi efectuată prin alte cadre precum Mathplotlib, pyplot etc.

20. LAPTE

Pachetul de învățare automată „MILK” în python se concentrează pe utilizarea clasificatoarelor disponibile pentru clasificarea supravegheată. Clasificatorii disponibili sunt SVM, k-NN, păduri aleatorii și arbori de decizie. Alături de clasificare, MILK ajută în procesul de selecție a caracteristicilor. Combinația de clasificatoare variază în funcție de sistemele de clasificare.

  • Pentru problema de clasificare nesupravegheată, MILK folosește gruparea -means și propagarea afinității.
  • Intrările pentru LAPTE variază. În cea mai mare parte, este optimizat pentru tablourile NumPy, dar pot fi acceptate alte forme de intrări.
  • Codurile din MILK sunt scrise în C++ care folosește memorie redusă și este de mare viteză.

Instalare

Codul de instalare pentru MILK poate fi preluat din Github. Comenzile folosite pentru instalare sunt „easy_install milk” sau „pip install milk”.

Mai multe informații despre setul de instrumente pot fi preluate din link.

Concluzie

Limbajul Python simplu de utilizat a făcut aplicații largi în mai multe zone ale lumii reale. Fiind un limbaj de nivel înalt, tipizat dinamic și interpretat, limbajul crește rapid în domeniile erorilor de depanare. Unele dintre aplicațiile globale în care python a fost din ce în ce mai folosit sunt YouTube, DropBox etc. În plus, odată cu disponibilitatea bibliotecilor în python , utilizatorii pot efectua o mulțime de sarcini fără a fi nevoie să scrie propriile coduri.

Dacă sunteți curios să aflați despre bibliotecile Python și știința datelor, consultați Programul Executive PG în știința datelor de la IIIT-B și upGrad, care este creat pentru profesioniști care lucrează și oferă peste 10 studii de caz și proiecte, ateliere practice practice, mentorat cu industrie experți, 1-la-1 cu mentori din industrie, peste 400 de ore de învățare și asistență la locul de muncă cu firme de top.

Care sunt bibliotecile de top pentru știința datelor în Python?

- Pandas este o bibliotecă Python care este folosită mai ales pentru analiza datelor. Este una dintre cele mai utilizate biblioteci Python. Vă oferă acces la unele dintre cele mai esențiale instrumente pentru explorarea, curățarea și analiza datelor dvs.
- NumPy este bine cunoscut pentru suportul său pentru matrice N-dimensională. NumPy este un favorit printre oamenii de știință de date, deoarece aceste matrice multidimensionale sunt de 50 de ori mai rezistente decât listele Python.
- Scikit-learn este probabil cea mai importantă bibliotecă de învățare automată din Python. Scikit-learn este folosit pentru a construi modele de învățare automată după curățarea și procesarea datelor cu Pandas sau NumPy. Conține o mulțime de instrumente pentru modelarea predictivă și analiză.
- TensorFlow este una dintre cele mai utilizate biblioteci Python pentru crearea de rețele neuronale. Utilizează rețele multidimensionale, cunoscute și sub denumirea de tensori, pentru a executa mai multe operații pe o singură intrare.
- Keras este folosit mai ales pentru a construi modele de învățare profundă, în special rețele neuronale. Se bazează pe TensorFlow și Theano și vă permite să creați rapid rețele neuronale.
- SciPy este folosit mai ales pentru funcții științifice și matematice generate de NumPy, așa cum sugerează și numele. Funcțiile statistice, funcțiile de optimizare și funcțiile de procesare a semnalului sunt câteva dintre caracteristicile utile oferite de această bibliotecă.

Care este importanța bibliotecilor de module în Python?

Modulul vă ajută să vă organizați codul Python într-o manieră logică. Codul este mai ușor de înțeles și utilizat atunci când este organizat în module. Puteți lega cu ușurință și face referire la un modul. Un modul este doar un obiect Python care conține atribute denumite arbitrar.
Un modul este pur și simplu un fișier care conține cod Python. Variabilele, clasele și funcțiile pot fi toate definite într-un modul. Codul rulabil poate fi, de asemenea, inclus într-un modul.

Cum import o bibliotecă Python?

Pentru a utiliza funcțiile unui modul, trebuie mai întâi să importați modulul printr-o instrucțiune de import. Cuvântul cheie import este urmat de numele modulului într-o instrucțiune de import. Acest lucru va fi menționat în partea de sus a programului, sub orice rânduri de shebang sau comentarii generale, într-un fișier Python.