Python의 라이브러리 설명: 중요한 라이브러리 목록

게시 됨: 2021-06-14

목차

도서관이란?

라이브러리는 반복적으로 사용할 수 있는 이전에 결합된 코드 세트이므로 시간이 단축됩니다. 용어에서 알 수 있듯이 재사용 가능한 리소스를 보유하는 물리적 라이브러리와 유사합니다. Python은 각 라이브러리에 루트 소스가 있다는 사실을 기반으로 여러 오픈 소스 라이브러리를 설립했습니다.

파이썬 라이브러리란 무엇입니까?

Python은 현재 고급 프로그래밍 언어로 널리 사용되었습니다. 사용 용이성은 개념을 표현하기 위해 더 적은 수의 코드를 사용하는 구문에 있습니다. 따라서 이를 통해 사용자는 파이썬을 적용하고 크고 작은 프로그램을 작성할 수 있습니다. 이 언어는 자동 메모리 관리를 지원하며 큰 표준 라이브러리를 가지고 있습니다.

Python 라이브러리는 다른 프로그램에서 재사용할 수 있는 코드 라인을 정의합니다. 기본적으로 모듈의 모음입니다. 그 유용성은 동일한 프로세스를 실행해야 할 때마다 새 코드를 작성할 필요가 없다는 사실에 있습니다. Python의 라이브러리 는 데이터 과학, 기계 학습, 데이터 조작 응용 프로그램 등의 영역에서 중요한 역할을 합니다.

파이썬 표준 라이브러리

파이썬에서 많은 수의 표준 라이브러리를 사용할 수 있으므로 프로그래머의 삶이 쉬워집니다. 이것은 주로 프로그래머가 코드를 계속 작성할 필요가 없기 때문입니다. 예를 들어, 프로그래머는 MySQLdb 라이브러리를 사용하여 MySQL 데이터베이스를 서버에 연결할 수 있습니다. 파이썬 라이브러리 대부분 I/O 및 기타 핵심 모듈과 같은 작업을 처리하는 C 프로그래밍 언어로 작성됩니다. 표준 라이브러리는 200개 이상의 핵심 모듈로 구성되며 현재까지 약 137,000개의 파이썬 라이브러리 가 개발되었습니다.

중요한 Python 라이브러리

1. 매트플롯립

이 라이브러리는 수치 데이터의 플로팅에 사용되며 데이터 분석에 사용됩니다. 이 오픈 소스 라이브러리는 그래프, 파이 차트, 산점도, 히스토그램 등과 같은 고품질 수치를 게시하는 데 사용됩니다.

2. 판다

팬더는 오픈 소스 라이브러리이며 BSD 라이선스가 있습니다. 라이브러리는 데이터 과학 분야에서 널리 사용됩니다. 그들은 주로 데이터의 분석, 조작 및 정리에 사용됩니다. R과 같은 다른 언어로 전환할 필요 없이 panda를 사용하면 모델링 및 데이터 분석 작업을 쉽게 수행할 수 있습니다.

Python의 라이브러리에서 사용하는 데이터 는 다음과 같습니다.

  • 테이블 형식 데이터
  • 정렬된 데이터와 정렬되지 않은 데이터가 있는 시계열.
  • 행과 열에 레이블을 지정하는 행렬 데이터.
  • 레이블이 지정되지 않은 데이터
  • 기타 모든 형태의 통계 데이터

판다 설치

사용자는 명령줄에 "pip install pandas"를 입력하거나 아나콘다가 시스템에 이미 설치된 경우 "conda install pandas"를 입력해야 합니다. 설치가 완료되면 "import pandas as pd" 명령을 입력하여 IDE로 가져올 수 있습니다.

판다 작업

팬더에서 많은 작업을 수행할 수 있습니다.

  • 데이터 프레임 슬라이싱
  • 데이터 프레임 병합 및 결합
  • 두 데이터 프레임의 열 연결
  • 데이터 프레임의 인덱스 값 변경.
  • 열의 헤더 변경.
  • 데이터를 다른 형식으로 변환합니다.

3. 넘피

과학적인 계산 영역에서 벗어나 NumPy는 파이썬에서 제공하는 가장 많이 사용되는 오픈 소스 패키지입니다. 그것은 큰 행렬과 다차원 데이터를 지원하고 쉬운 계산을 위한 내장 수학 함수를 가지고 있습니다. "NumPy"라는 이름은 "Numerical Python"을 정의합니다. 선형 대수, 난수 기능 등에 사용할 수 있으며 일반 데이터의 다차원 컨테이너 역할을 할 수 있습니다. Python NumPy Array는 N차원 배열을 행과 열의 형태로 정의하는 객체입니다.

NumPy는 다음과 같은 이유로 파이썬의 목록보다 선호됩니다.

  • 적은 메모리
  • 빠른
  • 편리한

설치

NumPy 패키지 설치는 명령 프롬프트에서 "pip install numpy" 명령을 입력하여 수행됩니다. IDE에서 패키지 가져오기는 "import numpy as np" 명령을 통해 수행할 수 있습니다. NumPy의 설치 패키지는 링크에서 찾을 수 있습니다.

4. Scipy(과학적 파이썬)

Scipy는 과학 계산, 데이터 계산 및 고성능 계산에 사용되는 오픈 소스 Python 라이브러리입니다. 많은 수의 사용자 친화적인 루틴이 쉽게 계산할 수 있도록 라이브러리에 있습니다. 이 패키지는 NumPy 확장을 기반으로 구축되어 고급 명령을 사용하여 데이터를 조작하고 시각화할 수 있습니다. NumPy와 함께 Scipy는 수학 계산에 사용됩니다. NumPy는 배열 데이터의 정렬, 인덱싱을 허용하는 반면 숫자 코드는 SciPy에 저장됩니다.

클러스터, 상수, fftpack, 통합, 보간, io, linalg, ndimage, odr, optimize, signal, sparse, spatial, special 및 stats와 같은 많은 하위 패키지를 SciPy에서 사용할 수 있습니다. "from scipy import subpackage-name"을 통해 SciPy에서 가져올 수 있습니다.

그러나 SciPy의 핵심 패키지는 NumPy, SciPy 라이브러리, Matplotlib, IPython, Sympy 및 Pandas입니다.

5. SQLAlchemy

이 파이썬 라이브러리는 광범위한 데이터베이스 및 레이아웃을 지원하는 데이터베이스에서 정보에 액세스하는 데 주로 사용됩니다. SQLAlchemy는 이해를 돕기 위해 초심자 수준에서 사용할 수 있습니다. Python 2.5, Jython 및 Pypy와 같은 많은 플랫폼이 Python 언어와 데이터베이스 간의 빠른 통신을 지원합니다.

패키지는 링크에서 설치할 수 있습니다.

6. 스크래피

Scrapy는 웹사이트에서 데이터를 추출하기 위한 Python의 오픈 소스 프레임워크입니다. "Scrapinghub ltd" 아래에 있는 빠르고 높은 수준의 스크래핑 및 웹 크롤링 라이브러리입니다. 1분 안에 여러 페이지를 스크래핑하는 Scrapy는 웹 스크래핑을 위한 더 빠른 접근 방식입니다.

다음 용도로 사용할 수 있습니다.

  • 특정 제품에 대한 웹 포털의 가격 비교.
  • 정보 검색을 위한 데이터 마이닝.
  • 데이터 분석 도구에서 데이터 계산.
  • 데이터를 수집하여 뉴스 포털과 같은 정보 허브에 제공합니다.

설치

conda 환경의 경우 "conda install -c conda-forge scrapy" 명령을 통해 설치가 가능합니다. conda가 설치되어 있지 않으면 "pip install scrapy" 명령이 사용됩니다.

7. 아름다운 수프

Scrapy와 유사하게 BeautifulSoup은 웹사이트에서 정보를 추출하고 수집하는 데 사용되는 Python 프로그래밍 라이브러리입니다. 초보자를 위한 훌륭한 XML-HTML 라이브러리가 있습니다.

8. Scikit 학습

Scikit-Learn은 기계 학습 접근 방식에 사용되는 Python 프로그래밍 환경의 오픈 소스 라이브러리입니다. 다양한 지도 및 비지도 학습 알고리즘을 지원합니다. 라이브러리에는 NumPy, Matplotlib 및 SciPy 패키지와 함께 인기 있는 알고리즘이 포함되어 있습니다. Scikit-learn의 유명한 응용 프로그램은 음악 추천을 위해 Spotify에 있습니다.

설치

Scikit-learn을 설치하려면 위의 패키지를 먼저 설치해야 합니다. Scikit-learn은 SciPy 플랫폼을 기반으로 구축되었으므로 SciPy를 먼저 설치해야 합니다. 그런 다음 pip를 통해 설치를 수행할 수 있습니다.

8. 램프

Ramp 라이브러리는 알고리즘, 기능 및 변환을 탐색하기 위한 간단한 구문으로 기계 학습 모델의 신속한 프로토타이핑에 사용됩니다. 기계 학습 패키지 및 통계 도구와 함께 사용할 수 있습니다. 다음과 같은 다양한 기계 학습 및 통계 라이브러리로 구성됩니다. pandas, scikit-learn 등. 이러한 python 라이브러리 모음 은 기능 및 변환을 효율적으로 탐색하는 데 도움이 되는 간단한 구문을 제공합니다.

Ramp 라이브러리에 대한 자세한 내용은 링크에서 액세스할 수 있습니다.

9. 시본

패키지는 통계 모델의 시각화에 사용할 수 있습니다. 라이브러리는 Matplotlib를 기반으로 하며 다음을 통해 통계 그래픽을 생성할 수 있습니다.

  • 데이터셋 기반의 API를 통한 변수 비교
  • 다중 플롯 그리드를 지원하는 복잡한 시각화의 쉬운 생성.
  • 일변량 및 이변량 시각화를 통한 데이터 하위 집합 비교.
  • 패턴을 표시하기 위한 다양한 색상 팔레트 옵션.
  • 선형 회귀 및 그 플로팅의 자동 추정.

설치

Seaborn 설치에는 다음 명령을 사용할 수 있습니다.

  • 핍 설치 시본
  • conda install seaborn (conda 환경용)

라이브러리를 설치한 다음 종속성을 설치합니다: NumPy , SciPy , Matplotlib Pandas . 또 다른 권장 종속성은 statsmodels입니다.

load_dataset() 함수를 사용하여 seaborn을 통해 모든 유형의 데이터 세트를 GIT에서 가져올 수 있습니다. 데이터셋은 get_dataset_names() 함수를 통해 볼 수 있습니다.

10. 통계 모델

Statsmodels는 통계 모델의 분석 및 추정에 유용한 파이썬 라이브러리입니다. 라이브러리를 통합하여 통계 테스트 등을 수행하여 고성능 결과를 제공합니다.

11. 텐서플로우

TensorFlow는 고성능 수치 계산에 사용되는 오픈 소스 라이브러리입니다. 머신 러닝 접근 방식과 딥 러닝 알고리즘에도 사용됩니다. Google AI 조직 내 Google Brain 팀의 연구원들이 개발한 이 도구는 현재 수학, 물리학 및 머신 러닝 분야의 연구원들이 복잡한 수학적 계산을 위해 널리 사용하고 있습니다. TensorFlow는 macOS 10.12.6(Sierra) 이상에서 지원됩니다. Windows 7 이상 우분투 16.04 이상; 및 Raspbian 9.0 이상

12. 파이게임

PyGame 패키지는 SDL(Simple Directmedia Library) 플랫폼 독립적인 그래픽, 오디오 및 입력 라이브러리에 대한 인터페이스를 제공합니다.

설치

PyGame을 설치하기 전에 Python 2.7을 설치해야 합니다. Python 2.7이 설치되면 공식 PyGame 설치 프로그램을 다운로드해야 합니다. 해당 파일이 실행됩니다.

  • PyGame에 필요한 모듈을 가져오려면 "import pygame" 명령이 필요합니다.
  • "pygame.init()" 명령은 PyGame에 필요한 모듈을 초기화하는 데 필요합니다.
  • "pygame.display.set_mode((width, height))" 함수는 그래픽 작업을 수행할 창을 시작합니다.
  • "pygame.event.get()" 명령은 큐에 있는 이벤트를 비우는 데 도움이 됩니다. 그렇지 않으면 이벤트가 쌓여 게임이 응답하지 않을 위험이 있습니다.
  • 게임을 종료하기 전에 "pygame.QUIT" 기능이 사용됩니다.
  • "pygame.display.flip()" 명령은 게임에 대한 업데이트를 표시하는 데 사용됩니다.

13. 파이토치

PyTorch는 두 가지 고급 기능을 혼합한 Python 기반 라이브러리입니다.

  • 강력한 GPU 가속을 사용한 텐서 계산(NumPy와 같은)
  • Deep Neural Network 플랫폼은 유연성과 속도를 제공합니다.

2017년 Facebook에 의해 소개되었습니다. PyTorch의 일부 기능은 다음과 같습니다.

  • Python 및 해당 라이브러리를 지원합니다.
  • 딥 러닝 요구 사항을 위해 Facebook 개발에 사용됩니다.
  • 더 나은 사용성과 이해를 위한 사용하기 쉬운 API.
  • 코드 실행의 어느 지점에서나 그래프는 동적으로 구축될 수 있으며 런타임에 동적으로 계산될 수 있습니다.
  • 쉬운 코딩 및 빠른 처리.
  • CUDA에서 지원하므로 GPU 머신에서 실행할 수 있습니다.

설치

PyTorch는 명령 프롬프트를 통해 또는 IDE 내에서 설치할 수 있습니다.

14. 테아노

수학 연산에 사용되는 다른 라이브러리와 유사하게 Theano는 사용자가 수학 표현식을 정의, 최적화 및 평가할 수 있도록 합니다. 효율적인 수학적 계산을 위해 큰 다차원 배열이 필요합니다. 일반 C 기반 코드는 방대한 양의 데이터를 고려할 때 느려집니다. 그러나 라이브러리의 가용성으로 Theano는 코드를 신속하게 구현할 수 있습니다. 불안정한 표현식을 인식하고 계산할 수 있으므로 NumPy보다 라이브러리가 더 유용합니다.

15. 심파이

패키지는 ano 라이브러리에 가장 가깝고 모든 기호 수학에서 사용됩니다. 패키지에서 제공하는 간단한 코드로 라이브러리는 컴퓨터 대수 시스템에서 효과적으로 사용할 수 있습니다. Python으로만 작성된 SymPy는 다른 응용 프로그램에서 사용자 정의하고 적용할 수 있습니다. 패키지의 소스 코드는 GitHub에서 찾을 수 있습니다.

16. 카페2

Caffe2는 딥러닝을 위한 파이썬 기반 프레임워크입니다. Caffe2 패키지의 일부 기능은 다음과 같습니다.

  • 대규모 분산 교육을 지원합니다.
  • 새로운 하드웨어를 지원합니다.
  • 양자화 계산과 같은 여러 계산에 적용 가능.

이 패키지는 MacOSX, Ubuntu, CentOS, Windows, iOS, Android, Raspbian 및 Tegra와 같은 운영 체제와 호환됩니다. 소스, 도커 이미지 또는 클라우드에서 빌드된 사전 빌드 라이브러리에서 설치할 수 있습니다. 설치 가이드를 사용할 수 있습니다

17. 누픽

라이브러리는 Numenta Platform for Intelligent Computing(NuPIC)의 약자입니다. HTM 학습 알고리즘의 구현을 위한 플랫폼을 제공합니다. 신피질을 기반으로 하는 이 라이브러리를 기반으로 미래의 기계 학습 알고리즘을 구축할 수 있습니다. HTM은 시간 기반 연속 학습 알고리즘을 포함하며 신피질의 상세한 계산 이론입니다. 알고리즘은 공간 및 시간 패턴의 저장 및 회수와 관련이 있습니다. 이상 감지 등의 문제는 NuPIC를 사용하여 해결할 수 있습니다.

파일은 "https://pypi.org/project/nupic/" 링크에서 다운로드할 수 있습니다.

18. 피펜

Pipenv는 2017년 공식적으로 파이썬 라이브러리 에 포함되었습니다. 워크플로의 문제를 해결하는 파이썬 패키징 도구입니다. 패키지의 주요 목적은 사용자가 쉽게 설정할 수 있는 환경을 제공하는 것입니다. 번들러, 컴포저, npm, 카고, 얀 등 모든 패키징 세계를 수집하고 파이썬 환경에 통합합니다. Pipenv가 해결한 몇 가지 문제는 다음과 같습니다.

  • 사용자는 더 이상 "pip"와 "virtualenv"를 별도로 사용하여 공동 작업을 수행할 필요가 없습니다.
  • 사용자는 종속성 그래프에 대한 적절한 통찰력을 얻을 수 있습니다.
  • .env 파일을 통해 개발 워크플로를 간소화합니다.

설치

  • Debian Buster에서 "$ sudo apt install pipenv" 명령을 통해.
  • Fedora에서 "$ sudo dnf install pipenv" 명령을 통해.
  • FreeBSD에서 "pkg install py36-pipenv" 명령을 통해.
  • "$ pipx install pipenv"를 사용하여 Pipx를 통해.

19. 파이브레인

PyBrain은 연구 분야의 모든 초급 학생을 위한 기계 학습 알고리즘에 사용되는 Python에서 사용 가능한 라이브러리의 오픈 소스 라이브러리 입니다. PyBrain의 목표는 기계 학습 작업을 위해 유연하고 사용하기 쉬운 알고리즘을 제공하는 것입니다. 또한 알고리즘을 비교하기 위한 사전 정의된 환경을 제공합니다. PyBrain은 Python 기반 강화 학습, 인공 지능 및 신경망 라이브러리의 약자입니다. 파이썬에서 제공하는 다른 기계 학습 라이브러리와 비교할 때 PyBrain은 빠르고 쉽게 이해할 수 있습니다.

PyBrain의 일부 기능은 다음과 같습니다.

  1. 네트워크: 네트워크는 링크를 통해 연결된 모듈로 정의됩니다. PyBrain이 지원하는 네트워크는 Feed-Forward Network, Recurrent Network 등입니다.
    • 정보가 한 노드에서 다른 노드로 순방향으로 전달되는 네트워크를 Feed-Forward 네트워크라고 합니다. 이 유형의 네트워크에서는 정보가 뒤로 이동하지 않습니다. 인공 신경망이 제공하는 최초이자 가장 간단한 네트워크 중 하나입니다. 데이터의 흐름은 입력 노드에서 숨겨진 노드로, 마지막으로 출력 노드로 이동합니다.
    • Feed-Forward 노드와 유사하게 각 단계에서 정보를 기억해야 하는 반복 노드가 있습니다.
  1. 데이터 세트: 데이터 세트에는 네트워크의 테스트, 검증 및 교육을 위해 네트워크에 제공되는 데이터가 포함됩니다. 머신 러닝으로 수행할 작업에 따라 다릅니다. PyBrain은 SupervisedDataSet 및 ClassificationDataSet과 같은 두 가지 유형의 데이터 세트를 대부분 지원합니다.
    • SupervisedDataSet: 이러한 유형의 데이터 세트는 주로 지도 학습 작업에 사용됩니다. 데이터 세트의 필드는 "입력"과 "타겟"입니다.
    • ClassificationDataSet: 이러한 유형의 데이터 세트는 주로 분류 작업에 사용됩니다. "input" 및 "target" 필드와 함께 "class"와 같은 추가 필드가 있습니다. "클래스"에는 대상의 자동 백업이 포함됩니다.
  1. 트레이너: 신경망의 데이터는 네트워크에 제공된 훈련 데이터로 훈련됩니다. 네트워크가 제대로 훈련되었는지 확인하기 위해 해당 네트워크의 테스트 데이터 예측을 분석합니다. PyBrain에서 주로 사용되는 두 가지 유형의 트레이너는 다음과 같습니다.
    • Backprop Trainer: 네트워크의 매개변수는 오류를 역전파하여 지도 또는 ClassificationDataSet 데이터 세트를 기반으로 훈련됩니다.
    • TrainUntilConvergence: 모듈은 수렴될 때까지 학습됩니다.
  1. 시각화 : Mathplotlib, pyplot 등과 같은 다른 프레임워크를 통해 데이터 시각화를 수행할 수 있습니다.

20. 우유

Python의 기계 학습 패키지 "MILK"는 지도 분류에 사용 가능한 분류기 사용에 중점을 둡니다. 사용 가능한 분류기는 SVM, k-NN, 랜덤 포레스트 및 결정 트리입니다. 분류와 함께 MILK는 기능 선택 프로세스를 돕습니다. 분류기의 조합은 분류 시스템에 따라 다릅니다.

  • 감독되지 않은 분류 문제의 경우 MILK는 -means 클러스터링 및 선호도 전파를 사용합니다.
  • MILK에 대한 입력은 다양합니다. 대부분 NumPy 배열에 최적화되어 있지만 다른 형식의 입력도 허용됩니다.
  • MILK의 코드는 낮은 메모리를 사용하고 고속인 C++로 작성되었습니다.

설치

MILK의 설치 코드는 Github에서 검색할 수 있습니다. 설치에 사용되는 명령은 "easy_install milk" 또는 "pip install milk"입니다.

툴킷에 대한 자세한 정보는 링크에서 검색할 수 있습니다.

결론

사용하기 쉬운 파이썬 언어는 현실 세계의 여러 영역에서 폭넓게 응용되고 있습니다. 높은 수준의 동적으로 유형이 지정되고 해석되는 언어인 이 언어는 오류 디버깅 영역에서 빠르게 성장하고 있습니다. python이 점점 더 많이 사용되는 글로벌 응용 프로그램 중 일부는 YouTube, DropBox 등이 있습니다. 또한 python 에서 라이브러리를 사용할 수 있으므로 사용자는 자신의 코드를 작성하지 않고도 많은 작업을 수행할 수 있습니다.

Python 라이브러리 및 데이터 과학에 대해 자세히 알아보려면 작업 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크샵, 업계와의 멘토링을 제공하는 IIIT-B & upGrad의 데이터 과학 이그 제 큐 티브 PG 프로그램을 확인하십시오. 전문가, 업계 멘토와의 1:1 학습, 최고의 기업과의 400시간 이상의 학습 및 직업 지원.

Python에서 데이터 과학을 위한 최고의 라이브러리는 무엇입니까?

- Pandas는 주로 데이터 분석에 사용되는 Python 라이브러리입니다. 가장 널리 사용되는 Python 라이브러리 중 하나입니다. 데이터 탐색, 정리 및 분석에 가장 필수적인 도구에 액세스할 수 있습니다.
- NumPy는 N차원 배열 지원으로 잘 알려져 있습니다. NumPy는 이러한 다차원 배열이 Python 목록보다 50배 더 ​​탄력적이기 때문에 데이터 과학자들 사이에서 인기가 있습니다.
- Scikit-learn은 Python에서 가장 중요한 기계 학습 라이브러리일 것입니다. Scikit-learn은 Pandas 또는 NumPy로 데이터를 정리하고 처리한 후 기계 학습 모델을 구축하는 데 사용됩니다. 여기에는 예측 모델링 및 분석을 위한 많은 도구가 포함되어 있습니다.
- TensorFlow는 신경망 생성에 가장 널리 사용되는 Python 라이브러리 중 하나입니다. 텐서라고도 하는 다차원 배열을 사용하여 단일 입력에서 여러 작업을 실행합니다.
- Keras는 주로 딥 러닝 모델, 특히 신경망을 구축하는 데 사용됩니다. TensorFlow 및 Theano를 기반으로 하며 신경망을 빠르게 생성할 수 있습니다.
- SciPy는 이름에서 알 수 있듯이 주로 NumPy에서 생성된 과학 및 수학 함수에 사용됩니다. 통계 함수, 최적화 함수 및 신호 처리 함수는 이 라이브러리에서 제공하는 유용한 기능 중 일부입니다.

Python에서 모듈 라이브러리의 중요성은 무엇입니까?

모듈은 논리적인 방식으로 파이썬 코드를 구성하는 데 도움이 됩니다. 코드는 모듈로 구성될 때 이해하고 활용하기 쉽습니다. 모듈을 쉽게 바인딩하고 참조할 수 있습니다. 모듈은 임의로 명명된 속성을 포함하는 Python 객체입니다.
모듈은 단순히 Python 코드가 포함된 파일입니다. 변수, 클래스 및 함수는 모두 모듈에서 정의할 수 있습니다. 실행 가능한 코드는 모듈에 포함될 수도 있습니다.

Python 라이브러리를 가져오려면 어떻게 해야 합니까?

모듈의 기능을 활용하려면 먼저 import 문을 통해 모듈을 가져와야 합니다. import 문에서 import 키워드 뒤에 모듈 이름이 옵니다. 이것은 Python 파일의 모든 shebang 라인 또는 일반 주석 아래에 프로그램 상단에 명시됩니다.