Python 및 Pandas의 DateTime 기능: 알아야 할 사항은 무엇입니까?
게시 됨: 2021-03-09이 기사에서는 pandas DateTime 기능을 다루고 Python에서 시계열 데이터 세트로 작업하는 동안 필요한 정보를 제공합니다.
Python은 전 세계적으로 사용 측면에서 상위 5개 프로그래밍 언어 중 하나입니다. 전 세계 개발자의 약 44%가 데이터 과학 관련 작업에 정기적으로 이를 사용합니다. 그리고 이를 위해 크레딧을 받아야 하는 것은 방대한 파이썬 라이브러리입니다. Pandas는 그러한 데이터 분석 라이브러리 중 하나입니다.
순전히 C 또는 Python으로 작성되어 고도로 최적화된 백엔드 소스 코드를 제공합니다. 게다가 파이썬은 문법이 명확하고 학습 곡선이 낮아 초보자에게 이상적입니다. 이 언어에 대한 지식이 있으면 마이크로 프로젝트에서 거시 기업에 이르기까지 무엇이든 구현할 수 있습니다.
Pandas 라이브러리에 대한 적절한 수준의 지식과 경험을 가진 Python 개발자는 데이터 분석가, 비즈니스 분석가 및 기계 학습 엔지니어를 포함한 여러 데이터 과학 직업에 대한 수요도 있습니다. 이러한 경력 궤적은 후보자가 통계, 빅 데이터 분석, 예측 분석(파이썬 사용), 시각화 등에 익숙해야 합니다.
따라서 분석에 관심이 있는 공학 학생은 이러한 기술을 강조하는 전문 학위를 취득할 수 있습니다. IIIT-Bangalore 의 데이터 과학 PG 디플로마 와 같은 단기 인증을 추구 하거나 M.Sc. 영국 리버풀 존 무어스 대학교(LJMU) 에서 데이터 과학 박사 .
이제 현대 기술 분야에서 파이썬과 팬더의 관련성에 대한 간략한 배경을 제공했으므로 pandas DateTime 에 대한 단계별 자습서를 시작하겠습니다 .
목차
DateTime 변수 설명
프로젝트 작업을 할 때와 같이 파이썬을 배우는 중간 단계에서 DateTime을 접하게 될 것입니다. 공급망 파이프라인에 대한 전략을 수립해야 하는 전자 상거래 프로젝트를 구현해야 한다고 가정합니다. 여기에는 주문 배송 시간, 배송 일수 등을 파악하는 것이 포함됩니다.
Python의 날짜 및 시간 구성 요소에 익숙하지 않은 경우 이 문제의 데이터 과학 측면은 초보자가 풀기 어려울 수 있습니다. 반면에 이러한 기능을 처리하는 방법을 알고 있다면 거의 모든 데이터 세트에서 깊은 통찰력을 수집할 수 있습니다.
초보자를 위해 파이썬의 날짜 클래스는 그레고리력의 날짜를 처리합니다. 이 클래스는 "년, 월, 일"을 정수 인수로 받아들입니다. 반면 시간 클래스는 최대 마이크로초의 정수 인수로 구성됩니다.
다음은 시작하는 데 도움이 되는 Pandas 함수와 함께 Python의 DateTime 변수에 대한 개요입니다!
Python에서 DateTime으로 작업하기
Python에서 DateTime 클래스의 날짜 개체를 만드는 방법을 이해하려면 아래에 제공된 예제 명령문을 고려하십시오.
날짜/시간 가져오기 날짜부터
d1 = 날짜(2021,2,23)
인쇄(d1)
인쇄(유형(d1))
결과
2021-04-23
<클래스 'datetime.date'>
이제 위에서 만든 날짜 개체에서 일, 월, 연도와 같은 다른 기능을 추출해 보겠습니다. 오늘() 함수를 사용하는 것과 관련된 현재 현지 날짜 날짜 개체를 사용하여 수행합니다.
# 현재 날짜
d1 = 날짜.오늘()
인쇄(d1)
# 일
인쇄('요일 : ' , d1.day)
# 월
print( '월 : ' , d1.month)
# 년도
print( '연도 : ' ,d1.year)
반환된 DateTime 객체
2021-02-23
일 : 23
월 : 2
연도 : 2021년
정수 값을 허용하고 개체를 반환하는 DateTime 모듈의 또 다른 클래스는 시간입니다. 파이썬에서 어떻게 하는지 살펴보자.
날짜/시간 가져오기 시간부터
t1 = (12,20,12,40)
인쇄(t1)
인쇄(유형(t1))
결과
12:20:12.000040
<클래스 'datetime.time'>
보시다시피 위의 시간 개체는 마이크로초 단위입니다. 따라서 이제 개체에서 시, 분, 초 및 마이크로초와 같은 시간 속성을 추출할 수 있습니다.
#시
print('시:'t1.hour)
#분
print('분:'t1.분) 날짜/시간
초 및 마이크로초 동안 동일한 작업을 반복할 수 있습니다.
다음은 유용할 수 있는 몇 가지 다른 방법입니다.
- replace(): 이전 날짜를 업데이트합니다.
- weekday(): 요일에 대한 정수 값을 반환합니다. 월요일은 0이고 일요일은 6입니다.
- isoweekday(): 1에서 7 사이의 요일 정수 값의 경우.
- isocalendar(): 주어진 데이터 세트에서 '연도'의 날짜 값을 슬라이싱합니다.
- isleap(): 윤년인지 확인합니다.
- fromisoformat(): ISO 형식의 문자열 형식을 DateTime 개체로 변환합니다.
- isoformat(): DateTime 객체에서 ISO 형식 날짜를 생성합니다.
- format(): 고유한 형식을 정의합니다.
이제 파이썬에서 DateTime 객체를 생성하는 방법을 이해했으므로 Pandas 라이브러리가 이를 지원하는 방법을 살펴보겠습니다.
팬더 to_datetime 예
pandas를 사용하면 특히 python DateTime 객체를 사용하여 다양한 데이터 분석 작업을 수행할 수 있습니다. 대표적인 메소드로는 to_datetime()이 있습니다. 처리 방법은 다음과 같습니다.
- pandas to_datetime 메서드를 사용하면 문자열 형식 날짜 및 시간을 DateTime 개체로 변환할 수 있습니다.
# to_datetime
날짜 = pd.to_datetime( '2020년 4월 24일')
인쇄(날짜)
인쇄(유형(날짜))
결과
2021-02-23 00:00:00
<클래스 팬더._libs.tslib.timestamp.Timestamp'>
여기서 이상한 점을 발견할 수 있습니까? pandas to_datetime 이 반환하는 객체 는 동일하지 않습니다. DateTime 객체 대신 Timestamp입니다. 이것이 Pandas 라이브러리가 객체를 반환하는 방법입니다. 타임스탬프는 파이썬의 DateTime 기능과 동일합니다.
DateTime의 필요성
특정 문제를 이해하기 위해 날짜 및 시간 속성을 추출할 수 있도록 일정 기간 동안 정보를 수집하는 몇 가지 실제 시나리오가 있습니다. 예를 들어 독서 습관을 분석하려고 합니다. 주말이나 주중, 밤이나 아침 등 독서를 선호하는지 여부에 따라 패턴을 파헤쳐 해체할 수 있습니다. 그런 다음 한 달 동안 읽고 싶은 흥미로운 책과 기사를 모두 모아 일정을 정리할 수 있습니다.
이를 통해 Python 및 pandas DateTime 에서 날짜-시간 조작을 처리하는 방법에 대한 '방법' 요약을 제공했습니다 . 이 기사에서 배운 것을 연습하고 시계열 데이터 세트 작업 기술을 마스터하기를 바랍니다!
세계 최고의 대학에서 데이터 과학 과정 을 배우십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 획득하여 경력을 빠르게 추적하십시오.
결론
Python, Pandas를 비롯한 Python의 다양한 라이브러리 및 데이터 과학에서의 응용에 대해 자세히 알아보려면 작업 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크샵, 업계 전문가와의 멘토링, 업계 멘토와의 1:1, 일류 기업과의 400시간 이상의 학습 및 직업 지원.
다음은 Pandas를 가장 인기 있는 Python 라이브러리 중 하나로 만드는 기능입니다. DateTime은 다양한 형식으로 위치의 실시간 날짜와 시간을 반환하는 Pandas의 중요한 기능입니다. 다음은 유용할 수 있는 몇 가지 기능입니다. Pandas와 Numpy는 의심할 여지 없이 가장 많이 사용되는 Python 라이브러리입니다. 다음 비교는 Pandas와 Numpy 라이브러리 간의 핵심 차이점을 식별합니다.Pandas를 인기 있는 라이브러리로 만드는 기능은 무엇입니까?
Pandas는 효율적인 데이터 표현을 허용할 뿐만 아니라 이를 조작할 수 있는 다양한 데이터 프레임을 제공합니다.
데이터에 레이블을 지정하고 구성하는 지능적인 방법을 제공하는 효율적인 정렬 및 인덱싱 기능을 제공합니다.
Pandas의 일부 기능은 코드를 깔끔하게 만들고 가독성을 높여 더 효율적으로 만듭니다.
또한 여러 파일 형식을 읽을 수 있습니다. JSON, CSV, HDF5 및 Excel은 Pandas에서 지원하는 파일 형식 중 일부입니다.
여러 데이터 세트를 병합하는 것은 많은 프로그래머에게 진정한 도전이었습니다. Pandas는 이것을 극복하고 여러 데이터 세트를 매우 효율적으로 병합합니다.
Pandas는 Matplotlib 및 NumPy와 같은 다른 중요한 Python 라이브러리에 대한 액세스도 제공하므로 매우 효율적인 라이브러리입니다. Pandas의 DateTime 기능을 사용하는 방법은 무엇입니까?
replace(): 이전 날짜를 업데이트합니다.
weekday(): 월요일을 0으로 시작하여 일요일을 6으로 매일 정수 값을 반환합니다.
isoweekday(): 1에서 7 사이의 요일 정수 값을 반환합니다.
isocalendar(): 주어진 데이터 세트에서 '연도'의 날짜 값을 슬라이싱합니다.
isleap(): 윤년이면 함수를 확인합니다.
fromisoformat(): ISO 형식의 문자열 형식을 DateTime 개체로 변환합니다.
isoformat(): DateTime 객체에서 ISO 형식 날짜를 생성합니다.
format(): 고유한 형식을 정의합니다. Pandas 라이브러리는 Numpy와 어떻게 다릅니까?
A. 판다 -
1. 테이블 형식의 데이터를 분석하고 시각화하는 데 선호됩니다.
2. Pandas를 사용하여 다양한 파일 형식의 데이터를 쉽게 가져올 수 있습니다. XLSX, ZIP, 텍스트, HTML, XML, JSON 등을 지원합니다.
3. 많은 양의 데이터를 다룰 때 더 빠른 성능을 보인다.
4. 메모리에서 상대적으로 더 많은 공간을 차지합니다.
B. 넘피 -
1. 수학 연산 및 수치 계산을 수행하는 데 선호됩니다.
2. 다차원 배열에 저장된 데이터는 이 라이브러리에서 지원됩니다.
3. 적은 양의 데이터를 처리할 때 더 나은 성능을 보입니다.
4. 메모리 공간을 덜 차지합니다.