2022년 일반적인 R 인터뷰 질문 및 답변 20개

게시 됨: 2021-01-10

지난 몇 년 동안 R 프로그래밍 언어는 데이터 과학 및 기계 학습 커뮤니티에서 상당한 관심을 받았습니다. 이는 주로 통계 분석, 데이터 시각화, 데이터 조작, 예측 모델링, 예측 분석 등에 사용할 수 있는 다목적 언어이기 때문입니다.

R을 둘러싼 취업 기회가 빠르게 증가하고 데이터 과학 과정이 번창함에 따라 오늘 우리는 취업 도메인의 첫 번째 부분인 R 인터뷰에 초점을 맞출 것입니다. 다음은 R 인터뷰에서 가장 자주 묻는 질문 목록입니다!

  1. R은 무엇입니까?

R은 통계 컴퓨팅 및 그래픽용으로 특별히 설계된 프로그래밍 언어 및 환경입니다. 선형 회귀, 분류, 클러스터링, 시계열 분석, 통계적 추론, ML 알고리즘 등을 포함한 광범위한 통계 및 그래픽 방법 카탈로그와 함께 제공됩니다.

  1. R에서 다른 데이터 구조의 이름을 지정하십시오.

R에는 네 가지 기본 데이터 구조가 있습니다.

  • 벡터 – 동일한 유형에 속하는 데이터 요소의 시퀀스입니다. Vector 내의 구성원을 구성 요소라고 합니다.
  • 목록 – 숫자, 문자열, 벡터 또는 다른 목록을 포함하여 다양한 유형의 요소를 포함할 수 있는 R 개체입니다.
  • 행렬 - 같은 길이의 벡터를 묶을 수 있는 2차원 데이터 구조입니다. Matrix 내의 요소는 동일한 유형(숫자, 문자, 논리 또는 복합)이어야 합니다.
  • 데이터 프레임 – 매트릭스의 보다 일반적인 버전입니다. 즉, 다양한 데이터 유형의 요소를 포함할 수 있습니다. Dataframe은 Matrices와 Lists의 특성을 직사각형 목록과 같이 결합하며 해당 열은 일반적으로 다른 데이터 유형을 갖습니다.
  1. 그래픽 문법의 다양한 구성 요소의 이름은?

그래픽 문법의 다른 구성 요소는 다음과 같습니다.

  • 데이터 레이어
  • 패싯 레이어
  • 테마 레이어
  • 미학 레이어
  • 기하학 레이어
  • 좌표 레이어
  1. R에 패키지를 설치하는 방법은 무엇입니까?

R에 패키지를 설치하려면 다음 명령을 작성해야 합니다.

install.packages("<패키지 이름>")

  1. R에서 데이터를 어떻게 가져오나요?

R에서 데이터를 가져오려면 R 콘솔에 "Rcmdr" 명령을 입력하여 R 커맨더 GUI를 사용해야 합니다. R에서 데이터를 가져오는 세 가지 방법이 있습니다.

데이터 세트의 이름을 입력하거나 적합하다고 생각되는 대로 대화 상자에서 데이터 세트를 선택할 수 있습니다.

  • R Commander: Data->New Data Set의 편집기를 사용하여 데이터를 직접 입력할 수 있습니다. 이것은 중소 규모의 데이터 세트에 가장 적합합니다.
  • 클립보드, URL, 일반 텍스트 파일(ASCII) 또는 통계 패키지에서 데이터를 가져올 수 있습니다.
  1. Rmarkdown이란 무엇입니까?

RMarkdown은 R의 보고 도구입니다. 이를 통해 R 코드의 고품질 보고서를 작성할 수 있습니다.

Rmarkdown의 출력 형식에는 세 가지 유형이 있습니다.

  • HTML
  • 단어
  • PDF
  1. R에서 "t-test()"는 무엇입니까?

R에서 t-test()는 두 그룹의 평균이 서로 같은지 여부를 결정하는 데 사용됩니다.

  1. 데이터 대치에 사용되는 R 패키지는 무엇입니까?

데이터 대치에 가장 일반적으로 사용되는 R 패키지는 다음과 같습니다.

  • 마우스
  • 흐미스크
  • 아멜리아
  • 전가
  • 미스 포레스트
  1. R에서 "혼돈 행렬"이란 무엇입니까?

R에서 혼동 행렬은 개발된 모델의 정확도를 평가하는 데 사용됩니다. "caTools" 패키지에 포함된 "confusionmatrix()" 함수를 사용하여 관찰 및 예측 클래스의 교차표 계산을 제공합니다.

10. 랜덤 포레스트란 무엇입니까? R에서 랜덤 포레스트를 어떻게 구축하고 평가할 수 있습니까?

Random Forest는 많은 의사 결정 트리 모델의 조합으로 구축된 앙상블 분류기입니다. 수많은 의사결정 트리 모델의 결과를 결합하기 때문에 개별 모델의 결과보다 훨씬 정확합니다.

R에서 랜덤 포레스트 모델을 구축하려면 훈련 데이터 세트가 있어야 합니다. 그런 다음 다음을 수행하여 진행합니다.

먼저 데이터 세트를 훈련 세트와 테스트 세트로 분리 ->

  • 이제 기차 세트에서 Random Forest 모델을 빌드하십시오.
  • 마지막으로 테스트 세트에서 Random Forest 모델을 예측합니다->
  1. ShinyR은 무엇입니까?

ShinyR은 R을 사용하여 직접 대화형 웹 앱을 쉽고 안전하게 개발할 수 있는 R 패키지입니다.

ShinyR을 사용하면 웹 페이지에서 독립 실행형 앱을 호스팅하거나 Rmarkdown 문서에 포함할 수도 있습니다. 또한 CSS 테마, JavaScript 작업 및 HTML 위젯과 함께 작동하도록 반짝이는 앱을 확장할 수 있습니다.

  1. R에서 데이터 마이닝에 사용되는 패키지의 이름을 지정하십시오.

데이터 마이닝에 사용되는 R 패키지는 다음과 같습니다.

  • Rpart 및 캐럿
  • 데이터.테이블
  • 예측
  • GG플롯
  • 아룰레스
  • 티엠
  1. 로지스틱 회귀와 포아송 회귀의 목적은 무엇입니까?

로지스틱 회귀는 주어진 연속 예측 변수 집합에서 이진 결과를 예측하는 데 도움이 되는 반면 푸아송 회귀는 주어진 연속 예측 변수 집합에서 "카운트"를 나타내는 결과 변수를 예측하는 데 사용됩니다.

  1. R에서 결측값은 어떻게 표현됩니까?

R에서 누락된 값은 NA(사용할 수 없음) 기능으로 표시됩니다. 그러나 불가능한 값의 경우 NaN(숫자가 아님)이 사용됩니다.

  1. R에서 데이터 세트를 추가하는 데 사용되는 함수는 무엇입니까?

R에서 "rbind" 함수는 두 개의 데이터 프레임 또는 데이터 세트를 결합하는 데 사용됩니다. 그러나 두 데이터 프레임/데이터 세트에는 동일한 유형의 변수가 포함되어야 합니다.

  1. R에서 데이터를 어떻게 저장합니까?

R에서 데이터를 저장하는 방법은 여러 가지가 있지만 가장 효율적인 방법은 다음과 같습니다.

데이터 > 활성 데이터 세트 > 활성 데이터 세트 내보내기

그 후에 대화 상자가 나타납니다. 해당 대화 상자를 클릭하면 평소처럼 데이터를 저장할 수 있습니다.

  1. R의 정렬 알고리즘은 무엇입니까?

R에는 5가지 유형의 정렬 알고리즘이 있습니다.

  • 선택 정렬
  • 버킷 정렬
  • 버블 정렬
  • 병합 정렬
  • 빠른 정렬
  1. 백색소음 모델이란?

WN(화이트 노이즈) 모델은 시계열 모델입니다. 정지 과정을 묘사하는 가장 간단한 방법입니다.

WN 모델은 다음으로 구성됩니다.

  • 고정 상수 평균
  • 고정 상수 분산
  • 시간에 따른 상관관계 없음
  1. R에서 가져오기 함수의 이름을 지정합니다.

R의 다양한 가져오기 기능은 다음과 같습니다.

  • read.csv()->
  • read_sas()->
  • read_excel()->
  • read_sav()->
  1. R에서 디버깅에 사용되는 함수의 이름을 지정하십시오.

R에서 디버깅에 사용되는 함수는 다음과 같습니다.

  • 역 추적()
  • 디버그()
  • 브라우저()
  • 추적하다()
  • 다시 덮다()

자, 여기 있습니다! 이것은 가장 일반적으로 묻는 R 인터뷰 질문 중 일부입니다. 이것이 당신이 얼음을 깨고 꾸준히 언어를 파헤치는 데 도움이 되기를 바랍니다.

즐거운 배움!

R의 데이터 구조는 무엇입니까?

데이터 구조는 데이터를 효율적으로 사용하기 위해 데이터를 저장하는 컨테이너입니다. 기본적으로 R 언어에는 4가지 데이터 구조가 있습니다. Vector는 컨테이너 역할을 하고 유사한 데이터 유형의 값을 저장하는 동적으로 할당된 데이터 구조입니다. 벡터에 저장된 데이터 값을 구성요소라고 합니다. 목록은 정수, 문자열, 문자 또는 다른 목록과 같은 여러 데이터 유형의 데이터 값을 저장할 수 있는 R 개체로 간주될 수 있습니다. Matrix는 같은 길이의 벡터를 묶는 격자형 데이터 구조입니다. 이는 2차원 데이터 구조이며 그 안의 모든 요소는 동일한 데이터 유형이어야 합니다. 데이터 프레임은 더 일반적이라는 점을 제외하고는 행렬과 유사합니다. 정수, 문자열 및 문자와 같은 다양한 데이터 유형의 값을 보유할 수 있습니다. 목록과 행렬의 특성을 조합하여 보여줍니다.

랜덤 포레스트란?

랜덤 포레스트는 앙상블 분류기입니다. 이름에서 알 수 있듯이 여러 의사 결정 트리를 구성하고 바인딩하여 모델의 예측 정확도를 향상시킵니다. 각 관찰은 각 의사 결정 트리에 제공되며 본질적으로 비선형입니다. R에서 랜덤 포레스트를 구축하려면 트레이닝 데이터 세트가 필요합니다. 트레이닝 데이터 세트를 수집하고 나면 랜덤 포레스트를 달성하기 위해 따라야 하는 두 가지 중요한 단계가 있습니다. 데이터 세트를 트레이닝 데이터 세트와 테스트 데이터 세트로 나눕니다. 훈련 데이터 세트를 사용하여 랜덤 포레스트를 구성하고 테스트 데이터 세트를 사용하여 랜덤 포레스트 모델을 예측합니다.

ShinyR이란 무엇이며 그 의미는 무엇입니까?

ShinyR은 대화형 웹 애플리케이션 및 프로젝트를 개발하는 데 사용되는 강력한 웹 프레임워크를 제공하는 R 언어의 오픈 소스 패키지입니다. ShinyR을 사용하면 HTML, CSS 또는 JavaScript와 같은 눈에 띄는 웹 기술 없이도 분석을 웹 애플리케이션으로 변환할 수 있습니다. 이처럼 강력한 도구임에도 불구하고 배우기 쉽고 암시하기도 쉽습니다. ShinyR로 개발된 앱은 HTML 위젯, CSS 테마 및 JavaScript 작업과 함께 효율적으로 사용되도록 확장할 수 있습니다. 또한 ShinyR을 사용하면 웹 페이지에서 독립 실행형 앱을 호스팅하거나 Rmarkdown 문서에 포함할 수도 있습니다.