2022年の20の一般的なRインタビューの質問と回答

公開: 2021-01-10

過去数年にわたって、Rプログラミング言語はデータサイエンスと機械学習のコミュニティで大きな牽引力を獲得してきました。 これは主に、統計分析、データの視覚化、データ操作、予測モデリング、予測分析などに使用できる多目的言語であるためです。

Rを取り巻く雇用機会が急速に増加し、データサイエンスのコースが盛んになっているため、今日は、ドメインに就職する最初の部分であるR面接に焦点を当てます。 これがRインタビューで最もよく聞かれる質問のリストです!

  1. Rとは何ですか?

Rは、統計計算とグラフィックス用に特別に設計されたプログラミング言語と環境です。 線形回帰、分類、クラスタリング、時系列分析、統計的推論、MLアルゴリズムなど、統計的およびグラフィカルな方法の広範なカタログが付属しています。

  1. Rでさまざまなデータ構造に名前を付けます。

Rには4つの主要なデータ構造があります。

  • ベクトル–同じタイプに属するデータ要素のシーケンスです。 ベクター内のメンバーは、コンポーネントと呼ばれます。
  • リスト–これは、数値、文字列、ベクトル、または別のリストなど、さまざまなタイプの要素を含むことができるRオブジェクトです。
  • 行列–同じ長さのベクトルをバインドできる2次元のデータ構造です。 マトリックス内の要素は、同じタイプ(数値、文字、論理、または複合)である必要があります。
  • データフレーム–マトリックスのより一般的なバージョンです。つまり、さまざまなデータ型の要素を含めることができます。 データフレームは、長方形のリストのように行列とリストの特性を組み合わせており、その列には通常、さまざまなデータ型があります。
  1. グラフィックの文法のさまざまなコンポーネントに名前を付けますか?

グラフィックの文法のさまざまなコンポーネントは次のとおりです。

  • データ層
  • ファセットレイヤー
  • テーマレイヤー
  • 美学レイヤー
  • ジオメトリレイヤー
  • コーディネートレイヤー
  1. Rにパッケージをインストールする方法は?

Rにパッケージをインストールするには、次のコマンドを作成する必要があります。

install.packages(“ <package_name>”)

  1. データはRにどのようにインポートされますか?

Rにデータをインポートするには、Rコンソールにコマンド「Rcmdr」を入力してRコマンダーGUIを使用する必要があります。 Rにデータをインポートする方法は3つあります。

データセットの名前を入力するか、適切と思われるダイアログボックスでデータセットを選択できます。

  • R Commanderのエディターを使用してデータを直接入力できます:[データ]->[新しいデータセット]。 これは、中小規模のデータセットに最適です。
  • クリップボード、URL、プレーンテキストファイル(ASCII)、または任意の統計パッケージからデータをインポートできます。
  1. Rmarkdownとは何ですか?

RMarkdownはRのレポートツールです。 これにより、Rコードの高品質なレポートを作成できます。

Rmarkdownの出力形式には次の3つのタイプがあります。

  • HTML
  • PDF
  1. Rの「t-tests()」とは何ですか?

Rでは、t-test()を使用して、2つのグループの平均が互いに等しいかどうかを判断します。

  1. データの代入に使用されるRパッケージは何ですか?

データの代入に最も一般的に使用されるRパッケージは次のとおりです。

  • マウス
  • Hmisc
  • アメリア
  • imputeR
  • missForest
  1. Rの「混同行列」とは何ですか?

Rでは、開発されたモデルの精度を評価するために混同行列が使用されます。 「caTools」パッケージに含まれる「confusionmatrix()」関数を使用して、観測されたクラスと予測されたクラスのクロス集計計算を提供します。

10.ランダムフォレストとは何ですか? Rでランダムフォレストを構築して評価するにはどうすればよいですか?

ランダムフォレストは、多くの決定木モデルの組み合わせから構築されたアンサンブル分類器です。 多数のデシジョンツリーモデルの結果を組み合わせているため、結果は個々のモデルの結果よりもはるかに正確です。

Rでランダムフォレストモデルを構築するには、トレーニングデータセットが必要です。 次に、次の手順を実行します。

まず、データセットをトレーニングセットとテストセットに分離します->

  • 次に、列車セットでランダムフォレストモデルを作成します->
  • 最後に、テストセットでランダムフォレストモデルを予測します->
  1. ShinyRとは何ですか?

ShinyRは、Rを直接使用してインタラクティブなWebアプリを簡単かつ安全に開発できるRパッケージです。

ShinyRを使用すると、スタンドアロンアプリをウェブページでホストしたり、Rmarkdownドキュメントに埋め込んだりすることができます。 また、光沢のあるアプリを拡張して、CSSテーマ、JavaScriptアクション、およびHTMLウィジェットを操作することもできます。

  1. Rでのデータマイニングに使用されるパッケージに名前を付けます。

データマイニングに使用されるRパッケージは次のとおりです。

  • Rpartとcaret
  • データ表
  • 天気
  • GGplot
  • ルール
  • tm
  1. ロジスティック回帰とポアソン回帰の目的は何ですか?

ロジスティック回帰は、特定の連続予測変数のセットからバイナリ結果を予測するのに役立ちますが、ポアソン回帰は、特定の連続予測変数のセットからの「カウント」を表す結果変数を予測するために使用されます。

  1. 欠測値はRでどのように表されますか?

Rでは、欠落している値はNA(使用不可)関数で表されます。 ただし、不可能な値の場合は、NaN(数値ではない)が使用されます。

  1. Rにデータセットを追加するために使用される関数はどれですか?

Rでは、「rbind」関数を使用して2つのデータフレームまたはデータセットを結合します。 ただし、2つのデータフレーム/データセットには同じタイプの変数が含まれている必要があります。

  1. どのようにRにデータを保存しますか?

Rにデータを保存する方法はたくさんありますが、最も効率的な方法は次のとおりです。

データ>アクティブデータセット>アクティブデータセットのエクスポート

この後、ダイアログボックスが表示されます。 そのダイアログボックスをクリックすると、通常どおりにデータを保存できます。

  1. Rの並べ替えアルゴリズムは何ですか?

Rには、次の5種類の並べ替えアルゴリズムがあります。

  • 選択ソート
  • バケットソート
  • バブルソート
  • マージソート
  • クイックソート
  1. ホワイトノイズモデルとは何ですか?

ホワイトノイズ(WN)モデルは、時系列モデルです。 これは、定常過程を描写する最も簡単な方法です。

WNモデルは次のもので構成されます。

  • 固定定数平均
  • 固定定数分散
  • 時間の経過とともに相関関係はありません
  1. Rでインポート関数に名前を付けます。

Rのさまざまなインポート機能には次のものがあります。

  • read.csv()->
  • read_sas()->
  • read_excel()->
  • read_sav()->
  1. Rでデバッグに使用する関数に名前を付けます。

Rでのデバッグに使用される関数は次のとおりです。

  • traceback()
  • デバッグ()
  • ブラウザ()
  • 痕跡()
  • 回復する()

だから、あなたは行き​​ます! これらは、Rインタビューで最もよく聞かれる質問の一部です。 これがあなたが氷を壊し、あなたが行くにつれて着実に言語を掘り下げるのに役立つことを願っています。

幸せな学習!

Rのデータ構造とは何ですか?

データ構造は、データを効率的に使用するためにデータを格納するコンテナーです。 主に、R言語には4つのデータ構造があります。Vectorは動的に割り当てられたデータ構造であり、コンテナーとして機能し、同様のデータ型の値を格納します。 ベクトルに格納されたデータ値は、コンポーネントと呼ばれます。 リストは、整数、文字列、文字、または別のリストなど、複数のデータ型のデータ値を格納できるRオブジェクトと見なすことができます。 マトリックスは、同じ長さのベクトルをバインドするグリッドのようなデータ構造です。 これは2次元データ構造であり、その中のすべての要素は同じデータ型である必要があります。 データフレームは、より一般的であることを除けば、マトリックスに似ています。 整数、文字列、文字など、さまざまなデータ型の値を保持できます。 リストとマトリックスの特性の組み合わせを示します。

ランダムフォレストとは何ですか?

ランダムフォレストは、アンサンブル分類器です。 名前が示すように、モデルの予測精度を向上させるために、複数の決定木を構築してバインドします。 各観測値は各決定木に提供され、本質的に非線形です。 Rでランダムフォレストを構築するには、トレーニングデータセットが必要です。トレーニングデータセットを収集したら、ランダムフォレストを実現するために従わなければならない2つの重要な手順があります。データセットをトレーニングデータセットとテストデータセットに分割します。 トレーニングデータセットを使用してランダムフォレストを構築し、テストデータセットを使用してランダムフォレストモデルを予測します。

ShinyRとは何ですか?その重要性は何ですか?

ShinyRは、インタラクティブなWebアプリケーションやプロジェクトの開発に使用される強力なWebフレームワークを提供するR言語のオープンソースパッケージです。 ShinyRを使用すると、HTML、CSS、JavaScriptなどの著名なWebテクノロジーを使用せずに、分析をWebアプリケーションに変換できます。 このような強力なツールであるにもかかわらず、習得と暗示は簡単です。 ShinyRで開発されたアプリは、HTMLウィジェット、CSSテーマ、およびJavaScriptアクションで効率的に使用できるように拡張できます。 また、ShinyRを使用すると、スタンドアロンアプリをウェブページでホストしたり、Rmarkdownドキュメントに埋め込んだりすることができます。