昨今のデジタル化の影響で多くの業界でデータ活用需要が高まり、データサイエンスやデータアナリティクス分野に注目が集まっています。そこで統計解析やデータ処理に特化したプログラミング言語である「R言語」が注目されています。
ただ、データサイエンスやデータアナリティクス分野ではその他にも有名な言語としてPythonなどもあげられるためR言語はオワコンなんじゃないかと不安に思う人も少なくないでしょう。
本記事では、R言語がオワコンなのかについてや導入方法、R言語のプログラミングの基礎、おすすめの入門書や学習サイトについて紹介していきます。実際のコードなどを通して解説も行うため、R言語を勉強したい、気になる人はぜひ本記事を参考にしてみてください。
R言語はオワコンなのか?
そもそもR言語はオワコンなのか気になる人も少なくないでしょう。結論からいうと、R言語は逆に注目度が高まっているプログラミング言語といえます。
R言語は、統計解析やグラフィック分野に特化している言語です。
昨今のデジタル化によるDX推進によって多くの企業が膨大なデータを保有しています。デジタル化に伴い激しく変動する市場の動向やユーザーのインサイトを見出すことが求められており、昨今データアナリティクスやデータサイエンスなどの統計解析、グラフィック分野の注目度が高まっているのです。
また、AI活用も進んでいる影響で、AI活用に必要なデータ解析手段としてR言語がPythonとともに注目されています。
Pythonと比較されることが多いですが、同じデータ解析ができる言語でも利用の目的が異なり、Pythonはデータから予測を行うのに対してR言語はデータを基に説明を行うことが目的とされる場合が少なくありません。
Pythonは汎用性が高い反面処理速度がR言語と比較しても数倍遅いため時間が限られた中で分析を行う上で有効といえるでしょう。このように、R言語とPythonでは目的や汎用性、処理速度が異なります。
R言語は統計解析に特化しているため、より高度なデータ分析を実施したい場合や処理速度を速く分析したいと考えている人におすすめです。
R言語の準備
R言語は統計解析に特化したプログラミング言語で、開発するためにはR言語自体とR言語の開発環境をPCにインストールする必要があります。
こちらでは、R言語で開発するための準備として、R言語やR言語の開発環境のインストールなどの手順についてみていきましょう。
R言語をインストール
まずはR言語をインストールします。R言語のインストールツールのダウンロード手順はOS毎に異なることが注意です。
こちらでは、WindowsOSでR言語をインストールする手順をみていきましょう。
- R言語を配布している公式サイトに遷移
- OSに対応したR言語ダウンロードリンクをクリック
- サブディレクトリから「base」をクリック
- 「Download (バージョン番号) for (OS)」をクリックしてダウンロードして実行・インストール
①R言語を配布している公式サイトに遷移
R言語はこちら(https://www.r-project.org/)のリンク先から遷移してください。
②OSに対応したR言語ダウンロードリンクをクリック
遷移すると画面上部の「Download and Install R」ボックス内から、「Download R for Windows」をクリックします。他OSの場合は、そのOSの名称がついたリンクをクリックしてください。
③サブディレクトリから「base」をクリック
Windows晩では②でクリックするとさらにサブディレクトリの選択が求められます。
こちらでは「base」をクリックして遷移してください。
Mac版の場合は、②での遷移後にすぐに最新盤のダウンローダーのリンクが表示されるため、最新バージョンのリンクをクリックする必要があります。
④「Download (バージョン番号) for (OS)」をクリックしてダウンロードして実行・インストール
遷移すると画面上部の「Download (バージョン番号) for (OS)」のリンクをクリックしてダウンロードします。ダウンロードが完了したら実行をしてインストールを行いR言語のインストールが完了です。
R言語の開発環境を整える
次はR言語の開発環境を整えるフェーズです。R言語の開発環境候補には「R Studio」や「Visual Studio Code」、「Google Colaboratory」があげられます。
その中でも、「R Studio」はR言語公式の開発環境であることだけでなく、便利ツールがすべてそろっており統合開発環境をとかって開発を進めることが容易な点でおすすめです。
その他の開発環境もおすすめですが、特段こだわりがない場合は、「R Studio」を活用することが無難といえるでしょう。
R言語のプログラミング基礎
R言語の準備が完了したら、実際に開発環境を開きプログラミングを行っていきます。
こちらでは、R言語のプログラミング基礎についてみていきましょう。
簡単な計算:四則演算(+-÷×)
こちらでは、四則演算などの簡単な計算をR言語で行う場合のプログラミングについて紹介していきます。
> 123 + 456 [1] 579 > > 123-456 [1] -333 > > 123*456 [1] 56088 > > 123/456 [1] 0.2697368 > |
上記がR言語とR Studioを活用した場合のプログラミング例です。上記のほかの計算記号としてべき乗や円周率などがあります。
> # 円周率のπ > pi [1] 3.141593 > > 2 * pi [1] 6.283185>べき乗 > 2^2 [1] 4 > |
四則演算や計算にまつわる演算子は以下の通りです。
演算子名 | 演算子 |
加算(足し算) | + |
減算(引き算) | – |
乗算(掛け算) | * |
除算(割り算) | / |
整数範囲での除算 | %/% |
整数範囲での除算を行った時の剰余 | %% |
べき乗 | ^ |
変数の代入:何度も使う変数には、名前を付ける
こちらでは、R言語で変数を活用する場合のプログラミングについて解説していきます。
そもそも変数とは、データを一時的に記憶する場所のことを差し、変数に設定した値を変数名を呼び出すことで設定した値を呼び出すことが可能です。
R言語では、「=」や「<-」などの演算子を活用します。以下は、変数活用の一例です。
> #C言語同様「=」を使って変数定義可能 > a=123 > > a [1] 123 > > #デジタルマーケティングU(コーディング規約)では「<-」での変数定義が推奨されています > b<-456 > > b [1] 456 > > a+b [1] 579 > a-b [1] -333 > a*b [1] 56088 > a/b [1] 0.2697368 > |
変数では、大文字・小文字の区別がされます。変数を管理するためにも、変数設定時に大文字・小文字の活用に関して各自コーディングルールを設定するとよいでしょう。
> B<-789 > b [1] 456 > |
関数:何らかのインプットに対して処理を加えアウトプットを返すもの
関数とは、インプットされた値に対して定められた独自の処理を実行して結果を返す命令のことをさします。
R言語にはさまざまな関数があり、目的に合わせて活用されています。こちらでは、基本的な関数の一部を紹介していきます。
> # 値を丸める > floor(1.9) [1] 1 > > # 平方根√2 > x <- sqrt(2) > x [1] 1.414214 |
ベクトル:cという関数を使って定義
ベクトルとは、同じデータ型が1つ以上格納されているオブジェクトのことを意味します。
R言語では、このベクトルを定義することが可能です。こちらではベクトルを定義するプログラミングについて紹介していきます。
> # 関数Cを活用してベクトルを定義 > c(1, 2, 3, 4, 5) [1] 1 2 3 4 5 > # 整数の順列はこうも書けます > 1:5 [1] 1 2 3 4 5 > # 整数の順列はこうも書けます > 1:5 [1] 1 2 3 4 5 |
リスト:他の種類の型(整数、文字列)を混ぜる
2種類以上の型をもつ要素を格納する場合には、list関数を活用します。
list関数は、複数の要素をもつリストオブジェクトを作成するための関数で、それぞれの型を保持したまま抽出可能です。
また前述のc関数でも異なったデータ型を記入できますが、その場合すべて文字列型に変換されてしまうことに注意しましょう。
> list(1, “a”, 3.14) [[1]] [1] 1[[2]] [1] “a”[[3]] [1] 3.14 > > # ベクトルでは他のデータ型は混ぜられません > # (文字列と数値を混ぜると、全部文字列型に変換されます) > c(1, “a”, 3.14) [1] “1” “a” “3.14” |
データフレーム:「同じ長さのベクトル」が入った「リスト」
データフレームとは、同じ長さを持つベクトルから構築されるリストのことです。
作成にはdata.frame関数が用いられています。変数に代入すれば、「変数$ベクトルの変数」で指定したベクトルの要素全体を適用可能です。
data.frame関数のプログラミング例は以下の通りとなります。
> 身長 <- c(168.5, 172.8, 159.0) > 体重 <- c(69.5, 75.0, 56.5) > X <- data.frame(身長, 体重) > X 身長 体重 1 168.5 69.5 2 172.8 75.0 3 159.0 56.5 > > # リストと同様、$で値を取り出します > X$身長 [1] 168.5 172.8 159.0 > # 取り出した値はベクトルなので、演算を要素全体に適用できます > X$身長 / 100 [1] 1.685 1.728 1.590 |
csvやExcelファイルを読み込む
R言語を活用したデータ解析では、csvやExcelファイルを読み込むケースは珍しくありません。
こちらでは、csvやExcelファイルを読み込むプログラミング例を紹介していきます。
> # 参考(今回のハンズオン用のサーバーにはcsvを置いていないのでエラーが出ます) > # read.csv(“ファイルパス”)で読み込み可能です > X <- read.csv(“D:/work/X.csv”, stringsAsFactors = FALSE) |
図を書く:ヒストグラム(度数分布表)を書いてみる
R言語では、設定したデータをもとにさまざまなグラフが描画可能です。
例えばヒストグラムや散布図、棒グラフ、箱ひげ図、円グラフなどはRの描画関数を活用することで作成できます。
こちらでは、hist関数を用いたヒストグラムの作成方法をみていきましょう。
> # 正規分布の乱数を100万個作る > x <- rnorm(1000000) > # ヒストグラムを描く > hist(x) |
R言語の入門本は?
こちらでは、R言語のおすすめ入門法を5冊紹介していきます。
R言語を学習するうえで本を活用する場合は、学習目的に適しているか、R言語活用に必要な統計学の知識も学べるかなど自身にマッチした入門書になっているかチェックして選びましょう。
RStudioではじめるRプログラミング入門
「RStudioではじめるRプログラミング入門」は、統計を使わずに、純粋にR言語をプログラミング言語として学習することをコンセプトにした入門書です。
統計学に関する難しい知識は不要で、3つのプロジェクトを通してRStudioの活用やR言語によるプログラミングスキルの習得ができます。
R言語やRStudioの知識に関して、プロジェクトを通して逐一解説が入るため、完全なプログラミング初心者の人や統計分析の知識を知識を得る前にR言語をしっかり学びたい人におすすめです。
はじめてのR: ごく初歩の操作から統計解析の導入まで
「はじめてのR: ごく初歩の操作から統計解析の導入まで」は、はじめてR言語に触れる初心者の人を対象にR言語を使った統計解析のはじめの一歩となる入門書です。
Rのインストール方法や計算と統計解析方法、データファイルやエディタの活用方法とR言語を活用していくうえで基本的な知識やスキルを学べます。
統計解析とR言語の基本をこの1冊で抑えられるため、R言語での統計解析を始めようと考える初心者の人におすすめです。
RユーザのためのRStudio実践入門
「RユーザのためのRStudio実践入門」は、R言語の統合開発環境であるRStudioと、モダンなデータ分析を実現するRパッケージのコレクションであるtidyverseの入門書です。
R言語の基本からデータの収集・整形・可視化・レポーティングといったデータ分析ワークフローの各プロセスを詳しく解説しています。
RやRStudioを活用してモダンな分析環境を構築したい人や分析フローを意識した統計解析を実装したい人は、この本の知識は役立つでしょう。
Rによるやさしい統計学
「Rによるやさしい統計学」は、統計学の理論とRでの操作手順やアウトプットの解釈に関して解説してくれる入門書です。
統計の知識とRの操作に関する知識が無駄なく丁寧に解説されています。巻末の練習問題で勉強した内容の確認ができることも特徴です。
文科系の学部学生を対象としているだけあって、理論や基礎に関して丁寧に解説されているため、R言語に興味があるけどプログラミング経験の有無で敬遠してきた人にもおすすめの1冊です。
R初心者のためのABC
「R初心者のためのABC」は、Rがまったくはじめての人向けに記された入門書です。
プログラミングやコードとはなんなのか、どのようにコードを書けばよいのかR言語だけでなくプログラミングの基本の第一歩を丁寧に解説されていることが特徴になります。
R言語やプログラミングに関して重点的に触れられており、統計学に関しては網羅されていません。そのため、R言語やプログラミングの基本から学びたい人におすすめです。
おすすめのR言語学習サイト
R言語は学習サイトを活用した学習方法もおすすめです。こちらでは、R言語を学習するのに適した学習サイトを紹介していきます。
Udemy
Udemyは、世界最大規模の動画学習プラットフォームで世界中の学びたい人と教えたい人をつなげてくれるサービスです。
さまざまなジャンルの教育コンテンツが登録されており、R言語だけでも約2,000件の教育コンテンツが購入できます。
初級者向け、中級者向けと習熟度にあわせて自分で選んで学習でき、購入後は何度でも振り返ることが可能です。
講座1本あたりの金額は様々ですが、数千円で購入できるものから数万円で購入できるものと料金の幅が広いため、自身の学習目的にあったものを選ぶようにしましょう。
ドットインストール
ドットインストールは、プログラミング学習サービスですべてのレッスン動画が3分以内で気軽に学習できることが特徴です。
月額1,280円のプランを選択することでR言語のレッスンを含むすべてのプログラミングレッスンを学習できます。
スマートフォンなど端末を選ばずに学習できるため、移動中などに学習することが可能です。
R言語の入門レッスンとして13コンテンツが公開されており、十分に学習ができれば解約することもできます。
R言語 入門のまとめ
R言語は統計解析やグラフィック分野に特化した無料で利用できるプログラミング言語です。
統計解析やデータの可視化、機械学習ができるため昨今データサイエンスやデータアナリティクス分野で注目を集めています。
特にデジタル化の影響でデータを用いた意思決定が重要視されている昨今において、統計解析に特化したR言語の需要は高いといえるでしょう。
R言語を活用したデータ解析などに興味がある人は今からでも学習を始めることがおすすめです。
R言語やプログラミング自体が初めての人でも理解しやすい入門書や学習サイトを活用してスキルを身につけましょう。
jiteraでは、R言語に関する質問や案件のご相談を受け付けております。
気になることや不安点・不明点がある人、R言語を用いた開発を依頼したい人はぜひこちらのお問い合わせフォームからご相談ください。