Rでできることって何だろう?プログラミングから統計処理まで!

初心者
Rって何ができるのでしょう?プログラム言語なのは分かるんですけど・・・

小学生にプログラムを教えることが決まりましたよね。
 
このような背景もあって、社会人のかたから、プログラミングを始めたいんだけど、どの言語から始めたら良いの?とよく聞かれるようになりました。

 
そこで今回は、プログラム言語の中から、特にRをおすすめしたいと思います。

書き手
私は、Rの実務経験5年のシステムエンジニアです。
perlも実務経験があります。
 

やはり一番好きなのは、Rです。
そんな私なので、R推しになりがちですが、
今回は色々と過去を振り返りながら考えてみました。

 
 

Rを勧める2つの理由

 

Rで何ができるのか?

 
ズバリ、データ処理から図の作成、さらには統計解析まで。Rは万能ツールなのです!
Rというのは、誰でも手に入れることができるフリー・ソフトウェアで、プログラミング初心者から統計学の専門家まで幅広く愛用されています。
 

初心者
統計?計算でしょう?他の言語でも出来そう。もっと言ってしまうと、エクセルでも出来そうな気がするし、そもそも統計学って身近に感じないのですが・・・
 
 

なぜ統計学が必要なのか

我々の生活には、統計学で処理したものが溢れかえっているからです。
株価や気象予報など、必ずテレビで見て参考にするでしょう。
後は、選挙の出口調査などです。何で開票と同時に当確が出ると思いますか?出口調査から一番投票数の多い人を割り出しているんですね。だからすぐに当確が出るのです。

 
 

初心者
出口調査って言っても、一部の人達の声でしょう?そんなんで正確に分かるのかな・・・
書き手
物凄く分かりやすく言うとですね。味噌汁味見するのに、鍋の汁全部飲まないでしょうと言う話。オタマ一杯もあれば充分ということですね。
初心者
なるほど。考えてみると、統計学は意外と身近にあるんですね。

 

なぜRを使うのか

プログラムを書くときに、直感的に理解しやすいんですね。無駄に呪文のようなものを書く必要が無い。それと、統計学に長けているんですね。いろいろな関数が既に組み込まれているんです。

 
 
例えば、A自動車株の5日の株価の変動を見てみましょう。1100円、1000円、980円、1400円、1200円と株価が値動きしています。平均ならmean、分散ならvar、標準偏差ならsdなどと。データ読み込んで、これらの関数を打って見てください。すぐに分かるから、統計分析もし易いんですね。
 

初心者
もうちょっと具体的に説明してもらえると助かります・・
書き手
A自動車株 <- c(1100,1000,980,1400,1200)
mean(A自動車株)
var(A自動車株)
sd(A自動車株)
このように打ち込むと
 
mean(A自動車株)
[1] 1136
var(A自動車株)
[1] 29480
sd(A自動車株)
[1] 171.6974
 
ハイ、すぐ出来ました!

Rはとても分かりやすいのです。

 

Rのメリット・デメリット

 

Rのメリット

Rのメリットは沢山ありますよ。
まずは、日本語をそのままスクリプトに書いても問題無いと言うこと。そのまま読み込んでくれます。さらに、スクリプトが沢山ネット上に落ちているんです。
 

 
試しにseekRと検索エンジンに打ち込んで見てください。Rのスクリプトが沢山あるのが分かると思います。
 
また、本格的に学びたい、データも一緒に欲しいというかたは、
北海道大学の久保先生の講義用ノートhttps://eprints.lib.hokudai.ac.jp/dspace/handle/2115/49477
 
群馬大学の青木先生のおしゃべりな部屋aoki2.si.gunma-u.ac.jp
を参考にしてください。
 
 
さらに、Rは作図まで、1つのスクリプトで書けるんですね。他の言語だと、これは難しい。
作図のためにまた違う言語を覚えなきゃならない。
でも、Rは一気に処理できるのです。これはを最後の1行を書き加えただけでグラフもできました。

初心者
plotというものですか?描けって意味ですね。
書き手
A自動車株 <- c(1100,1000,980,1400,1200)
mean(A自動車株)
var(A自動車株)
sd(A自動車株)

 
plot(A自動車株,xlab = "",ylab = "")を加えるだけで、5日の株価の値動きが視覚的に分かりますね。しかも、計算しながら図を描けるのが、大変分かりやすい。xlab = "",ylab = ""は、x軸やy軸の名前を今は付けないという意味です。

 

Rのデメリット

デメリット、と言うには言葉が過ぎるかもしれませんが、ちょっと処理速度が遅いことです。
 

 
パソコンのスペックにも寄りますが、計算をスタートさせてから結果が出るまで他の言語と比べて少しだけ時間がかかることです。
また、全く統計学に興味が無い人にとっては、Rは少し遠回りになるかもしれません。

 

おわりに

初心者
なるほど。Rにはメリットとデメリットがあるのですね。とにかく早く計算結果を知りたい人や、統計学に全く興味の無い人は何から始めれば良いのでしょうか?
書き手
それでもやはりRからです。書きかたが難しく無いからです。そもそも初心者は、そこまで長いスクリプトを書かないから、スピードはあまり重視されないでしょう。
 
まずはRでプログラムを書いて、慣れてきたら他の言語を使ってみましょう。計算結果を早く知りたい人は、Cに移ると良いでしょう。アプリなどの開発系に進みたい人は、pythonやjavaに移るのが良いでしょう。目的に応じて、言語を選んで行きましょう。

Rを勉強することで統計学の知識が飛躍的に付きますし、プログラミングもできるようになる、一石二鳥な訳です。しかも、強力な武器になります。
 
また、プログラム言語を1つ習得してしまうと、他の言語の習得は早いです。スクリプトを見ただけで、すぐに何の計算をしようとしているのかは瞬時に判断できます。
私はRを書くことができます。と周囲に言って見ましょう。尊敬の眼差しを向けられるのではないでしょうか。

 
関連記事はこちら
 

R言語とは?統計処理に特化したR言語を使う3つのメリット

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA