no title

1: ノチラ ★ 2018/03/12(月) 16:59:56.93 ID:CAP_USER
データ分析最強ツール「R」の実力
Rは、統計分析に特化したプログラミング言語です。プログラミング言語、というくくりではありますが、統計分析に特化したシンプルな作りになっています。

取っ付きやすさの大きな要因になっているのは、データフレーム、という考え方です。データフレームは列と行という表形式になっていて、Excelで扱うデータ形式と似ているため、Excelに慣れ親しんでいる人であれば、少し使ってみるだけでRに対する違和感はすぐに消えることでしょう。

しかもRは決してマイナーなツールではありません。研究者やデータサイエンティストの間では、分析のツールとして非常にポピュラーです。またRはオープンソースであり、世界中のユーザによって日夜開発が進められ、日々進化しています。

そういうとプロの分析者が使うツールだと思われがちですが、実際にはExcel以上に簡単に、かつExcelだけでは対処が難しい問題を解決できます。フリーのツールなので導入もスムーズです。

さきほどExcelに対してあげた三つの問題点である

・データ量が膨大になると動作が不安定
・一度やった分析を保存できない
・すぐに実行できる分析ツールが限られている

について、Rだとどのように対応しているのかみていきます。

(1)大規模データでも軽快に動く

Excelで扱うことができるデータ量ですが、Excel2013では最大行数は1,048,576行、最大列数は16,384列となっています。ただし、実際にはこれ以下の数十万件レベルで動作が不安定になります。

対してRで扱うことができるデータ数は、1000万行程度×400列であれば、PCのスペックにも依存しますが、たいていは動作も軽快です。Excelでは動作が不安定だったデータ量でも、Rならば動作は常に快適です。

(2)分析手順が残るので、やり直しも簡単

Excelの場合は分析手順は基本的に残らないので、自分で記録を取っておく必要があります。手順の実行は基本的に手動です。

対してRはプログラミング言語なので、当然処理の過程がコードとして全て残ります。どこか間違っていても、そこを修正してまたボタン一つで全ての処理をやってくれる。グラフを描く過程もコードにできます。

(3)最新の分析ツール(アルゴリズム)が使える

Excelはマイクロソフトの製品なので、バージョンアップもマイクロソフト次第です。

対してRはオープンソース。全世界から有志が開発に参加しているので、日々改修が行われています。学会で発表された最新のアルゴリズムも、すぐにパッケージがリリースされ、そのパッケージをインストールしさえすればすぐに使えるようになっています。
http://gendai.ismedia.jp/articles/-/54570

【【IT】Excelはもう古い?ビジネスマン必見のデータ分析最強ツールとは】の続きを読む