統計学で使うソフトとプログラミングについてそれぞれまとめてみた

統計学で使うソフトとプログラミングについてそれぞれまとめてみた

今回は、心理学部の学生全員が読むべきだ僕が考えるような記事を書きます。

心理学という統計学の必須な学問で、統計処理の時に使うソフトとプログラミング言語について書いていきます。

心理学という統計学の学問

心理学は、統計学が必須です。というか、現代のほとんどの科学は統計的な処理をしてその事象が発生する(orしない)可能性を算出して結果を考察しています。

心理学に統計学が必要な理由については、心理統計法の秘密の勉強法テストも終わったから書いておくわの中で書いています。まあとりあえず、統計学が心理学に必要な理由がわからない人は取り敢えず読んでおいてください。

で、心理統計法の秘密の勉強法テストも終わったから書いておくわを読んで統計学が必要な理由がわかった人、もしくは読まずともわかる人は、この続きを読んでいってください。

スポンサードリンク

統計専門のソフトやプログラミング言語

データを統計処理する専門の統計ソフトとしてや、その処理に特化したプログラミング言語を僕の知っている範囲で書いていきます。今回取り上げた言語以外でも統計処理できるけど放置します。さよならjavaさん。

統計専門のソフト

まずは統計処理に特化したソフトの例をいくつか挙げていきます。

SPSS

IBMというソフトウェア会社のSPSSは非常に有名な統計処理のソフトです。SPSSとは、Statistical for Social Scienceの略称で、社会科学での統計処理という意味です。人によって訳し方違うのかもしれませんが、僕はそう訳しています。

社会科学系の学問の統計処理においては、このソフトはかなり使われています。実際、心理学の論文読んでいても、「統計処理はSPSSを使用した」というような記述が多いですし。まあ社会科学以外でも薬学の論文でもSPSS使われているの読んだことありますが。

でも、僕はこのソフトの使用はあんまり好きじゃないです。その理由を以下に書いていきます。

値段が高すぎる

このSPSSはフリーのソフトではなく、有料のソフトなのですが、個人使用だととてつもなく高いんですよね。

ソフトウェアの販売代行会社のページによると個人使用の最安値が161,000円(2017年11月19日現在)なんですよ。

ものすごく高いソフトです。大学に在籍している間は、無料でSPSSを使えるかもしれませんが、大学を卒業したらもう二度と出会うことのないソフトでしょう。大学いる間だけ使える技術なんて無駄。

痒いところに手が届かない

SPSSといったクリックだけで操作できるようなソフトだと、後に書くプログラミングで処理をさせるような高度な分析ができなくなってしまうんですよね。いや、正しく書くと、SPSSでもあとに書くRでコーディングできるんですが、そもそもコード書ける人はRで一から書くんで、SPSSだけを使っているうちはできないことが多いです。

それでも欲しいというブルジョワの方はIBM公式サイトからどうぞ。

PSPP

このソフトは、SPSSを使用したいけれどお金のない学生に向けて作られたフリーソフトです。ほぼSPSSと同様の操作ができます。SPSSと違った拡張子で保存されたりするんですが、ほぼ一緒の操作です。

ちなみに僕のMacにもPSPPは入っています。のちに書くプログラミング言語Rで統計処理した後に、ちゃんと処理があっていたかの確認に使っています。

ただ、先に書いたSPSSと同じようにかゆいところに手が届かないので、あまり多用することはないです。また、Mac版のインストール方法は少しややこしいのでまた別の記事で書きます。Windows版は知りません。

HAD

HADとは、関西学院大学の教員である清水裕士さんが作成したフリーのエクセルのマクロです。PCに詳しくない人は、Excelに統計処理用の機能が無料で付け加えられたって考えてくれたらいいです。このHADは、Excelの入っているPCならば誰でも統計処理ができる優れものです。

清水裕士氏ホームページからインストールどうぞ。

ここまで書いて告白しづらいのですが、僕はHADは使っていません。僕のMacのExcelだとマクロが有効化できないバグが発生したんですが、バグ直すの諦めたので使っていません。なので、PSPPみたいにインストールをする方法みたいな記事を書く気もないですし、書くこともできません。

最悪の選択:Excel

最後に統計処理をしようと思っても絶対に使ってはいけないソフトを紹介します。誰のPCにも大抵入っているでしょうが、統計処理にはExcelは間違っても使ったらいけません。あ、ただ、HAD有効化しているならExcel使ってもいいですよ。

なぜなら、Excelで統計処理すると、上手いこと検定ができないことがあるからです。僕も一回生の時にExcelを使用していたのですが、t-test(2群間の平均値の差の検定)をExcelでしたら、統制群から先に処理を指定するか、実験群から先に処理を指定するか、その順番によって統計処理の結果出力が違ったんですよ。で、あとあと調べてみたら、Excelで統計処理や検定をするとそのようなことが多発するということがわかりました。

Excelは、データの入力だけに使用する分にはこれ以上ない便利なソフトですが、統計処理には使えません、本当に。

それでもExcelで統計処理がしたい人は頑張ってください。ていうかブラウザの戻るボタン押してここから立ち去ってください。さようなら。

統計専門のプログラミング言語

ここまで無料有料問わず統計処理ができるソフトをひたすら羅列してきましたが、ここからはプログラミング言語について書いていきます。最初の方でも書きましたが、今回あげる言語以外でも統計処理自体はできますが、今回の記事ではR言語をプッシュしたいので他の言語は放置します。

R

Rは、統計処理だけを専門にして作られたプログラミング言語です。もともと、S言語というのが昔にあって、その一歩手前までできるからアルファベットのSの前のRをとってR言語となったそうです。詳しくは知りませんけど。

このRを使うと、関数をどんどん覚えてそれを入力するだけで統計処理をしてくれるようになります。また、複雑な処理をしたければ、自分自身で式を書いたらいいので、非常にできることの幅が広い。

以上のような理由から、僕は主にRでしか統計処理をしていません。正しく表現すると、Rでした処理をPSPPでも確認していますが、まあRの計算が正しいかの確認にPSPPを使っているだけです。

ただ、Rを使用するにあたっての環境設定に関して少しだけややこしいところもあるので、また別の記事でそのことをまとめます。

僕は以上の中ではRを一番オススメする

自分が一番使っているものだからというのもおすすめする理由として大きいですが、それだけでオススメしません。Rがプログラミング言語だからオススメしているのです。

どういうことかというと、主に統計処理をしたいと思っている学生って文系が多いのですが、文系でプログラミングができる人ってかなり少ないんですよ。だから、その中でプログラミングができると他の文系学生よりも突出することができるようになるんです。

それと、プログラミング言語のPythonかRが一番大学卒業してからも使える技術ですよ。っていうのが理由です。詳しくは書きませんでしたが、Pythonできたら機械学習も簡単なゲーム作ったりできますし、RとそのパッケージのStanを極めていったらベイズ統計もできるようになりますし。

また、社会人になったら忙しくなるから学生のうちに遊んでおけというアドバイスは全く参考にならない理由でも書いているように、大学に在籍している間にプログラミングしかり、様々な技術を持っておいた方がいいですよ。その取っ掛かりとしてR言語を学ぶのはどうでしょうか?

R言語の勉強でオススメの本を紹介しましたので、こちらの心理学の学生がR言語の勉強を始めるときに最初に読みたい本を紹介するが参考程度になれば、幸いです。

スポンサードリンク

プログラミングカテゴリの最新記事