ラベル R の投稿を表示しています。 すべての投稿を表示
ラベル R の投稿を表示しています。 すべての投稿を表示

2020/08/29

R - 入門本編 5章 配列と行列

R における「配列 (array)」は、ベクトルを多次元に拡張したものである。2次元のものは特に「行列 (matrix)」と呼ぶ。逆に言うと、R では3次元以上のものは行列とは呼ばない。

R - 入門本編 4章 順序付き因子と順序無し因子

R では質的変数、すなわち順序尺度、名義尺度を表現する方法として「因子 (factor)」が用意されています。モデル構築にあたっては、順序尺度は「順序付き因子 (ordered factor)」、名義尺度は「順序無し因子 (unordered factor)」として正しくデータを表現しておく必要がありますので、よく理解しておきましょう。

2020/08/23

R - 入門本編 3章 オブジェクト、そのモードと属性

R の型システムの入門編。型をいちいち明示しない言語では、型システムをちゃんと理解しておかないとちょいちょいつまずくので、しっかり把握しておきたい。

2020/08/20

R - 入門本編 2章 数字とベクトル

R を使うにあたって、ベクトルの理解は必須です。ベクトルを基本的なデータ構造とし、様々な演算子や関数がベクトルに対して定義されることにより、データ分析のためのプログラミングが非常に簡潔に記述できるようになっています。
An Introduction to R の2章に沿いつつ (古い版ですが……)、若干の+αがあります。

2020/06/06

R - 実践編 5 多変量時系列のモデル推定

R の vars パッケージや dse パッケージを使って、多変量時系列を VAR モデルや状態空間モデルにフィッティングさせてみました。

2020/05/28

R - 実践編 4 時系列のモデル推定

時系列データに当てはまるモデルの推定を R で行ってみましょう。実践編 3 で用いたものと同じ時系列 TS を対象として、モデルを推定した様子を紹介したいと思います。

R - 実践編 3 時系列の単位根検定

R で実際に時系列データの単位根検定をしてみましょう。Phillips-Perron 検定と Augmented Dickey-Fuller 検定が使用できます。

R - 実践編 2 データフレームにおける計算、集計

分析対象データをデータフレームに読み込んだあと、本格的な分析に入る前に、計算や集計などを行う必要があることが多いかと思います。R での代表的なやり方を説明します。

R - 実践編 1 ファイルの読み込み、データフレームの加工

実際に R でデータ解析を行うために、CSV ファイル、TSV ファイルの読み込みを行ったときの知見をまとめました。

2020/05/27

R - 入門本編 7章 ファイルからデータを読み込む

実践的には、プロンプトから data.frame() だの c() だのを駆使してデータフレームを構築することはまずありません。当然ながら、外部ファイルからデータを読み込んでデータフレームを構成することができますので、その方法を習得しておきましょう。

2020/05/19

R - 研究編 5 メモリ管理に関する関数

R のメモリ管理に関する関数をまとめて紹介します。

R - 附録 1 pkginfo() - パッケージ内のオブジェクトの一覧を表示する

R のパッケージ内のオブジェクトの一覧を表示する関数です。オブジェクトの名前とクラスとサイズを表示します。

2020/05/16

R - 研究編 1 評価機構

R は、C や Java で育ったプログラマには直感的には馴染み辛い、ある種独特な評価機構を持っているので、その振舞いを他のプログラミング言語と比較する形でまとめてみました。

2020/05/06

R Version 4.0 リリース

4/24、R Version 4.0 がリリースされました。主要な変更点を説明します。

2020/03/30

R - 研究編 4 zoo パッケージ - 時系列のための拡張パッケージ

zoo パッケージは、時系列を扱うためのクラス zoo および zooreg とその操作のための関数群を提供するパッケージです。特に、不規則時系列 (観測値の間隔が一定ではない時系列) を取り扱うことを目的として設計されています。各種の仕様は、ts クラスや base パッケージにおける振舞いの自然な拡張となるよう配慮されており、それらに慣れている方はスムースに使い始めることができます。

2020/03/28

R - 研究編 3 時系列データ

R には、時系列データを扱うクラスとして、ts クラスが用意されています。R における時系列データの取扱いの基本となりますので、ts クラスのデータの取扱い方法を見ていきたいと思います。

2020/03/22

R って何?

R とは、統計解析向けプログラミング言語です。オープンソースソフトウェアです。
ベクトル処理の記述やデータのグラフ化、多変量解析や時系列解析が簡単かつ強力に行えることが特徴で、データサイエンティストの方が良く使っています。最近は Python に押されて少し人気に翳りが見えてきましたが、それでも強力なツールであることに変わりはありません。

本ブログでは R を実用的なレベルで使えるように、解説していきたいと思います。

R には、An Introduction to R という大変よく出来たチュートリアルがあります。昔は日本語版をお作りの方もいらっしゃったのですが、最近はありません。
まずは、これをなぞるような形で解説していければと思います。その後、私の専門である時系列解析を中心により実践的な内容を加えていきます。

2020/03/21

R - 研究編 2 日付・時刻に関するデータ構造と演算

大抵のプログラミング言語で、日付・時刻に関するデータ構造と演算の事情は、歴史的経緯と互換性の影響で混沌としている。R もやはりややこしい状況になっている。
R に用意されている日付・時刻のためのクラスが複数あるので、それぞれの機能を紹介したいと思う。

R - 入門本編 6章 リストとデータフレーム

R の再帰的データ構造である「リスト」と、その特別な形である「データフレーム」について理解する。どちらも実践的に R を使っていくのに必須なデータ構造なので、その操作に習熟しておかなければならない。