Sorry, you have Javascript Disabled! To see this page as it is meant to appear, please enable your Javascript!

１冊の本に出会うことで、人生が大きく変わることがあります。良い品物に出会ったことで幸せになれることもあります。とはいっても、多様な商品があふれる中で、より価値の高いものを選び出すのは大変です。そこでこのブログでは、忙しいあなたの代わりに、史上最強の「良い本・良いくらし」の提案をさせていただきます。

忙しいあなたの代わりに、史上最強の良い本・良い暮らしのご提案

統計解析フリーソフト「R」で統計学に入門する２９【データフレームを使ってみる】

R チュートリアル

2016.12.232023.01.04

こんにちは、ミントです

今回は、Ｒに標準で備わっているデータ構造の４つめ、「データフレーム」を使ってみたいと思います

「　データフレーム　」は、これまでのベクトル、行列、配列と決定的に違う点があります

それは、データフレームの各要素は、データ型が異なってもいい、ということです

ベクトル、行列、配列では、データの次元が変わるだけで、要素のデータ型はすべて同じである必要がありました

データフレームにはこの制限がありません

なので、現実に出くわすデータを扱うのにとても都合のいいデータ型です

ここでは、データフレームを生成させて、要素を操作する方法を学びましょう

本記事の概要

データフレームを生成してみる

今回作成するデータフレームは、以下の表にしてみます

名前	性別	血液型	身長	体重
Ａくん	男性	Ａ	１７５	６９
Ｂさん	女性	Ｂ	１６２	５１
Ｃさん	女性	Ｏ	１４５	４２
Ｄくん	男性	Ａ	１７０	６５
Ｅくん	男性	ＡＢ	１８３	８３

この表には、文字型と数値型のデータが混在しています

これをＲ上に生成してみましょう

データフレームの生成には、data.frame ( ) 関数をつかいます

ここでは、data というオブジェクトにデータフレームを代入しています

データフレームの内容は、Ａくん、Ｂさん、Ｃさん、Ｄくん、Ｅくんの５人について、５つの属性（名前、性別、血液型、身長、体重）が含まれています

Ｒでデータフレームを生成

ピンク文字のデータフレームができました

データフレームの中身を確認する

データフレームなどのオブジェクトの中身は、「　str ( ) 関数　」をつかって確認すると便利です

str ( オブジェクト名 ) という形でつかいます

Ｒのオブジェクトの中身を調べるstr

ピンク色の内容は以下になります

１行目：　データフレーム型であり、５人について、５つの変数（属性）があることを示しています

２行目：　変数名（＄）が name で、中身はファクタ型（ Factor ）で、５つのレベル（ＡくんからＥくんまで）があることを示しています

３行目：　変数名が seibetsu で、ファクタ型、２つのレベル（男女）があることを示しています

４行目：　変数名が ketuekigata で、ファクタ型、４つのレベル（A, B, O, AB)があることを示しています

５行目：　変数名が sintyo で、数値型 ( num ) で、５つの数値が示されています

６行目：　変数名が taizyu で、数値型、５つの数値が示されています

このように、str ( ) 関数を使うと、オブジェクトの中身が整理された形で確認することができ便利です

データフレームの要素を取り出してみる

統計分析では、データフレームのデータを自在に操れるとうれしいです

データフレームの中の必要な要素を指定して、取り出してみましょう

まず。Ａくんの血液型を取り出してみましょう

Ｒでデータフレームの要素を取り出す

data オブジェクトの変数 ( $ ) 血液型 ( ketuekigata ) の 1　列目を表示するよう指定しています

これを、 data $ ketuekigata [1] と書いているわけです

他の取り出し方もあります

Ｒでデータフレームの要素を取り出す

２つ目のやり方では、data [[ 3 ]] [ 1 ] としています

１つめの $ketuekigata を [[ 3 ]] で表現しています

３つめのやり方では、data の１行３列の要素を [ 1, 3 ] と指定しています

Ｃさんの身長を取り出してみましょう

Ｒでデータフレームの要素を取り出す

data オブジェクトの変数 sintyo の３列目を表示してください、とすればいいわけです

同じように、こんな指定のしかたもできます

Ｒでデータフレームの要素を取り出す

これでデータフレームの作成と、要素の取り出しができるようになりました

というわけで、今回はデータフレームの操作の前半をやりました

後半では、データフレームの一部分を抽出したり、データフレームにデータを加えたりしたいと思います

データ分析でもよく使う、データの部分抽出を、Rでやってみました↓

『統計解析フリーソフト「R」で統計学に入門する３０
【データフレームから部分抽出する３つの方法】』

『「R」チュートリアル　のまとめはこちらです』

こちら無料で読めます↓

R　チュートリアル: 無料でサクッと高機能データ分析 (ミント出版)

R　チュートリアル: 無料でサクッと高機能データ分析 (ミント出版)

Amazonの商品レビュー・口コミを見る

Amazonで探す

楽天で探す

Amazonで「人工知能　１番最初の入門書: ディープラーニングの祖先を理解する (ミント出版)」に関する詳細を見る

Amazonで探す

楽天で探す

Amazonで「サクッとわかる人工知能第２巻: ディープラーニングの祖先を「改良」する (ミント出版)」に関する詳細を見る

Amazonで探す

楽天で探す

Amazonで「画像処理　０番目の入門書: Python/OpenCV　環境構築編 (ミント出版)」に関する詳細を見る

Amazonで探す

楽天で探す

Amazonで「画像処理　１番最初の入門書」に関する詳細を見る

Amazonで探す

楽天で探す