ビッグデータを使って統計分析がしたい!【R言語 データ取得編】

こんにちわ、井上です。
 
前回は、R言語が利用できる環境を作成しました。
今回は分析するためのデータを取得する方法をいくつか考えたいと思います。

使用するデータは、以下のサイトから取得しました。
東京電力管内の過去の電力使用実績のダウンロード

データベースには、事前にテーブルを作成して上記のデータをCSV取り込みしています。
CSVファイルは、2008年から2014年までのデータをダウンロードしたものを所定のフォルダに格納しています。

MySQLに接続してデータを取得する

まず初めにRMySQLのパッケージをインストールします。

Rのコンソールを開いて下記のコマンドを入れて実行して下さい。

install.packages("RMySQL")

インストールが開始されます。
mysql1

インストールが終わりました。これでMySQLにDB接続できます。
mysql2

DB接続してデータを取得するプログラムは以下になります。

require("RMySQL")

con <- dbConnect(MySQL(),  
                 host="localhost",  
                 port=3306,  
                 dbname="python_test_mysql",  
                 user="root",  
                 password="")

dataset <- dbGetQuery(con, "SELECT * FROM tbl1")

print(dataset)

データが取得できました。左下のウィンドウに結果が表示されます。
mysql3

PostgreSQLに接続してデータを取得する

こちらもパッケージのインストールが必要です。
Rのコンソールを開いて下記のコマンドを入れて実行して下さい。

install.packages("RPostgreSQL")

インストールが終わりました。これでPostgreSQLにDB接続できます。
postgresql2

DB接続してデータを取得するプログラムは以下になります。
MySQLとほぼ一緒ですね。

require("RPostgreSQL")

con <- dbConnect(PostgreSQL(),  
                 user= "postgres",  
                 password="password",  
                 dbname="python_test_postgres", 
                 host="localhost", 
                 port="5432")

dataset <- dbGetQuery(con,  "select * from tbl")

print(dataset)

データが取得できました。左下のウィンドウに結果が表示されます。
postgresql3

CSVファイルからデータを取得する

CSV読み込みは、特に準備は必要ありません。

CSVファイルを読み込んでデータを取得するプログラムは以下になります。

dataset <- read.csv("C:/anaconda_pleiades/workspace/test/data/csv_data.csv")

print(dataset)

データが取得できました。左下のウィンドウに結果が表示されます。
csv1

まとめ

いかがでしたか。
Python編で使用したデータをR言語でも取得することができました。
特別難しい事は何もなかったですね。

PythonでできることはR言語でもできるはずなので、同じように進めていきたいと思います。

R言語でもグラフを表示したいですね。

《関連記事》
ビッグデータを使って統計分析がしたい! 【データ取得編】
ビッグデータを使って統計分析がしたい! 【グラフ表示編】
ビッグデータを使って統計分析がしたい! 【データ分析編①】
ビッグデータを使って統計分析がしたい! 【データ分析編②OLSを使ってみる】
ビッグデータを使って統計分析がしたい! 【R言語 準備編】

記事をシェア
MOST VIEWED ARTICLES