ビッグデータを使って統計分析がしたい!【R言語 データ取得編】
目次
こんにちわ、井上です。
前回は、R言語が利用できる環境を作成しました。
今回は分析するためのデータを取得する方法をいくつか考えたいと思います。
使用するデータは、以下のサイトから取得しました。
東京電力管内の過去の電力使用実績のダウンロード
データベースには、事前にテーブルを作成して上記のデータをCSV取り込みしています。
CSVファイルは、2008年から2014年までのデータをダウンロードしたものを所定のフォルダに格納しています。
MySQLに接続してデータを取得する
まず初めにRMySQLのパッケージをインストールします。
Rのコンソールを開いて下記のコマンドを入れて実行して下さい。
install.packages("RMySQL")
インストールが開始されます。
インストールが終わりました。これでMySQLにDB接続できます。
DB接続してデータを取得するプログラムは以下になります。
require("RMySQL") con <- dbConnect(MySQL(), host="localhost", port=3306, dbname="python_test_mysql", user="root", password="") dataset <- dbGetQuery(con, "SELECT * FROM tbl1") print(dataset)
データが取得できました。左下のウィンドウに結果が表示されます。
PostgreSQLに接続してデータを取得する
こちらもパッケージのインストールが必要です。
Rのコンソールを開いて下記のコマンドを入れて実行して下さい。
install.packages("RPostgreSQL")
インストールが終わりました。これでPostgreSQLにDB接続できます。
DB接続してデータを取得するプログラムは以下になります。
MySQLとほぼ一緒ですね。
require("RPostgreSQL") con <- dbConnect(PostgreSQL(), user= "postgres", password="password", dbname="python_test_postgres", host="localhost", port="5432") dataset <- dbGetQuery(con, "select * from tbl") print(dataset)
データが取得できました。左下のウィンドウに結果が表示されます。
CSVファイルからデータを取得する
CSV読み込みは、特に準備は必要ありません。
CSVファイルを読み込んでデータを取得するプログラムは以下になります。
dataset <- read.csv("C:/anaconda_pleiades/workspace/test/data/csv_data.csv") print(dataset)
データが取得できました。左下のウィンドウに結果が表示されます。
まとめ
いかがでしたか。
Python編で使用したデータをR言語でも取得することができました。
特別難しい事は何もなかったですね。
PythonでできることはR言語でもできるはずなので、同じように進めていきたいと思います。
R言語でもグラフを表示したいですね。
《関連記事》
ビッグデータを使って統計分析がしたい! 【データ取得編】
ビッグデータを使って統計分析がしたい! 【グラフ表示編】
ビッグデータを使って統計分析がしたい! 【データ分析編①】
ビッグデータを使って統計分析がしたい! 【データ分析編②OLSを使ってみる】
ビッグデータを使って統計分析がしたい! 【R言語 準備編】