あずきみるくのあずきはニガテ - for Engineer

ひよっこプログラマがやってみたことやハマっちゃったことなど、備忘録的な感じで書いていきます。

AzureMLをはじめてみた。(2)データの準備ー取得編

なにはともあれ、、、

まずは食わせるデータの準備が必要です。

でも、どんなデータを用意すればいいの?ってことになるかと思います。
そんな時はこちらを参照してください。

データ サイエンス用のデータの準備はお済みですか? データの分析 - Azure Machine Learning | Microsoft Docs

ビデオもありますが、全部英語なのでビビりますw
一通り聞いた後、わけわかんね。ってなって、
下をみると日本語で書かれてあるので、ちょっとだけしょんぼりします。。。

気を取り直して。
データに必要なポイントは以下の通り。


  • 関連性があること
  • 全てのデータに抜けがなく、連続したデータであること
  • 正確であること
  • 十分な量があること


これらの内容に関する詳細は、上部のリンクを参照してください。

そんなデータ、ちょっと試したいだけなのに、すぐ用意できないよ!
というあなた。。。。。

安心してください。
AzureMLにはちょっと試すだけのサンプルデータもそろっている、らしーです。

どんなデータか、、、見てみましょうー。


というわけで、こちらを参考に、自動車の価格予測を作ってみるらしい。
ちょっとだけわかりやすく、解説できたらいいな。。

docs.microsoft.com



ここからは、上記のサイトを個人的にやってみたやつを貼っていきます。
絵がいっぱいを目指していますw


1)新たな実験の作成
とりあえず、「+New」をポチしてみます。
f:id:azuki-milk-lush:20170817105733p:plain


こんな画面が出てくるので、とりあえず、新規で作ってみます。
f:id:azuki-milk-lush:20170817110009p:plain


そしたら、うっひゃー!こんなわけわかんない画面出てきた。。。
f:id:azuki-milk-lush:20170817110215p:plain


2)命名
実験には名前をつけてあげる。
f:id:azuki-milk-lush:20170817110840p:plain


3)サンプルデータの取得
左側のメニューから
「Saved DataSets」>「Samples」
を選ぶと、いっぱい出てくる。。。
こんなにいっぱいサンプルデータがあるのね。
f:id:azuki-milk-lush:20170817111308p:plain
。。。ただ、いかんせん、あずきは英語がそんなに得意じゃないのでよくわからない。

気を取り直して、今回は自動車の価格予測なので、
「automobile」
で検索してみませう。

f:id:azuki-milk-lush:20170817111605p:plain
かなり絞り込んだな。。。

で、「Automobile price data(Raw)」を、ドラッグ&ドロップ。
したらこんな感じになった。
f:id:azuki-milk-lush:20170817111941p:plain
さすがのMicrosoftさん、いっぱいいろんなダイアログ出してくれるあたり親切です。


4)サンプルデータの確認
とったデータの中身はどんなもんなのか、をみることもできるようです。

「Automobile price data(Raw)」を右クリック >「Visualize(視覚化)」
f:id:azuki-milk-lush:20170817112401p:plain


こんな感じのデータが入っているみたいです。
205件、ってことでしょうか。
f:id:azuki-milk-lush:20170817112750p:plain


でも、よく見ると、データに穴がありますね。。。
うーん。これだと、条件の
「全てのデータに抜けがなく、連続したデータであること」
に該当しないですね。。。

というわけで、今回はここまで!

次はデータの加工をせねばならぬ?!