あずきみるくのあずきはニガテ - for Engineer

ひよっこプログラマがやってみたことやハマっちゃったことなど、備忘録的な感じで書いていきます。

AzureMLをはじめてみた。(6)いざ、予想と分析!編

これまでに、以下の作業をやってきました。

AzureMLをはじめてみた。(1)MLStudioの準備 - あずきみるくのあずきはニガテ - for Engineer
AzureMLをはじめてみた。(2)データの準備ー取得編 - あずきみるくのあずきはニガテ - for Engineer
AzureMLをはじめてみた。(3)データの準備ー整形?編 - あずきみるくのあずきはニガテ - for Engineer
AzureMLをはじめてみた。(4)どの項目に着目するか?編 - あずきみるくのあずきはニガテ - for Engineer
AzureMLをはじめてみた。(5)アルゴリズムを適用する編 - あずきみるくのあずきはニガテ - for Engineer


総仕上げとして、実験を実行します!!

これまでに75%のデータを使ってトレーニングを行ったわけですが、
残りの25%を使ってトレーニングの効果の検証をします。

1)実行
 1. 「score」で検索

 2. [Score Model(モデルのスコア付け)]モジュールをドラッグ&ドロップ

 3.4. つなぐ
  →ここも、ポートの位置には意味があるので、これどおりつなぎましょう。

 5. 実行

f:id:azuki-milk-lush:20170904115836p:plain



2)結果の確認
 1. [Score Model(モデルのスコア付け)]を右クリック
  >[Scored Dataset(スコア付けされたデータ)]>[Visualize(視覚化)]をクリック
f:id:azuki-milk-lush:20170904120835p:plain

  すると、 予測された価格の値と、テストデータにて既知の値が表示されます。
  ・・・意外と乖離あるな。。。(ぼそっ)
f:id:azuki-milk-lush:20170904120814p:plain



3)評価(品質チェック)
先ほど、結果を確認しました。
この機械学習と予想はどうだったのか?を最後に評価します。

 1.「eva」とかで検索

 2. [Evaluate Model(モデルの評価)]モジュールをドラッグ&ドロップ

 3. つなぐ
  →[Evaluate Model(モデルの評価)]モジュールにポートが2つあるのは、
   別々のアルゴリズムをつないで、評価を比較したりするのに便利だから、
   だそうな。

 4. 実行

f:id:azuki-milk-lush:20170904140219p:plain


 5. [Evaluate Model(モデルの評価)]モジュールを右クリック
  >「Evaluation Results(結果を評価する)]>[Visualize(視覚化)]を選択
 
f:id:azuki-milk-lush:20170904140309p:plain

  こんな感じになるかと。
f:id:azuki-milk-lush:20170904141125p:plain


じゃー、次の問題は、このデータをどー見るか、ってことですね。。。
このデータはあくまで、予想した内容と、現実とでこんだけ差異がありますよ、ってことを見るのかな?

エラーの各統計情報を小さくすることをお勧めします。 小さい値は、予測が実際の値をより厳密に照合することを示します。 決定係数では、値が 1 (1.0) に近づくほど、予測の精度が高くなります。

と先生は言っているので、最後の値を1に近づけるべく、アルゴリズムだったり、データを引っ張るために絞り込んだカラムを変更したりして、試行錯誤してみてください、ってことでしょうか。

こんな感じのグラフも出てるのですが、ますます見方がわからない。。。
f:id:azuki-milk-lush:20170904142051p:plain

最終的にMLStudioはこうなりました。
f:id:azuki-milk-lush:20170904142238p:plain



***** やってみた まとめ と 感想 *****

えと、一応これでチュートリアルはひととおりやってみたことになります。

最後までお付き合いありがとうございます。
やってみて思ったのは、
手順としては楽なんだけど、知識は必要
ってことです。

そもそも機械学習統計学とかに基づいているらしいので、
どのアルゴリズムが検証に向いているのか、とかそういう知識はいるだろな、と。

あとは、欲しい予測を導き出すためにどのカラムに着目するか。

機械学習、一筋縄ではいきません。。。
でも、引き続きいろいろ見てみたいと思います。
というわけで、、、お疲れ様でしたっ!!!