あずきみるくのあずきはニガテ - for Engineer

ひよっこプログラマがやってみたことやハマっちゃったことなど、備忘録的な感じで書いていきます。

AzureMLをはじめてみた。(4)どの項目に着目するか?編

ちょっと空きました。。。

本題に入る前に。
各項目がどんな処理をしているのか、ちょっと空くとすぐ忘れるのです。

というわけで、メモしておこう。

AzureMLにはコメントという機能があります。
項目をクリックすると、なんか入力できるフィールドが出てくるので、
ここに書きます。
f:id:azuki-milk-lush:20170901170908p:plain


入力したのに、「あれ?でない?」って時は、ここをぽちっとしてみてください。
ぴろっと出てきます。表示・非表示は制御できるんですね。
f:id:azuki-milk-lush:20170901171118p:plain



というわけで本題に入ります。
今回、使用しているサンプルデータはたくさんのカラムがあるのですが、
「価格を予想したい」
と思ったときに、必要なカラムとそうでないカラムがいたりします。

車の価格に何が影響するか、を考えたら、
きっとメーカーとか排気量とか燃費なんかが、ポイントになるのでしょう。
車の横幅とか、細かいサイズが必ずしも必要か、って言われると、、、、
きっと必要ないね。

つまり、本来の目的に必要なカラムだけを抽出して、機械学習させた方が
効率がいいのでは?ってことです。

ただし、ここで抽出するときに気をつけたいのが、
そのカラムが本当に必要かどうか、を判断する知識が必要です。
やみくもに選んでも意味がない、ってことです。

そりゃそうだ。


ということがわかったところで、今回は以下のカラムに着目して学習させます。

make, body-style, wheel-base, engine-size, horsepower,
peak-rpm, highway-mpg, price


早速登録してみます。


手順は下記の通り。

1)「Select Columns in Dataset(列の選択)」モジュール追加
 1. 検索boxに「select」と入力

 2. 「Select Columns in Dataset(列の選択)」モジュールをドラッグ&ドロップ

 3. 「Clean Missing Data(見つからないデータのクリーンアップ)」の
   左側から矢印をつなぐ

 4. コメントを書いてみる

 5. プロパティ内の「Launch Column Selecter(列セレクターの起動)」をぽち。

f:id:azuki-milk-lush:20170901173806p:plain


2)必要カラムの選択
では、次に必要なカラムを設定します。

 1. [With rules (規則を使用)]をクリックします。
で、[Begin With (次で始まる)] の [No columns (列なし)] をクリックします。
   →プルダウンは、[Include (含める)] と [column names (列名)] を選択

 2. テキスト ボックスで、必要な列を選択します。
   →それぞれの意味は下記の通り。
    、、、「馬力」が「horsepower」ってまんまやん。。。初めて知ったw

カラム名意味
makeメーカー
body-styleボディスタイル
wheel-baseホイールベース
engine-sizeエンジンサイズ
horsepower馬力
peak-rpm最大 rpm
highway-mpg高速道路 mpg
price価格

 3. 最後にチェックボタンをぽちします。

f:id:azuki-milk-lush:20170901174244p:plain


こんな感じで登録されてればOK!
f:id:azuki-milk-lush:20170901175652p:plain



これで、着目する項目の設定ができました。
ちなみに、この項目はいつでも変更できます。

思うような結果が出ない時は、必要に応じて変更して試してみましょう〜。


いつもの先生。
docs.microsoft.com




********** シリーズはこちらをどーぞ。 **********
AzureMLをはじめてみた。(1)MLStudioの準備 - あずきみるくのあずきはニガテ - for Engineer
AzureMLをはじめてみた。(2)データの準備ー取得編 - あずきみるくのあずきはニガテ - for Engineer
AzureMLをはじめてみた。(3)データの準備ー整形?編 - あずきみるくのあずきはニガテ - for Engineer