MRが楽しい

MRやVRについて学習したことを書き残す

公式チュートリアル「MR and Azure 307 4章 前半」を試してみる

本日はチュートリアルの実施枠です。
Academyの「MR and Azure 307: Machine learning」の実施内容をまとめます。
docs.microsoft.com
前回記事の続きです。
bluebirdofoz.hatenablog.com
今回は「Chapter 4 前半」です。Chater 4 は長いため、2つに分けています。

Chapter 4:The Machine Learning Studio: The Experiment

機械学習システムを構築する前に、データに関する理論を検証するために実験を構築する必要があります。結果で、より多くのデータが必要かどうか、またはデータと可能な結果との間に相関がないかどうかがわかります。

テストの作成を開始するには以下の手順を実施します。

1.ページの左下にある[+ New]ボタンをもう一度クリックし、[EXPERIMENT] -> [Blank Experiment] の順にクリックします。
f:id:bluebirdofoz:20181115081016j:plain

2.新しい[Experiment]ページが表示されます
f:id:bluebirdofoz:20181115081025j:plain

3.左側のパネルから [Saved Datasets] -> [My Datasets] を展開し、[ProductsTableCSV.csv]をキャンバスにドラッグします。
f:id:bluebirdofoz:20181115081039j:plain

4.左側のパネルから [Data Transformation] -> [Sample and split] を展開します。
次に[Split Data]をキャンバスにドラッグします。[Split Data]はデータセットを2つの部分に分割します。
番号[1]の出力は、機械学習アルゴリズムを訓練するために使用します。
番号[2]の出力は、生成されたアルゴリズムの精度を評価するために使用されます。
f:id:bluebirdofoz:20181115081050j:plain

5.キャンバス上の[Split Data]を選択します。
右側に[Split Data]の入力パネルが表示されます。[Fraction of rows in the first output dataset]を[0.7]に編集します。
これにより、データは2つの部分に分割されます。
データの70%が番号[1]の出力から出力され、機械学習アルゴリズムを訓練するために使用します。
残りの30%が番号[2]の出力から出力され、生成されたアルゴリズムの精度を評価するために使用します。
データがランダムに分割されるようにするには[Randomized split]のチェックボックスがオンのままであることを確認します。
f:id:bluebirdofoz:20181115081107j:plain

6.キャンバスの[ProductsTableCSV.csv]から接続を引き、[Split Data]の上部にドラッグします。
これによりアイテムが接続され、[ProductsTableCSV.csv]の出力(データ)が[Split Data]の入力に送信されます。
f:id:bluebirdofoz:20181115081614j:plain

7.左側のパネルから [Machine Learning] -> [Train] を展開します。[Train Model]をキャンバスにドラッグします。
f:id:bluebirdofoz:20181115081128j:plain

8.[Split Data]の左下隅から[Train Model]の右上に接続をドラッグします。
データセットからの最初の70%の分割は[Train Model]によってアルゴリズムのトレーニングに使用されます。
f:id:bluebirdofoz:20181115081143j:plain

9.キャンバス上で[Train Model]を選択し、右側のプロパティパネルで[Launch column selector]ボタンをクリックします。
f:id:bluebirdofoz:20181115081153j:plain

10.[Select a signle column]のダイアログが表示されます。
テキストボックスに[product]を入力し、Enter キーを押すと、[product]が予測を訓練する列として設定されます。
右下隅のチェックをクリックしてダイアログを閉じます。
f:id:bluebirdofoz:20181115081203j:plain

11.Machine Learning Algorithm を訓練して、1日の時間と日付に基づいて最も売れた製品を予測します。
Azure Machine Learning が提供する様々なアルゴリズムの詳細は以下を参考にしてください。
docs.microsoft.com

12.左側のパネルから、[Machine Learning] -> [Initialize Model] -> [Classification]を展開します。
[Multiclass Logistic Regression]をキャンバスにドラッグします。
f:id:bluebirdofoz:20181115081222j:plain

13.[Multiclass Logistic Regression]の下部から[Train Model]の左上の入力に接続をドラッグします。
f:id:bluebirdofoz:20181115081232j:plain

14.左側のパネルから [Machine Learning] -> [Score] を展開し、[Score Model]をキャンバスにドラッグします。
f:id:bluebirdofoz:20181115081242j:plain

15.[Train Model]の下部からの出力を[Score Model]の左上入力に接続します。
16.[Split Data]の右下の出力を[Socre Model]の右上の入力に接続します。
f:id:bluebirdofoz:20181115081250j:plain

17.左側のパネルから [Machine Learning] -> [Evaluate] を展開し、[Evaluate Model]をキャンバスにドラッグします。
f:id:bluebirdofoz:20181115081300j:plain

18.[Score Model]の出力を[Evalute Model]の左上の入力に接続します 。
f:id:bluebirdofoz:20181115081314j:plain

19.これで機械学習を構築し、[Experiment]を保存して実行できるようになりました。
ページの下部にあるメニューから[SAVE]ボタンをクリックして[Experiment]を保存します。
f:id:bluebirdofoz:20181115081327j:plain

Chapter 4 前半はここまでです。
次回は Chapter 4 後半を実施します。