2019年10月6日日曜日

【20時間】機械学習を使えるようにする(AWS SageMaker)考え直し編


20時間でスキル取得、を見てからのチャレンジ 3回目 

とりあえずSageMakerについては、ここをみつけ、かなり概要がつかめました。

まず、機械学習をさせるためには、大きく分けて3つの作業があります。

1.学習データの準備
2.機械学習のコードの作成
3.実行環境に1.2.を入れて学習させる

1.2.3.を1回行うのに普通かなり時間がかかり、
本来は1.2.3.を何度も繰り返し試行錯誤して、より良い学習結果を出したい。
しかし、データ準備に時間が掛かったり、マシンスペックが低くて学習に時間がかかったり、環境構築に時間が掛かったりとかなり時間がかかる

そこでSageMakerはこの1から3のサイクルを高速にまわせるよう、色々準備してくれています。

ちょっと脱線しますが、よくある機械学習(画像認識 音声認識 音声処理 テキスト処理 チャットボット 時系列データ予測 レコメンデーション)は、別に「AIサービス」として、それぞれ別サービスが用意されており、特別なプログラミングは必要なく、機械学習のスキルなしに利用できる環境があります。

SageMakerは「MLサービス」で、上記AIサービスには当てはまらない、やりたいことがあるとき、自分で独自に機械学習させ、最適な学習結果を得たいときに利用します。

今回やろうとしているまるばつゲームは、AIサービスには提供されていないものなので、MLサービスであるSageMakerが必要です。AIサービスに用意してくれればよかった。。。

さて、今ぶつかっている課題としては、
今回必要なデータの具体的なイメージが思い浮かびません。

なぜか。

機械学習の経験が無いから。

SageMakerは、既存の機械学習環境を、より簡単に出来るようにしたもの。
機械学習自体が初めての人には、そのメリットが分からない。

いきなり機械学習初心者が使おうとしても、そのルートについては、依然として簡単になっていない。

すでに着手から3~4時間は費やしています。
スキル分解は20時間にカウントしないのでしょうか。。。

どうするか。
1 機械学習を一から学ぶ
2 SageMakerを使ったサンプルを実際に見て、いじって学ぶ

2.もできるかもしれませんが、いたずらに時間を消費する可能性があります。

よって1!

スキル分解は、いまやりたいことが大きすぎると、分解して内容把握するだけでも

かなり時間がかかります。

20時間では難しい。。。

ということで、20時間でスキル取得は、分解し終わってからの時間をカウントすることにします。。。

ジョシュ・カウフマンさん。これでよいですか^^;