こんばんは。この記事では、Microsoft Azureでデータ分析環境を利用できるようになるまでのステップを解説します。
自分がセットアップした時の手順を備忘として書きました。それでは早速まいります!
2022年2月、記事の記載とキャプチャを直近化しました。変化激しいクラウドサービスなので、記載内容がすぐ古くなりますね・・・。
Contents
Microsoft Azureのアカウント取得
もしまだAzureのアカウントを持っていなければ、以下から作成しておきます。
https://azure.microsoft.com/ja-jp/
AWSと同様、一定期間・一定額を無料で利用できる特典がありますので、お金をかけずに利用開始できます。(12ヶ月間利用無料&200)
「無料で始める」をクリックしてアカウント情報を入力していきます。
アカウント作成を完了すると、早速Azureの各サービスが利用できる状態になります。
Azure Machine Learningのセットアップ
それでは本題のデータ分析環境の構築です。今回は、第一段階として、ローカルでやるようなJupyter Notebookを使ったアドホックなデータ分析が行える状態を目指します。
これを実現するためのサービスはいくつかありますが、今回はAzure Machine Learningを使うこととします。AWSでいうと、Sage Makerに対応するサービスになります。
https://azure.microsoft.com/ja-jp/services/machine-learning/#product-overview
利用料金については、最後にまとめたので、よろしければご覧ください。
Machine Learningワークスペースを作成する
Azure Machine Learningを利用するために最初に作成する必要があるのは、ワークスペース。ワークスペースってなんやねん。答えはこちらに。
https://docs.microsoft.com/ja-jp/azure/machine-learning/concept-workspace
公式Docには以下の説明のように説明されています。
- Azure Machine Learning の最上位のリソースで、Azure Machine Learning を使用するときに作成するすべての成果物を操作するための一元的な場所を提供します。
- ワークスペースには、スクリプトのログ、メトリック、出力、スナップショットなど、すべてのトレーニング実行の履歴が保持されます。
- その他、コンピュートリソースの紐付けや、作成したモデルの紐付けなどが行われる。
それでは実際にリソースを作成していきます。
ポータルのメニューから、「リソースの作成」をクリックし、「機械学習」と検索ボックスに入力して、新規リソースの作成を開始します。
必要情報を入力していきます。ネットワーク設定等は、今回のところは特にいじらず規定値で作成していきます。
5分以内の操作でワークスペースの作成を完了することができました。
Azure Machine Learning Studioを起動する
「リソースに移動」をクリックすると、以下のような画面になります。
みて分かる通り、ワークスペースリソース上では直接データ分析や機械学習が行える機能のブレードは見当たらず、これらはAzure Machine Learning Studio上で実行できるようです。
Azure Machine Learning Studioは、「ワークスペースの操作をGUI上で行うためのツール」という位置付けで提供されているようです。
ということで、概要ブレードから「スタジオの起動」へ進みます。
新しいNotebookを作成する
最後に、Notebookの作成です。Machine Learning StudioのHome画面から「Notebooks」>「Start Now」と進むと、Jupyter Notebookが起動します。
すると、「You don’t have a compute. You can create, clone and edit notebooks without a compute, but you will need one to run a notebook.」というワーニングが。
このワーニングの通り、Notebookを利用するには、Notebook上で演算を行うためのコンピュートリソース (VM) の作成が必要となります。「Create Compute」からリソースの作成に進みます。
VMの作成では、以下のように想定されるワークロードに最適なスペックを選択することができます。
VMの作成が完了したら、今度こそNotebookの作成です。今回はStart with an empty Notebookで新規Noteを作成しますが、既存のNotebookのアップロードもできるようですね。
すると、Notebookが立ち上がりました!デフォルトでPython/Rバージョンやインストールされているライブラリが異なるいくつかの環境が用意されているので、右上のプルダウンから変更可能です。
っと、なんかJupyterライクだけどJupyterと同じじゃないからやりづらいいな・・と思われた方。ご安心ください、ちゃんとJupyter NotebookまたはJupyter Labも内蔵されていて、GUIの切り替えが可能です。
これで、馴染みのあるJupyterのGUIで分析が進められますね!
以上で最低限の環境セットアップが完了です。
Azure Machine Learningの値段
直近の価格については以下をご覧ください。
https://azure.microsoft.com/ja-jp/pricing/details/machine-learning/
Azure Machine Learningサービス自体は、なんと無料で利用することができます。必要なのは、ワークスペースと連携している各種Azureサービスの利用料金のみ。
例えば、コンピュートリソース(VM)の料金、ストレージの料金、など・・。2022年2月時点での東日本のコンピュートリソース最安料金(予約利用は除く)は11.8円/hほどなので、1日300円弱、1ヶ月ずっとVMを起動し続けていたら最低でも9000円かな・・?
流石にずっと起動しておくと高くつきそうなので、個人利用なら利用する時だけ起動するなどして節約はしたいところです。
以上、Azure Machine Learningを使ってクラウド上にサクッとデータ分析環境を作る手順の解説でした。Azure Machine Learningでは、他にも高度で便利な機能がたくさん搭載されているので、追ってご紹介できればと思います。
次回は、今気になっているAutoMLを使えるようにしてみたいと思います!
最後までご覧いただきありがとうございました!
コメントを残す