こんにちは。本日は機械学習モデル構築にあたり、悩みどころである、学習アルゴリズムの選び方について、良いドキュメントを見つけたのでご紹介しようと思います。
まさにこういうものが欲しかった・・!そしてもっと早く見つけておきたかった・・・!
これ、便利なことにクリックすると各アルゴリズムの説明に飛ぶこともできます。
Scikit-Learn : Choosing Right Estimator
https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
今後、以下から各アルゴリズムの説明の詳細記事にリンクできるようにしていこうと思います。
また、理解が深まってきたらコメントも充実させていこうと思います!
Contents
分類問題のアルゴリズム
- SGD Classifier:確率的勾配急下法
- Kernel Approximation:カーネル近似
- 線形サポートベクターマシン
- ナイーブベイズ
- K近傍法
- アンサンブル
メモ
回帰問題のアルゴリズム
- 確率的勾配急下法
- ラッソ
- リッジ
- SVR(Kernel = “Linear” / “RBF”)
- Elastic Net
- アンサンブル
次元削減のアルゴリズム
- PCA(主成分分析)
- カーネル近似
- isomap(多様体学習)
- LLE(Locally Linear Embedding)
- Special Embedding
クラスタリングのアルゴリズム
- KMeans(K近傍法)
- GMM(混合ガウスモデル)
- VBGMM (Variational Bayesian Gaussian Mixture)
- MeanShift
- Special Clustering
アンサンブルには、AdaBoost, XGBoost, LightGBMなどの勾配ブースティングモデルなどを含みます。アンサンブルをいきなり試す前に、もっと簡単なアルゴリズムでの実装も試す余地があるということですね。