教師あり学習
k-最近傍法
k-平均法
線形回帰
線形モデル
Logistic回帰
- Logistic回帰
- ExcelによるLogistic回帰の計算
- Logistic回帰~forgeデータ~Pythonではじめる機械学習より
- Logistic回帰~cancer~Pythonではじめる機械学習より
決定木
- 決定木によるクラス分類(分類木~classification tree)
- 決定木の分割の考え方
- 特徴量重要度の計算方法
- 決定木による回帰(回帰木~regression tree)
- ランダムフォレスト
- 勾配ブースティング
SVM~サポートベクターマシン
ニューラル・ネットワーク
教師なし学習
主成分分析
事後分析
Confusion matrix
scikit-learn
preprocessing~前処理
sklearn.preprocessing
の使い方- scaler~スケーリング
- normalizer~正則化
- binalizer~2値化
- encoder~クラスデータの数値化
train_test_split()
による訓練データとテストデータの分割
教師あり学習
k-最近傍法
線形モデル
決定木
教師なし学習
PCA~主成分分析
分析
confusing matrix
補足
- ブートストラップ・サンプリング
- 過学習~多項式回帰の場合
- 正則化の意味
- 線形モデルによる多クラス分類
- 機械学習に関する英語
- 決定境界の描き方
decision_function()
とpredict_proba()
Toyデータ
データセット内容
scikit-learn
- make_blobs()
- make_moons()
- make_circles()
- irisデータセット
- Breast cancer wisconsinデータセット
- Boston house pricesデータセット
- Diabetesデータセット
- LFW peopleデータセット
mglearn
データの俯瞰
各手法による分析
クラス分類データ
- blobsデータセット – Linear SVC
- blobsデータセット – SVM
- two moonsデータセット – 決定木(可視化1、可視化2)
- two moonsデータセット – ランダムフォレスト
- two moonsデータセット – MLP
- forgeデータセット – knn
- forgeデータセット – Logistic回帰
- forgeデータセット – SVM
- irisデータセット – knn
- irisデータセット – PCA
- Breast cancerデータセット – knn
- Breast cancerデータセット – Logistic回帰
- Breast cancerデータセット – SVM
- Breast cancerデータセット – 決定木(特徴量重要度)
- Breast cancerデータセット – 勾配ブースティング
- Breast cancerデータセット – MLP
- Breast cancerデータセット – PCA
- LFW peopleデータセット – knn(PCA変換付き)
- LFW peopleデータセット – PCA
属性値予測データ
- waveデータセット – k-近傍法
- waveデータセット – 線形回帰
- Boston house pricesデータセット – Ridge/Lasso
- Boston house pricesデータセット – PCA