Wiki トピック

モデルフィッティング

モデルフィッティングとは

モデルフィッティングは、機械学習モデルトレーニングに使用されたデータと同様のデータに対してどのぐらい適切に一般化するかを示す指標です。適切にフィッティングされたモデルは、より正確な結果を導き出します。オーバーフィット状態のモデルはデータと一致しすぎ、アンダーフィット状態のモデルではデータとの一致が十分ではありません。

それぞれの機械学習アルゴリズムには、基本的なパラメーターのセットが用意されており、これを調整して精度を向上できます。フィッティングプロセス中、ターゲット変数がわかっているデータ(「ラベル付き」データ)に対してアルゴリズムを実行し、機械学習モデルを生成します。次に、ターゲット変数の実際に観察された値に対し、結果を比較して、精度を確認します。次に、この情報を使用してアルゴリズムの標準パラメーターを調整してエラー率を削減し、パターンおよび残りの特徴量とターゲットとの関係を見つけ出す精度を高めます。現実的なビジネス課題に対して有効かつ実用的で、適用可能なインサイトを生成する最適なパラメーターをアルゴリズムが見つけるまで、このプロセスを繰り返します。

モデルフィッティングが重要である理由

モデルフィッティングは機械学習の本質です。モデルがデータに正しくフィッティングしていない場合、このモデルから生成される結果は精度が低く、実用的な意思決定には役に立ちません。適切にフィッティングされたモデルには、既知の変数とターゲット変数の間の複雑な関係性をとらえるハイパーパラメーターがあり、関連性のあるインサイトの発見や正確な予測を可能にします。フィッティングは自動プロセスであり、機械学習モデルの個々のパラメーターが、現実のビジネス課題を高い精度で解決する上で最適なものになるようにします。

モデルフィッティング + DataRobot

DataRobot は、データを使用して一度に数十種類のモデルを自動的にフィッティングするため、プロセス完了までの時間が通常より大幅に削減されます。また、モデルフィッティング自体は自動的なプロセスですが、ハイパーパラメーターのチューニングなど、モデルの精度を高めるためのより複雑なデータサイエンス手法には、時間とデータサイエンスの経験がさらに必要となります。DataRobot はこの作業を自動化するため、あらゆるモデルを最低限の労力と時間でフィッティングすることができます。