6章モデルの学習
前処理ステップが完了したことで、データはモデルへ入力できる形式に変換されました。パイプラインの次のステップでは、変換されたばかりのデータを使って、モデルを学習します。
「1章 イントロダクション」で述べたように、本書では、モデルアーキテクチャを選択するプロセスは取り上げません。本書を読む前に実験は完了しており、学習したいモデルの種類は既知であると仮定しています。実験プロセスの追跡方法については、モデルの監査証跡を作成するのに役立つため、「15章 パイプラインの未来と次のステップ」で説明します。しかし、モデルの学習プロセスを理解するために必要な理論的背景については一切触れていません。理論的背景について理解を深めたい方は、『scikit-learn、Keras、TensorFlowによる実践機械学習 第2版』(オライリー・ジャパン)を読むとよいでしょう。
本章では、機械学習パイプラインの一部として、モデルの学習プロセスを説明します。これには、TFXパイプラインでの学習の自動化方法も含まれます。また、TensorFlowが提供する分散学習戦略やパイプライン内でハイパーパラメータをチューニングする方法についても触れています。本章は、学習プロセスをパイプラインの一部として扱うため、他の章と比べてTFXパイプラインに特化した内容となっています。
図6-1に示すように、学習段階までにデータの取り込み、検証、前処理が完了しています。これにより、モデルに必要なデータはすべて存在し、データは再現可能な方法で特徴に変換されていることが保証されます。このような保証は、パイプラインが学習ステップで失敗するのを防ぐためには欠かせません。たいていの場合、学習はパイプラインで一番時間のかかるプロセスなので、失敗が少ないに越したことはないのです。 ...
Get 入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.