18章モデル開発におけるバイアスの回避法

この章では、データサイエンティストがモデル開発のプロセスでバイアスに対処するにはどのような手順で作業を進めればよいかを説明し、その際に役に立つ手法やツールも紹介します。

では「4章 モデルの開発」で見た次の5つのステップのそれぞれについて詳しく見ていきましょう。

ステップ1 モデルのデザイン(設計)

ステップ2 データエンジニアリング

ステップ3 モデル推定(組み立てアセンブリ

ステップ4 モデルの検証

ステップ5 モデルの実装

必要に応じて、4章の内容(とくに最後の「まとめ」)を参照しながら読み進めてください。

18.1 「ステップ1 モデルのデザイン」におけるバイアスの回避

モデルデザインの段階でバイアスに対処する際に有効なものとして私がとくに推奨するのは次の3つのプラクティスです。

  1. 現場の知見の重視——最前線、つまり現場の担当者から実体験に基づく知見を得ることはとても重要です
  2. 「汚染」への対応——手元にあるデータが実世界のバイアスによって「汚染」されていないかを調べ、最適な対処法を探ります
  3. 最終的なビジネスの目的の再確認——「目的は何か」を常に念頭に置いて判断を下します

では各項目について詳しく見ていきましょう。

現場の知見の重視

モデルデザインの段階でバイアスに対処するために有効な第1のプラクティスは「現場の知見の重視」です。たとえば家族経営の食料品店が債務不履行に陥る可能性を予測するモデルを構築するのであれば、融資する支店の営業や審査の担当者、回収業務の担当者などから聞き取り調査をするべきです。また、不健康だと言われながらも病みつきになる菓子を製造し、そのお店に納品しているイタリアの著名な菓子メーカーの販売担当者に対する聞き取り調査でも、何か有益な情報が得られるかもしれません。 ...

Get AIの心理学 ―アルゴリズミックバイアスとの闘い方を通して学ぶ ビジネスパーソンとエンジニアのための機械学習入門 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.