11章より高度な課題

本書ではこれまで、主に画像全体の分類問題を見てきました。また、「2章 機械学習モデル」のコラムでは画像の回帰について少しだけ触れ、「4章 物体検出と画像セグメンテーション」では物体検出と画像のセグメンテーションについて扱いました。本章では、計測、カウンティング、姿勢推定、画像検索などのより高度なコンピュータビジョンの問題について説明します。

[Tip]

本章のコードは、本書のGitHubリポジトリの11_adv_problemsフォルダを参照してください。コードサンプルやノートブックのファイル名は必要に応じて明記します。

11.1 物体計測

画像内の物体の大きさを知りたいことがあります(例えば、ソファの長さが180cmであるなど)。空撮した雲の画像を使って地上の降水量などを測定するには、単純にピクセル単位で回帰分析することができますが、物体を計測する場合には、より高度な処理が必要です。というのは、同じ物体であっても、画像内の位置、回転、アスペクト比などにより、異なる数のピクセルで表現される可能性があるからです。ここでは、よく知られているセグメンテーションを用いた方法を例に、写真内の物体を計測するのに必要な4つのステップを説明します。

11.1.1 基準となる物体

私たちはオンラインの靴屋を運営していて、顧客の足型の写真を使って、最適な靴のサイズがわかるようにしたいとします。図11-1のように、足を濡らして紙の上に乗ってもらい、その足跡の写真をアップロードしてもらい、機械学習モデルを用いて、その足跡から適切な靴のサイズ(長さと幅)と足のアーチの種類を計算するアプローチを考えてみましょう。 ...

Get コンピュータビジョンのための実践機械学習 ―モデルアーキテクチャからMLOpsまで now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.