7章その他のトピック

新しい情報を与えるのではなく、

私たちが今まで分かっていたことを整理することで、問題は解決される。

—— ルートヴィヒ・ウィトゲンシュタイン『哲学探究』

これまで、本書の「第Ⅱ部 必須事項」では、NLPの一般的なタスクとして、テキスト分類、情報抽出、チャットボット(「4章 テキスト分類」-「6章 チャットボット」)を取り上げてきました。これらのタスクは実際のプロジェクトでよく使われていますが、大規模な文書集合を扱うアプリケーションの構築に関連するタスクはほかにも多数あります。本章では、これらのタスクのうち、いくつかを簡単に紹介します。まず、タスクとはほとんど無関係なシナリオの説明から始めましょう。その後、各シナリオについて掘り下げていきます。

もし誰かに「NLPとは何か」と尋ねられて、その答えがわからなかったらどうするでしょうか。インターネットが普及していない時代であれば、近くの図書館に行って調べ物をしていたでしょう。しかし、今なら真っ先に検索エンジンを利用するはずです。検索では、自然言語を使って人間とコンピュータがやりとりします。そのため、NLPにとって非常に興味深いユースケースと言えます。

自社の顧客に大手法律事務所がいるとしましょう。新しい事件が発生すると、その事件の全体像を把握するために、事件に関する資料を大量に調べなければならないことがあります。多くの場合、人間が徹底的に調べる時間はありません。そのため、顧客は、大量の文書で議論されているトピックの概要を、すぐに把握できるソフトウェアを開発してほしいと考えています。そのような場合に使えるのがトピックモデルです。トピックモデルは、大量の文書の中から、潜在的なトピックを見つける問題を扱うために使われます。 ...

Get 実践 自然言語処理 ―実世界NLPアプリケーション開発のベストプラクティス now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.