はじめに
以前の投稿で、協調フィルタリングについてまとめました。
同じ機械学習の似ている手法の一つにコンテンツベースフィルタリングがあります。
今回はコンテンツベースフィルタリングとは何か?についてまとめます。
以前の投稿はこちら↓
コンテンツベースフィルタリング
コンテンツベースフィルタリングとは?
ユーザーではなく、商品側に何かしらの特徴量を付与し、特徴が似ている商品を推薦するレコメンドアルゴリズム
引用:https://zero2one.jp/ai-word/content-based-filtering/
図を使って解説します。

各コンテンツにあらかじめ特徴量(キーワードなど)を割り当てておき、ユーザーの行動やアイテムの閲覧履歴をもとにキーワード等からユーザー毎の特徴量を構築する。
上記の図では、映画であればジャンルや主人公・監督などによっておすすめする映画が変わってきます。
音楽であれば、ジャンルやアーティスト・使用している楽器などによって好みが変わってきます。
映画を例にとって、説明します。

「ドラえもん」の映画では、
ジャンル:アニメ
主人公:ドラえもん・のび太
シリーズ化されている
全世代に愛されている
「クレヨンしんちゃん」の映画では、
ジャンル:アニメ
主人公:しんちゃん
シリーズ化されている
全世代に愛されている
2つの映画の共通点にはジャンルが「アニメ」であること、シリーズ化されていること、全世代から愛されていることが挙げられます。ユーザーの好みを分析した時に、上記のようなキーワードが含まれていれば、おすすめされる確率が高いです。
例えば、「ドラえもん」と「クレヨンしんちゃん」が好きなユーザーがいれば、シリーズ化されている「ポケモン」やジャンルがアニメである「僕のヒーローアカデミア」などが推薦されるだろう。
このように、コンテンツベースフィルタリングでは、アイテム自体を分析し、グルーピングする。ユーザーの好みも分析し、グルーピングしたキーワードと一致した商品を推薦する流れになる。
参考資料
【G検定】機械学習の具体的手法(教師なし学習):https://wellcorelife.com/machine_unsupervised-learning/
実装して理解するレコメンド手法〜コンテンツベースフィルタリング:https://yolo-kiyoshi.com/2020/08/26/post-2234/#outline__1
コンテンツベースフィルタリング:https://zero2one.jp/ai-word/content-based-filtering/
コメント