コンテンツベースフィルタリングとは?

機械学習

はじめに

以前の投稿で、協調フィルタリングについてまとめました。
同じ機械学習の似ている手法の一つにコンテンツベースフィルタリングがあります。
今回はコンテンツベースフィルタリングとは何か?についてまとめます。

以前の投稿はこちら↓

コンテンツベースフィルタリング

コンテンツベースフィルタリングとは?

ユーザーではなく、商品側に何かしらの特徴量を付与し、特徴が似ている商品を推薦するレコメンドアルゴリズム

引用:https://zero2one.jp/ai-word/content-based-filtering/

図を使って解説します。

各コンテンツにあらかじめ特徴量(キーワードなど)を割り当てておき、ユーザーの行動やアイテムの閲覧履歴をもとにキーワード等からユーザー毎の特徴量を構築する。
上記の図では、映画であればジャンルや主人公・監督などによっておすすめする映画が変わってきます。
音楽であれば、ジャンルやアーティスト・使用している楽器などによって好みが変わってきます。
映画を例にとって、説明します。

「ドラえもん」の映画では、
ジャンル:アニメ
主人公:ドラえもん・のび太
シリーズ化されている
全世代に愛されている

「クレヨンしんちゃん」の映画では、
ジャンル:アニメ
主人公:しんちゃん
シリーズ化されている
全世代に愛されている

2つの映画の共通点にはジャンルが「アニメ」であることシリーズ化されていること全世代から愛されていることが挙げられます。ユーザーの好みを分析した時に、上記のようなキーワードが含まれていれば、おすすめされる確率が高いです。
例えば、「ドラえもん」と「クレヨンしんちゃん」が好きなユーザーがいれば、シリーズ化されている「ポケモン」やジャンルがアニメである「僕のヒーローアカデミア」などが推薦されるだろう。
このように、コンテンツベースフィルタリングでは、アイテム自体を分析し、グルーピングする。ユーザーの好みも分析し、グルーピングしたキーワードと一致した商品を推薦する流れになる。

参考資料

【G検定】機械学習の具体的手法(教師なし学習):https://wellcorelife.com/machine_unsupervised-learning/ 
実装して理解するレコメンド手法〜コンテンツベースフィルタリング:https://yolo-kiyoshi.com/2020/08/26/post-2234/#outline__1 
コンテンツベースフィルタリング:https://zero2one.jp/ai-word/content-based-filtering/ 

コメント

タイトルとURLをコピーしました