アニメおすすめ処理の裏側と利用方法のコツ
アニメおすすめDBの紹介エントリを書いたもののアクセスが一向に無いので、そのまま存在を忘れていた本ブログではありますが、本日はてなブックマークのホットエントリで紹介されたようです。みなさまブックマークとコメントありがとうございます。
PFI の推薦エンジンを使っておすすめアニメを探すサイトを作ってみた - アニメおすすめDB運営ブログ (52 users) http://t.co/YVHCNd86qD
— はてなブックマーク::Hotentry (@hatebu) September 22, 2013
、、、というお礼と、きちんとエントリを書き続けなければ、という決意を込めて久しぶりにエントリを書きました。
それだけでは情報量もないので、ついでにちょっとした裏側を紹介してみます。
おすすめアニメの計算タイミング
アニメおすすめDBでは、推薦アルゴリズムに単純な転置インデックス(Wikipedia)方式を採用しています。これは Jubatus のサポートしているアルゴリズムの中で一番遅いですが正確な結果が出るアルゴリズムです。
このアルゴリズムを採用した理由は、評価データが少ないためか、この他の近似アルゴリズムを使うと結果がイマイチになってしまっていたためです。
そのため本サイトでは、バッチ処理によりオフラインで計算する部分とそのままオンラインで計算する部分に分けています。リアルタイム計算を売りにしたエンジンを採用しているのに残念な感じですよね・・・
オフラインで計算しているのは、各作品ページの「おすすめ」の部分です。これはユーザの評価をもとに類似作品を提示している、いわゆるユーザベースの協調フィルタリング(Wikipedia) なのですが、私もパラメータの調整をしただけで詳細はわかっていません。(よくわかってなくても使えるのが、Jubatus のいいところです。)
評価を入力しておすすめされる作品はオンライン計算の結果ですので、リアルタイムで変化します。
おすすめされるアニメ作品の傾向と評価入力のコツ
推薦は入力された評価をもとに計算されるわけですが、すべての人が存在するすべてのアニメの評価を入力してくれるということは現実的にありえません。必ず特定の人気作品に評価が偏ります。
なので、訪れたユーザが一般的な人気アニメの評価を入力すると、おすすめされるものも万人向けのアニメになってしまいます。玄人向けの作品をおすすめされたい人は、評価する入力データも玄人向けのアニメを中心にしてみると良いです。(ただし誰も評価したことがないアニメだと何もおすすめされません。)
せっかくなので例も見てみましょう。
今回は映画化もされて超有名なあの日見た花の名前を僕達はまだ知らないについて見てみます。この作品の紹介ページを見てみるとどうでしょうか。
有名な作品ばかりがおすすめとしてリストアップされていて「わざわざおすすめされなくても知っているよ!」と感じる人が多いのではないかと思います。
ただ、長井龍雪さんつながりのとらドラ!やとある科学の超電磁砲がおすすめ上位に来ていますし、あの花が好きな人にオススメできそうな作品が微妙に上位に来ているとも言えないでしょうか。
ちょっと都合のいい作品を選んでしまった気もしますが、可能性を感じてもらえると嬉しいです。
まだ試していない方は、是非一度試していただき、どのような作品を推薦されたか Twitter やブックマークコメントで報告していただけると喜びます。ぜひよろしくお願いします。