#
- // 機能 他人のツイートをパクって自分のツイートであるかのように発言した人間を検索/特定/分析する事ができます。大きく以下の3つの機能があります。 1. 剽窃者(パクり)のTwitterIDから前科を調べる 2. 被害者(パクられ)のTwitterIDから被害を調べる 3. TweetIDから、そのツイートがどれぐらいパクられているか、またはそのツイート自体がパクりかどうかを調べる - // 判定アルゴリズム 「元発言者のTwitterIDを隠蔽した状態で発言した」という条件をもって「パクった」と判定します。非公式RTは、情報は劣化していますが、元発言者のTwitterIDを隠蔽していないので、このシステムでは白と判定されます。 - // 補足 リソースに限りがあるため、人気のあるツイート、言い換えれば「剽窃者にとってパクる動機のあるツイート」を中心に格納しています。現存する全てのツイートの情報が引けるわけではありません。 「検索指示を受けてから外部に情報を取りに行く」という動作ではないため、任意のツイートのパクられ実績を任意のタイミングで調査する事はできません。 現時点では favotter.net の「今日の人気(best)」上位400位までを2日遅れでクロールしています。この構造上、発言から2日を経ていないツイートはデータベースに含まれません。 Favカウントは favotter.net から取得しています。 RTカウントは公式APIから取得しています。 search APIは1~2週間程度前のデータまでしか参照できないようなので、2011/12/26より以前のパクり行為を観察できる見込みは、現時点ではほぼありません。 RSSでは threshold_rt および threshold_fav 引数が使用できます。 - // 履歴(抜粋) 2012/01/10 - v1.0.0.20120110 Release: TripleT (Tweet Thieves Tracer) 2012/01/17 - Backend v1.2.2.20120117 Add: 2日後に1回だけクロール → 2日後に速報を出したあと、7日後に再度クロールして精密な情報に更新 Fix: URLが混じった発言を見逃す事がある Fix: パクりが100件を越えていると親を発見できない Adjust: favotter.net上位100位まで → 400位までクロール範囲を拡大 Document: 諸々の変更により更新間隔が不定になったので「1日1回更新」という記述を削除 2012/01/17 - Frontend v1.7.12.20120117 Change: tweetidやtwitterid引数が指定されている時は、WorstやRecentなど余計な物を表示しない 2012/01/19 - Backend v1.3.2.20120119 Add: favstar.fmを使ってより正確なFav/RTカウントを取得 2012/08/15 - Backend v1.3.3.20120815 Change: 公式APIが(50+ではなく)正しいRTカウントを返すようになり、またfavstar.fmから蹴られたため、Fav/RTカウントの取得方法を変更。 2013/02/16 - Backend v1.3.4.20130216 Fix: 罪人リストが巨大になりすぎたせいで、去年の11月末ごろからメモリオーバーで常習者リストが更新できなくなっていた問題を修正 Add: 消滅したアカウントを「執行済み」とマーク 戻る // Time Stamp 2013-02-16 13:36:00 (Frontend 1.8.13.20130216 / Backend v1.3.5.20130216) (Last Modify) 2012-01-01 00:05:00 (v1.0.0) (First Edition) // Bookmarks | |||
// Refs. (for this Entry, order by Date) | |||
Sitemap: Index > Pakutter Logging: 0.00ms. Getting Value: 0ms. Getting List of Referer: 0.00ms. Powered by PHP / MySQL, 85480806th Visitor |