https://twitter.com/ccc_privacy_bot

Tカードが個人情報を提携企業に提供開始
個人情報提供の中止はいつでもできるが、「提供先企業は随時増える」「提供先企業が増えてもCCCからは通知は来ない」「新規企業は何もしないとデフォルトで個人情報提供する設定」というユーザフレンドリーじゃない仕様

という感じ
ボット自体は半月くらい前にはできてたのですが、2回目以降のCCCの更新が取得できるまで公開を控えていました。
語弊あったようなので捕捉
https://github.com/sue445/ccc_privacy_crawler
Herokuで30分に1回ボットを動かしているというと有料のHeroku Scheduler*1を思い浮かべると思いますが、このボットではsidekiq-cronで自前でcron処理を行いwebのDynoを落とすことで無料でも30分に1回の定期実行を実現しています。webのDynoを落とすとURLでアクセスできなくなりますが、ボットということで割り切ってますw

sidekiqが立ち上がっている時はDynoはずっと立ち上がったままですが、1 Dynoをずっと動かす分には無料枠で大丈夫です。
crawler Dynoっていうのがあるのか…
crawlerはProcfileで指定しているDyno名ですねhttps://github.com/sue445/ccc_privacy_crawler/blob/master/Procfile
web dynoがhttpにroutingされること以外は特にルールはなかったはず。
@ka_ sidekiqが動く時は同一プロセス内でスレッド立ち上がってcron処理するのでworkerのプロセスしか使いません
— sue445 (@sue445)2014, 11月 18resque はプロセスでworkerを処理する仕組みだけどsidekiq はスレッドでworkerを処理するのでcrawler dyno内で完結します
*1:定期実行の間隔が1日1回なら無料だが、それより多いと有料
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。