無題

現在、pixivでは順次インフラの増強を行っておりますが画像のダウンロードツール等の通常の利用範囲を超えた一部ツールの使用によってインフラ(サーバ)に対して非常に負荷がかかっています。

うーん。
pixivは絵師さんのSNSといふ事で、ニコや掲示板とは異なる文化圏を持ってゐる。そこが東方界隈ではどのやうに現れてゐるのかとても興味深く思ってゐて、だから、一度タグやテキスト等を解析してみて統計的な考察をしてみたいのだけど、これを見る分には厳しさうだなぁ。

一応、絵ぢゃなくてHTML採るだけだよとか、一回の取得間隔を10秒以上取れば検索エンジンクローラーより少ないよとか言へなくもないのだけど、ただでさへ負荷が課題になってゐる以上はなるべくそれに協力すべきとも思ふ*1

Googleのキャッシュを利用する方法も検討したが、どうもそれなりに有名なところでなければキャッシュに残ってゐない事の方が多いらしく、統計的信頼性に問題がある。

ニコニコ動画APIが充実してゐて、その辺りは何となくやりやすさうだが*2、東方の中でpixivの持つ影響力ってどのぐらゐなのだらう。pixiv界隈の傾向は、恐らくネット上では最もサークル界隈と親和性が高いと見てゐるのだが、仮説は立っても検証するデータが集められない。

どちらにしろ、しばらくは静観かなぁ。その分カタログのデータで遊ぶか。

*1:秋姉妹に限定すれば、精々1000件弱なので、深夜早朝時間帯にのんびり採れば問題ないだらう。しかし、東方タグ全体で見れば、既に27万8000件以上ある。10秒間隔で取得しても、32日と3時間弱かかるわけだ。

*2:それでもなんか課題が出てくるかも知れない