2007年 10月02日(Tue) [長年日記]
_ [ツッコミレス]まだ打ってないから
余裕で間に合ってるぜ! つーかマジハロに吸い込まれまくってるから、他の台打ってる余裕無いという罠。昨日5円スロでドリスタ見つけたから、とりあえずそこで打ってみようかなぁ。
おなじ5円スロの島にキュンキュンがあったので打ってみた。30分打って+400円。ほとんどゲーセン感覚。まあキュンキュン堪能できれば幸せだから全然OKでしたが。
_ [その他]鳥取は遠いね
来週から福岡に一週間ほど出張になるんですが、もしかして途中で鳥取に寄れるんじゃね? とかふと思ったけど、よくよく考えてみると寄り道ってレベルじゃないほど遠い事に気がついたw
_ [mixi][ruby][Webサイト]mixiリニューアル
10/1付けでmixiサイトのリニューアルがありました。新しいデザインが各所で不評みたいですが(っていうか2カラム設定無くすなよ)、テーブルレイアウトじゃ無くなった点は評価したいですね。class名やid名をたくさんつけてくれたので、文章取り出したり加工したりしやすくなったのですよ。
だからユーザーの声を聞いてデザインを再度変更する場合でも、元には戻さないで下さいねって事で。テーブルレイアウトは勘弁な。
んで、リニューアルしたら予想通りget_mixi_new_diary_rss.rbが動かなくなったので、書き換えることに。今回は正規表現での力技をやめてHpricotを使ってみたので、中身が分かりやすくなったと思うのですががが。
- get_mixi_new_diary_rss.rb
def get_mixi_new_diary_rss(config, data) require 'rubygems' require 'mechanize' require 'kconv' require 'rss/maker' require 'hpricot' # require 'logger' username = config['user_id'] password = config['password'] agent = WWW::Mechanize.new {|a| # a.log = Logger.new('access.log') # a.log.level = Logger::DEBUG } page = agent.get('http://mixi.jp/') form = page.forms[0] form.fields.find {|f| f.name == 'email'}.value = username form.fields.find {|f| f.name == 'password'}.value = password form.fields.find {|f| f.name == 'next_url'}.value = '/home.pl' page = agent.submit(form, form.buttons.first) if /url=([^"])"/ =~ page.body link = 'http://mixi.jp' + $1.to_s agent.get(link) end data = [] diarylist = agent.get('http://mixi.jp/new_friend_diary.pl') diarylist.links.each do |link| diaryurl = link.href # => 'view_diary.pl?id=12345&owner_id=2345' if /view_diary.pl\?id/ =~ diaryurl item = "" page = agent.get(diaryurl) body = Hpricot(page.body.toutf8) mydescription = (body/"div#diary_body").inner_html (body/"div.diaryMainArea02//dl.commentList01").each do |comment| mydescription += "<br>--<br>[#{(comment/"span.commentTitleName").inner_text}]" mydescription += "<br><br>#{(comment/"dd").inner_html}<br>--<br>" end item.instance_eval do @description = mydescription def description @description end end mytitle = (body/"title").inner_text item.instance_eval do @title = mytitle def title @title end end str = (body/"div.listDiaryTitle//dd").inner_text str =~ Regexp.new("(\\d{4}).+?(\\d{2}).+?(\\d{2}).+?(\\d{2}).+?(\\d{2})") mydate = Time.parse($1 + $2 + $3 + ' ' + $4 + $5 + '00') item.instance_eval do @date = mydate def date @date end end mylink = 'http://mixi.jp/' + diaryurl item.instance_eval do @link = mylink def link @link end end data << item end end return data end
そういえばこの間イシュ氏に「何でいつもねくろんさんは22:00に足跡があるの?」と聞かれたんですよね。で、一度もこの日記ではっきりと説明したことが無かった事に気がついたので、これを機会に書いておきます。
私は基本的にWeb巡回をlivedoor ReaderというRSSリーダーで行っています。で、mixiの方もこのRSSリーダーでチェックしてるんですが、mixiはRSSを出力しないので、代わりにPraggerというrubyスクリプトを2時間おきに自動起動させてページ取得→RSSに加工→リーダーで読むという事をやっているのです。
まあ私の代わりに自動的にmixiを読んでおいてくれるロボットがいるとでも思ってくれればOKです。……たまにロボットがキリ番踏むけど勘弁ねw
寄っていただければ売りつけますw<br>(本当に確保しておいてます)
mixiミュージックとmixi news だけ依然 table レイアウトなんですよね(´Д`;
利用させていただきました!<br>ありがとうございます。
http://d.hatena.ne.jp/zenpou/20071026/1193386616<br>zenpouの日記<br>[mixi][pragger][ruby]mixiの日記をはてなに移行してみた。<br> mixiの既存の日記はpraggerで保存しておいた。(公開してないけど) ねくろんさんの以下のエントリからmixiを取得してきてちょい弄ってみた。 http://www.necron-web.com/tdiary/?date=20071002 def get_mixi_new_diary_rss(config, data) require ’rubygems’ require ..