Hpricot の練習をしました

北大大学院情報科学研究科の女性准教授(43)が、「神世界」グループが全国展開する「ヒーリングサロンに客を勧誘している」と告発する投書が同大学に寄せられ、大学側がこの准教授から事情を聴いていたことが二十六日分かった。

霊感商法「神世界」 北大准教授が勧誘か 大学が聴取 本人は否定(12/26 16:03) - 北海道新聞

北海道大学の准教授が、霊感商法に関わっていた疑惑が持ち上がっています。
霊感商法で問題となっている「神世界」グループが展開するヒーリングサロンに北大の准教授が、関係者を勧誘していた疑いがあるとして、大学側が事情を聴いていたことがわかりました。

http://www.stv.ne.jp/news/item/20071226183612/

ということで,Hpricot を使って候補者を調べるスクリプトとか作ったらいいのでしょうか?これで合ってますか?よく分かりません ><

require 'open-uri'
require 'rubygems'
require 'hpricot'
require 'kconv'

$KCODE = 'u'

doc = open('http://www.ist.hokudai.ac.jp/staff/index.php') do |f|
  Hpricot(f.read)
end

assocprofs = doc.search("//table[@class='tbl']//tr").collect do |e|
  pos = e.search("//td[@class='td21']")[2]
  if pos && pos.children[0].to_s.toutf8 == '准教授'
    name = e.search("//td/a[@href]")[0]
    if name
      name.children[0].to_s.toutf8
    end
  end
end.compact

# 女性っぽい名前だけ
p assocprofs.select {|a| a =~ /(||)/}

一応動きました\(^o^)/*1

$ ruby associate_professor.rb
["○○ ○○香", "○○ 香○子", "○○ ○子"]

あとは,女性っぽい名前をもっときちんと判定するだけですね!

*1:自重して出力を伏せました