WebページからURLを抽出する

open-uriは内部でuriをrequireしているので、
open-uriをrequireすると、一緒にuriもrequireされる。

require "open-uri"
require "kconv"

url = ARGV[0] || "http://d.hatena.ne.jp/gan2/"
html = open(url).read.tosjis

URI.extract(html, ['http']){|uri|
  puts uri
}

ちなみにURI.extractの第二引数に何も指定しないと、
出力結果に、rdf:だのxmlns:だのcolor:だのmargin:だの
色々なものが含まれる。