行の取得は、4 節で述べた getline を使う方法を使い、 行から必要な部分文字列を取得するには、5 節で述べた sub(), gsub() を使う方法で行うことにします。
まず、3 節の 1. の <title>
</title>
の取得は以下のようにします。
##### タイトルの取得 #####
($0 ~ /<title>/){
titlestr=$0
while(titlestr !~ /<\/title>/){
if(getline<=0){ errorexit=1; exit }
titlestr = titlestr $0
}
sub(/.*<title>[ \t]*/,"",titlestr)
sub(/[ \t]*<\/title>.*/,"",titlestr)
next
}