Perl getElementById

XML::LibXMLのgetElementById()を使ってId指定でDOMノードを取得する際、HTMLにDTD定義がないとgetElementById()ではノードを取得できない(undefが返る)。これは、DTDがないとどれがID属性なのかわからないため。

DTD定義の無いHTML文書からid指定でDOMノードを取得する代替手段としてはXPath指定で取り出す方法がある。XPath式"//*[@id='xxxx']"を指定してfindnodes()をしてやればよい。ただし、getElementById()に比べて速度は遅くなるはず。

XPathによるid指定取得

#!/usr/bin/perl
use strict;
use warnings;
use XML::LibXML;

my $parser = XML::LibXML->new();
my $doc = $parser->parse_html_fh(\*DATA);
my $node = $doc->getElementById("test");
print "ById:", $node->textContent, "\n" if $node;

($node) = $doc->findnodes('//*[@id="test"]');
print "XPath:", $node->textContent, "\n" if $node;

__DATA__
<html>
  <body>
    <div id="test">block1</div>
    <div>block2</div>
  </body>
</html>

実行結果

$ perl getelement.pl
XPath:block1

参照

http://search.cpan.org/dist/XML-LibXML/lib/XML/LibXML/Document.pod

のgetElementById: Note部分にDTD有無時の動作について説明がある。

最終更新 2007/05/15 12:06:03 - kztomita
(2007/05/15 12:06:03 作成)

このページのコメント一覧 | 最近のコメントを表示 | コメントを書く

メニュー

編集
ページ作成
添付
履歴
ページ一覧
管理

リンク

その他のWiki
Linuxメモ
 Xnuメモ

会社
(有)ビットハイブ
 受託開発やってます。

よくやる仕事

・Webシステム開発(LAMP環境)
・Linuxサーバー設定関連
・サーバー移転作業代行

開発事例にデジタルカタログ／マンガビューワーを追加しました。

draggable.jsのスマホ対応版デモページを追加しました。説明はこちら。

検索

最近更新したページ

2024/4/21

・動画同時再生Macアプリ

2020/7/1

・ssh RSA公開鍵認証

2019/4/19

・CentOS7のデスクトップ上のアイコンサイズ

2019/3/26

・systemd & systemctl

2019/2/8

・Vue.js propsとdataの違い

2019/2/3

・Perl 祝日名の取得

2018/12/11

・Magento2 エクステンションの作成その7

・Magento2 エクステンションの作成その6

・Magento2 エクステンションの作成その5

Adsense

最近のコメント

・吹き出し合成Webアプリ - ひろち
・吹き出し合成Webアプリ - kztomita
・吹き出し合成Webアプリ - Tabby
・動画同時再生Macアプリ - kztomita
・動画同時再生Macアプリ - skon
・動画同時再生Macアプリ - from茨城
・動画同時再生Macアプリ - 名無し
・Perl 祝日名の取得 - Yamamoto
・Perl 祝日名の取得 - 田所
・Perl 祝日名の取得 - kztomita