HTML-Tree是一组Perl模块,用于从HTML源码中解析生成树.
HTML-Tree主要由两个模块组成,HTML-TreeBuilder与HTML-Element.
HTML-TreeBuilder模块用于生成解析树(通过应用HTML-Parser将HTML分解为若干标记).
HTML-TreeBuilder为用户建立的解析树由若干对象构成(通过应用HTML-Element类生成).
如果不能很好的理解HTML-TreeBuilder与HTML-Element的文档,可能是因为读者对树型数据结构不熟悉,或者是不了解通用的面向对象模块,这些问题可以通过Sean Burke撰写的Perl笔记解决,发行版中包含这些内容:
1. HTML-Tree-AboutObjects 从用户的角度看面向对象模块
2. HTML-Tree-AboutTrees 关于树的说明
3. HTML-Tree-Scanning 扫描HTML
如果读者已经具备"面向对象模块"与"树型数据结构"方面的基础知识,则仅需要查阅最后一个文档;否则应按照1、2、3的顺序进行学习。