如何使用 Simple HTML DOM Parser 删除注释掉的部分

您好!
我是网络系统部门的 Hase。
这次,我们将使用“Simple HTML DOM Parser”(它可以使用 PHP 解析 HTML),来分析
HTML 注释部分(<!-- -->以下是移除方法。
原因是,我当时正在使用 Simple HTML DOM Parser 来
优化某个项目的 HTML,
在研究如何使用它的时候,我注意到很少
有人提到注释(也许是因为注释不常用?),所以我
决定在这里记录下来,作为自己的备忘录。
介绍简易 HTML DOM 解析器
下载库
手动的
目标 HTML 文件
comment_out.html
<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>Beyond Co., Ltd.</title></head><body><!-- 会社名 --><h1> Beyond Co., Ltd.</h1><!-- ビヨンドの企業理念 --><h2> “继续携手共创,互相扶持”</h2><h3> Beyond 的工作是支持那些通过 IT 创造新价值的人们。</h3><p>这份工作或许并不光鲜亮丽,但我们相信它对用户来说至关重要,因为它能让他们拥有更舒适、更愉悦的生活。我们的使命是建立长期的合作关系,通过提供系统服务以及“人脉”和“信息”,为创作者拓展业务机会,从而实现互利共赢。 </p><!-- 上記の「会社名」「ビヨンドの企業理念」のように一行のコメントはもちろん このように複数行に渡って 記述されているコメントも 削除することが可能です --></body></html>
创建可执行 PHP
加载库
require_once 'simple_html_dom.php';
加载目标 HTML
$html = file_get_html('comment_out.html');
提取并删除注释部分
foreach ($html->find("comment") as $comment) { $comment->outertext = ""; }
$html->find("comment") 将评论部分提取为数组
字符串 ("";) 来删除该元素
节省
$body = $html->save(); $html->clear();
写入文件
file_put_contents("comment_out_delete.html", $body);
已完成的 PHP 文件
<?php // ライブラリを読み込む require_once 'simple_html_dom.php'; // 対象HTMLを読み込む $html = file_get_html('comment_out.html'); // コメント部分を抽出して除去 foreach ($html-> find("comment") as $comment) { $comment->outertext = ""; } // 保存 $html = $html->save(); $html->clear(); // 写入文件 file_put_contents("comment_out_delete.html", $body); ?>
PHP 执行后的 HTML 文件
comment_out_delete.html
<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>Beyond Co., Ltd.</title></head><body><h1> Beyond Co., Ltd.</h1><h2> “继续携手共创,互相扶持”</h2><h3> Beyond 的工作是支持那些通过 IT 创造新价值的人们。</h3><p>这份工作或许并不光鲜亮丽,但我们相信它对用户来说至关重要,因为它能让他们拥有更舒适、更愉悦的生活。我们的使命是建立长期的合作关系,通过提供系统服务以及“人脉”和“信息”,为创作者拓展业务机会,从而实现互利共赢。</p></body></html>
该评论已被成功删除。
最后
我已推出“SEKARAKU Lab”,这是我所属系统开发公司的服务网站。Beyond
提供从服务器设计、构建到运维的一站式服务,如果您在服务器端开发方面遇到任何问题,欢迎随时联系我们。SEKARAKU
Lab:[https://sekarakulab.beyondjapan.com/](https://sekarakulab.beyondjapan.com/)
就这样。
如果您觉得这篇文章对您有帮助,请点个“赞”!
0
