如何使用简单 HTML DOM 解析器删除注释掉的部分

您好!
我是网络系统部门的 Hase。
这次,我们将使用“Simple HTML DOM Parser”,它可以在 PHP 中解析 HTML 来提取
HTML 注释部分(以下是移除方法。
原因是,我当时正在使用 Simple HTML DOM Parser 来
优化某个项目的 HTML,
在研究如何使用它的时候,我
发现很少有人在评论中提到它(也许是因为我不怎么用它?),所以我
想把它留在这里作为备忘录。
介绍简易 HTML DOM 解析器
下载库
手动的
目标 HTML 文件
comment_out.html
<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>Beyond Co., Ltd.</title></head><body><!-- 会社名 --><h1> Beyond Co., Ltd.</h1><!-- ビヨンドの企業理念 --><h2> “继续携手共创,互相扶持”</h2><h3> Beyond 的工作是支持那些通过 IT 创造新价值的人们。</h3><p>这份工作或许并不光鲜亮丽,但我们相信它对用户来说至关重要,因为它能让他们拥有更舒适、更愉悦的生活。我们的使命是建立长期的合作关系,通过提供系统服务以及“人脉”和“信息”,为创作者拓展业务机会,从而实现互利共赢。 </p><!-- 上記の「会社名」「ビヨンドの企業理念」のように一行のコメントはもちろん このように複数行に渡って 記述されているコメントも 削除することが可能です --></body></html>
创建可执行 PHP
加载库
require_once 'simple_html_dom.php';
加载目标 HTML
$html = file_get_html('comment_out.html');
提取并删除注释部分
foreach ($html->find("comment") as $comment) { $comment->outertext = ""; }
$html->find("comment")将注释部分提取为数组
$comment->outertext = "";清空元素(将其删除)
节省
$body = $html->save(); $html->clear();
写入文件
file_put_contents("comment_out_delete.html", $body);
已完成的 PHP 文件
<?php // ライブラリを読み込む require_once 'simple_html_dom.php'; // 対象HTMLを読み込む $html = file_get_html('comment_out.html'); // コメント部分を抽出して除去 foreach ($html-> find("comment") as $comment) { $comment->outertext = ""; } // 保存 $html = $html->save(); $html->clear(); // 写入文件 file_put_contents("comment_out_delete.html", $body); ?>
PHP 执行后的 HTML 文件
comment_out_delete.html
<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>Beyond Co., Ltd.</title></head><body><h1> Beyond Co., Ltd.</h1><h2> “继续携手共创,互相扶持”</h2><h3> Beyond 的工作是支持那些通过 IT 创造新价值的人们。</h3><p>这份工作或许并不光鲜亮丽,但我们相信它对用户来说至关重要,因为它能让他们拥有更舒适、更愉悦的生活。我们的使命是建立长期的合作关系,通过提供系统服务以及“人脉”和“信息”,为创作者拓展业务机会,从而实现互利共赢。</p></body></html>
该评论已被成功删除。
最后
我开设了我所属的系统开发服务网站“SEKARAKU Lab”。
Beyond是从服务器设计搭建到运营的一站式服务,所以如果您在服务器端开发方面遇到任何问题,请随时联系我们。
SEKARAKU 实验室: [https://sekarakulab.beyondjapan.com/](https://sekarakulab.beyondjapan.com/)
就这样。
如果您觉得这篇文章有帮助,请点赞!
0