如何使用 Simple HTML DOM Parser 删除注释掉的部分

2017.12.26

Web系统开发

1 介绍简易 HTML DOM 解析器
2 目标 HTML 文件
3 创建可执行 PHP
4 已完成的 PHP 文件
5 PHP 执行后的 HTML 文件
6 最后

您好！
我是网络系统部门的 Hase。

这次，我们将使用“Simple HTML DOM Parser”，它可以在 PHP 中解析 HTML 来提取
HTML 注释部分（以下是移除方法。

原因是，我当时正在使用 Simple HTML DOM Parser 来
优化某个项目的 HTML，
在研究如何使用它的时候，我
发现很少有人在评论中提到它（也许是因为我不怎么用它？），所以我
想把它留在这里作为备忘录。

介绍简易 HTML DOM 解析器

下载库

简易 HTML DOM 解析器

手动的

PHP 简易 HTML DOM 解析器手册

目标 HTML 文件

comment_out.html

<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>Beyond Co., Ltd.</title></head><body><!-- 会社名 --><h1> Beyond Co., Ltd.</h1><!-- ビヨンドの企業理念 --><h2> “继续携手共创，互相扶持”</h2><h3> Beyond 的工作是支持那些通过 IT 创造新价值的人们。</h3><p>这份工作或许并不光鲜亮丽，但我们相信它对用户来说至关重要，因为它能让他们拥有更舒适、更愉悦的生活。我们的使命是建立长期的合作关系，通过提供系统服务以及“人脉”和“信息”，为创作者拓展业务机会，从而实现互利共赢。 </p><!-- 上記の「会社名」「ビヨンドの企業理念」のように一行のコメントはもちろん このように複数行に渡って 記述されているコメントも 削除することが可能です --></body></html>

创建可执行 PHP

加载库

require_once 'simple_html_dom.php';

加载目标 HTML

$html = file_get_html('comment_out.html');

提取并删除注释部分

foreach ($html->find("comment") as $comment) { $comment->outertext = ""; }

$html->find("comment")将注释部分提取为数组
$comment->outertext = "";清空元素（将其删除）

节省

$body = $html->save(); $html->clear();

写入文件

file_put_contents("comment_out_delete.html", $body);

已完成的 PHP 文件

<?php // ライブラリを読み込む require_once 'simple_html_dom.php'; // 対象HTMLを読み込む $html = file_get_html('comment_out.html'); // コメント部分を抽出して除去 foreach ($html-> find("comment") as $comment) { $comment->outertext = ""; } // 保存 $html = $html->save(); $html->clear(); // 写入文件 file_put_contents("comment_out_delete.html", $body); ?>

PHP 执行后的 HTML 文件

comment_out_delete.html

<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>Beyond Co., Ltd.</title></head><body><h1> Beyond Co., Ltd.</h1><h2> “继续携手共创，互相扶持”</h2><h3> Beyond 的工作是支持那些通过 IT 创造新价值的人们。</h3><p>这份工作或许并不光鲜亮丽，但我们相信它对用户来说至关重要，因为它能让他们拥有更舒适、更愉悦的生活。我们的使命是建立长期的合作关系，通过提供系统服务以及“人脉”和“信息”，为创作者拓展业务机会，从而实现互利共赢。</p></body></html>

该评论已被成功删除。

最后

我是系统开发服务网站“SEKARAKU Lab”的成员。Beyond
提供从服务器设计、搭建到运维的一站式服务，如果您在服务器端开发方面遇到任何问题，欢迎随时联系我们。SEKARAKU
Lab： [https://sekarakulab.beyondjapan.com/](https://sekarakulab.beyondjapan.com/)

就这样。

如果您觉得这篇文章有用，请点击【点赞】！

加载中...