如何使用简单 HTML DOM 解析器删除注释掉的部分
你好!
我叫 Hase,来自网络系统部。
这次,我们将使用“Simple HTML DOM Parser”,它可以用PHP解析HTML,来
解析HTML的注释部分( )将予以介绍。
是因为我正在
为某个项目使用 Simple HTML DOM Parser 来当时我正在研究如何使用它,但
我找不到任何评论,因为人不多。使用它(也许是因为他们不经常使用它?),
我想我应该把它留在这里作为备忘录。
简单 HTML DOM 解析器简介
下载库
手动的
目标 HTML 文件
评论_out.html
<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>超越有限公司</title></head><body><!-- 会社名 --><h1>超越有限公司</h1><!-- ビヨンドの企業理念 --><h2>“共同创造,持续支持”</h2><h3> Beyond 我们的工作是支持通过 IT 创造新价值的人们。</h3><p>虽然这不是一项光鲜亮丽的工作,但我们相信它对于让用户的生活更加舒适和愉快是不可或缺的。 我们的使命是,不仅提供系统服务,还提供扩大创作者商机的“圈子”和“信息”,建立能够共同成长的长期关系。 </p><!-- 上記の「会社名」「ビヨンドの企業理念」のように一行のコメントはもちろん このように複数行に渡って 記述されているコメントも 削除することが可能です --></body></html>
创建可执行 PHP
加载库
require_once 'simple_html_dom.php';
加载目标 HTML
$html = file_get_html('comment_out.html');
提取并删除评论部分
foreach ($html->find("comment") as $comment) { $comment->outertext = ""; }
$html->find("comment")
将注释部分提取为数组
$comment->outertext = "";
将元素清空(删除)
节省
$body = $html->save(); $html->clear();
写入文件
file_put_contents("comment_out_delete.html", $body);
完成的 PHP 文件
<?php // ライブラリを読み込む require_once 'simple_html_dom.php'; // 対象HTMLを読み込む $html = file_get_html('comment_out.html'); // コメント部分を抽出して除去 foreach ($html-> find("comment") as $comment) { $comment->outertext = ""; } // 保存 $body = $html->save(); // 写入文件 file_put_contents ( “comment_out_delete.html”,$body);
PHP执行后的HTML文件
comment_out_delete.html
<!DOCTYPE html><html lang="ja"><head><meta charset="utf-8"><title>超越有限公司</title></head><body><h1>超越有限公司</h1><h2>“共同创造,持续支持”</h2><h3> Beyond 我们的工作是支持通过 IT 创造新价值的人们。</h3><p>虽然这不是一项光鲜亮丽的工作,但我们相信它对于让用户的生活更加舒适和愉快是不可或缺的。 我们的使命是,不仅提供系统服务,还提供扩大创作者商机的“圈子”和“信息”,建立能够共同成长的长期关系。</p></body></html>
该评论已成功删除。
最后
我开设了我所属的系统开发服务网站“SEKARAKU Lab”。
Beyond是从服务器设计搭建到运营的一站式服务,所以如果您在服务器端开发方面遇到任何问题,请随时联系我们。
SEKARAKU 实验室: [https://sekarakulab.beyondjapan.com/](https://sekarakulab.beyondjapan.com/)
就这样。
如果您觉得这篇文章有帮助,请点赞!