可以通过SimpleXML的HTML被用于步枪?

我想抓住从表中的数据,而无需使用正则表达式。 我已经使用SimpleXML解析RSS提要享用想知道,如果它可以被用来从另一个页面抓取的表。

例如。 抓住与卷曲的页面或​​简单的file_get_contents(); 然后使用SimpleXML来抓取内容是什么?

--------------解决方案-------------

您可以使用loadHTML从DOM模块的功能,然后导入到DOM通过的SimpleXML simplexml_import_dom

$html = file_get_contents('http://example.com/');
$doc = new DOMDocument();
$doc->loadHTML($html);
$sxml = simplexml_import_dom($doc);

如果这是XHTML - 是的,这是绝对有可能。 真正的XHTML是在刚刚结束的XML,所以它可以用XML解析器解析。

SimpleXML的,但只接受严格的XML。 如果你不能得到有效的XHTML,它看起来像把它通过较为宽松的DOMDocument库将首先(在这里源)做的伎俩:

<?php
$html = file_get_contents('http://...');
$doc = new DOMDocument();
$doc->strictErrorChecking = FALSE;
$doc->loadHTML($html);
$xml = simplexml_import_dom($doc);
?>

这可能取决于一个页面上。 如果页面是XHTML(大多数网页时下),那么任何XML解析器应该做的,否则找SGML解析器。 这里有一个类似的问题,你可能有兴趣容错HTML / XML / SGML解析PHP中

分类:php 时间:2012-01-01 人气:0
分享到:

相关文章

  • 不能访问使用SimpleXML或XMLDOM谷歌分析响应XML的XML项 2012-06-10

    我使用卷曲访问谷歌分析数据. 它的响应文本中包含类似下面的一些事情. <entry gd:etag='W/"A0EEQX47eSp7I2A9WhZSFU8."' gd:kind='analytics#datarow'> <id>http://www.google.com/analytics/feeds/data?ids=ga:176&ga:pagePath=/indian-language-unicode-converter/punjabi-unicod

  • PHP:分析表结构用SimpleXML 2014-08-09

    我想读,由于某种原因一直在模仿,像这样的表结构的XML文件: <tr id="1"> <td name="Date">10/01/2009</td> <td name="PromoName">Sample Promo Name</td> <td name="PromoCode">Sample Promo Code</td> <td nam

  • SimpleXML的分析和检测子节点与PHP多维数组 2013-07-13

    即时解析我的XML功能的饲料 $pointer = simplexml_load_string($xml); 且输出是一样的东西 SimpleXMLElement Object ( [FileDetails] => SimpleXMLElement Object ( [orderName] => incalabria [fileFormat] => Xml2u Default [sourceURL] => http://www.incalabria.com/property.php

  • 解析用SimpleXML XML 2012-02-07

    你好我试着用SimpleXML解析XML. 问题是我无法访问atributtes,任何想法,为什么? PHP代码: $xml = simplexml_load_file($source); foreach($xml->children() as $node) { foreach ($node->AttrList->attributes() as $attribute) { print_r ($attribute); } } XML的海贼王: <ProductCatalog>

  • 使用SimpleXML通过muliple项环 2012-02-28

    你好我试着去分析在PHP中使用SimpleXML XML提要. XML提要的布局如下: <Member> <MemberType>Full</MemberType> <JoinDate>2010-06-12</JoinDate> <DataType>A</DataType> <Data> <FirstName>Ted</FirstName> <LasttName>Smith&

  • 基于属性的SimpleXML获得子节点 2012-05-01

    这个问题已经在这里有一个答案: SimpleXML的:选择具有一定的属性值2回答元素 XPath中实现条件[复制] 2回答 我试图分析出我由它的属性之一引用节点的值. 但我不知道语法 XML: <data> <poster name="E-Verify" id="everify"> <full_image url="e-verify-swa-poster.jpg"/> <full_other url=&q

  • 提取某些XML元素使用PHP的SimpleXML 2012-08-31

    我有一些问题解析这块XML的使用SimpleXML. 有永远只有一个系列的元素,和可变数目的下方情节元素. 欲分析XML所以我可以存储系列数据在一个表中,而在另一个表中的所有数据集. XML: <Data> <Series> <id>80348</id> <Genre>|Action and Adventure|Comedy|Drama|</Genre> <IMDB_ID>tt0934814</IMDB_ID>

  • PHP - SimpleXML的不返回对象 2012-09-23

    我敢在这里停留在越来越SimpleXML的,当我分析它一个字符串,它是一个对象数组的一部分,返回一个对象. $a = '<?xml version="1.0" encoding="ISO-8859-1"?><BroadsoftDocument protocol="OCI" xmlns="C" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance&q

  • 的SimpleXML和PHP(XPATH) 2012-10-04

    玉家伙我使用XML来存储一个动态的网站页面信息. 我需要找出一种方法来取一个变量(文件名),并拉动了相关节点和分析这些信息. 所以基本上这里是我的XML结构... <SITE> <PAGE> <FILENAME>sub.php</FILENAME> <DESCRIPTION>this is an example sub page</DESCRIPTION> <TITLE>NOH Sub page</TITLE>

  • 这是最好的选择,SimpleXML的或者XML解析器在PHP? 2013-01-12

    我已经通过堆栈溢出后走了"最佳的XML解析器的PHP". 对于同样的问题. 需要提及的是,如果我需要处理XML文件,然后去DOM XML. 我的要求是: 我有救了导航数据库. 它是一个HTML字符串. 我想删除一些网页或说li是用户不希望在他/她的网页存在标签包装的页面. 除去不需要的后li的,我要救整个字符串回数据库. 相同的导航将用于另一页上. 但是,在HTML将是不同的. 这将是类似的,与ul和li ,但我需要一些div和跨度添加到它. 导航将被编辑这个页面上的每一个变化(如更改

Copyright (C) 55228885.com, All Rights Reserved.

55228885 版权所有 京ICP备15002868号

processed in 0.330 (s). 10 q(s)