این کد رو تست کنید:
<?php
/**
* Get a web file (HTML, XHTML, XML, image, etc.) from a URL. Return an
* array containing the HTTP server response header fields and content.
*/
function get_web_page( $url )
{
$options = array(
CURLOPT_RETURNTRANSFER => true, // return web page
CURLOPT_HEADER => false, // don't return headers
CURLOPT_FOLLOWLOCATION => true, // follow redirects
CURLOPT_ENCODING => '', // handle all encodings
CURLOPT_USERAGENT => 'spider', // who am i
CURLOPT_AUTOREFERER => true, // set referer on redirect
CURLOPT_CONNECTTIMEOUT => 120, // timeout on connect
CURLOPT_TIMEOUT => 120, // timeout on response
CURLOPT_MAXREDIRS => 10, // stop after 10 redirects
);
$ch = curl_init( $url );
curl_setopt_array( $ch, $options );
$content = curl_exec( $ch );
$err = curl_errno( $ch );
$errmsg = curl_error( $ch );
$header = curl_getinfo( $ch );
curl_close( $ch );
$header['errno'] = $err;
$header['errmsg'] = $errmsg;
$header['content'] = $content;
return $header;
}
$data = get_web_page('http://www.beytoote.com/marketprices/phone-price/');
$data = preg_replace('#<a.*?>(.*?)</a>#i', '$1', $data['content']);
echo '<pre>' . htmlentities($data, ENT_QUOTES, 'utf-8') . '</pre>';
?>
با این کد من همه لینکها رو حذف و به متن معمولی تبدیل کردم. حالا هرجور لازم دارین تغییرش بدین یا اینکه خروجیشو بدین به simple_html_dom تا جدولهای دلخواه رو ازش استخراج کنه براتون.