Код:
<?php set_time_limit(0); $first_f=31457881; //файл из которого начнем парсить $last_f=31457888; //последний файл $arr_new=array(); //объявляем массив для сохранения результатов for ($i=$first_f;$i<$last_f;$i++) { $url="http://zalil.ru/".$i; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; ru; rv:1.9.2.16) Gecko/20110319 MRA 5.7 (build 03796) Firefox/3.6.17'); $headers = array ( 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'Accept-Language: ru-ru,ru;q=0.8,en-us;q=0.5,en;q=0.3', 'Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7', 'Connection: keep-alive' ); curl_setopt($ch, CURLOPT_HTTPHEADER,$headers); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, true); $page=curl_exec($ch);//результат, т.е. хтмл код страницы, получаем в переменную preg_match('#<p align="center">([^&]*)#i', $page, $data); if (!empty($data)) //если значение (что отпарсила регулярка) не-пустое $arr_new[$url]=$data[0]; //то добавляем его в массив sleep(1); //пауза, чтобы не забанили за "ддос" } /* регулярка сохраняет все в массив $data, добавляем оттуда по 1 значению в новый массив. Для контроля и отладки можно его выводить. впрочем, на этом скрипт фактически завершен, но выведем результаты красиво*/ echo "<table border='1'>"; foreach ($arr_new as $k=>$v) { echo "\t<tr>\n"; echo "<td>".$k." ".$v."</td>"; echo "</tr>"; } echo "</table>"; /*тут создаем таблицу на основе массива, чтобы удобно было*/ ?>