<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Комментарии к записи: Обновление парсера [06/01/11]</title>
	<atom:link href="http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/feed/" rel="self" type="application/rss+xml" />
	<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/</link>
	<description>Все самое интересное о .Ru-Net бизе.</description>
	<lastBuildDate>Sun, 16 Oct 2011 07:31:29 +0400</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>Автор: pav609</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-2/#comment-2033</link>
		<dc:creator>pav609</dc:creator>
		<pubDate>Sun, 16 Oct 2011 07:31:29 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-2033</guid>
		<description>Напишите нормальную инструкцию, а то нифига не понятно как парсер юзать. Парсит ни то что нужно.</description>
		<content:encoded><![CDATA[<p>Напишите нормальную инструкцию, а то нифига не понятно как парсер юзать. Парсит ни то что нужно.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Slo</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-2/#comment-1788</link>
		<dc:creator>Slo</dc:creator>
		<pubDate>Fri, 17 Jun 2011 17:22:29 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1788</guid>
		<description>ладно, я хотел обойти неактивный таймаут следующим образом - разбавил to-parse список урлов урлами локалхоста примерно 50 к 1 поисковому запросу, но юнипар сортирует список и ничего не получилось)</description>
		<content:encoded><![CDATA[<p>ладно, я хотел обойти неактивный таймаут следующим образом &#8211; разбавил to-parse список урлов урлами локалхоста примерно 50 к 1 поисковому запросу, но юнипар сортирует список и ничего не получилось)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Slo</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-2/#comment-1787</link>
		<dc:creator>Slo</dc:creator>
		<pubDate>Fri, 17 Jun 2011 16:32:15 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1787</guid>
		<description>а ещё почему то не активно поле с таймаутом. нигма меня забанила за ддос, а я в один поток всего)
а ещё вот =) планируются пресеты? а то не совсем удобно, я под каждый проект делаю отдельную папку с парсером, что бы настройки сохранялись и я мог вернуться к работе позже)</description>
		<content:encoded><![CDATA[<p>а ещё почему то не активно поле с таймаутом. нигма меня забанила за ддос, а я в один поток всего)<br />
а ещё вот =) планируются пресеты? а то не совсем удобно, я под каждый проект делаю отдельную папку с парсером, что бы настройки сохранялись и я мог вернуться к работе позже)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Anatoly B.</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-1/#comment-1764</link>
		<dc:creator>Anatoly B.</dc:creator>
		<pubDate>Thu, 09 Jun 2011 10:54:20 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1764</guid>
		<description>вместо Адрес можно крякозябры подставлять, с ними, работает, с кодировками, траблы.

[blockname]Companyaddress[/blockname][start]РђРґСЂРµСЃ[/start][stop][/stop][-cleantext]</description>
		<content:encoded><![CDATA[<p>вместо Адрес можно крякозябры подставлять, с ними, работает, с кодировками, траблы.</p>
<p>[blockname]Companyaddress[/blockname][start]РђРґСЂРµСЃ[/start][stop][/stop][-cleantext]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Anatoly B.</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-1/#comment-1763</link>
		<dc:creator>Anatoly B.</dc:creator>
		<pubDate>Thu, 09 Jun 2011 09:54:23 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1763</guid>
		<description>Благодарю вас за качественный бесплатный продукт. Он не уступает платным аналогам. Мне он нравится все больше и больше, и я очень рад что есть такие люди как вы.

У меня есть такой шаблон парсинга:
[blockname]Companyname[/blockname][start][/start][stop][/stop][-cleantext]
[blockname]Companyaddress[/blockname][start]Адрес[/start][stop][/stop][-cleantext]
[blockname]Companyemail[/blockname][start]e-mail[/start][stop][/stop][-cleantext]
[blockname]Companyphone[/blockname][start]Телефон[/start][stop][/stop][-cleantext][-all]

Сохраняется:
companyname; companyaddress; companyemail; companyphone
РђРџРўРў-РўР Р•Р™Р”; Error;  wwwww@gmail.com ; Zero

Сайт с кодировкой UTF-8. По видимому русский текст из шаблона не обрабатывается, так, как английский аналог проходит без проблем. Так, тоже не помогает:
[blockname]Companyaddress[/blockname][start]#128#164#224#165#225[/start][stop][/stop][-cleantext]</description>
		<content:encoded><![CDATA[<p>Благодарю вас за качественный бесплатный продукт. Он не уступает платным аналогам. Мне он нравится все больше и больше, и я очень рад что есть такие люди как вы.</p>
<p>У меня есть такой шаблон парсинга:<br />
[blockname]Companyname[/blockname][start][/start][stop][/stop][-cleantext]<br />
[blockname]Companyaddress[/blockname][start]Адрес[/start][stop][/stop][-cleantext]<br />
[blockname]Companyemail[/blockname][start]e-mail[/start][stop][/stop][-cleantext]<br />
[blockname]Companyphone[/blockname][start]Телефон[/start][stop][/stop][-cleantext][-all]</p>
<p>Сохраняется:<br />
companyname; companyaddress; companyemail; companyphone<br />
РђРџРўРў-РўР Р•Р™Р”; Error;  <a href="mailto:wwwww@gmail.com">wwwww@gmail.com</a> ; Zero</p>
<p>Сайт с кодировкой UTF-8. По видимому русский текст из шаблона не обрабатывается, так, как английский аналог проходит без проблем. Так, тоже не помогает:<br />
[blockname]Companyaddress[/blockname][start]#128#164#224#165#225[/start][stop][/stop][-cleantext]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Slo</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-1/#comment-1740</link>
		<dc:creator>Slo</dc:creator>
		<pubDate>Thu, 02 Jun 2011 07:46:49 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1740</guid>
		<description>2 Dima - вы подойдите к парсеру с другой стороны - 

выбирайте раздел, например _http://mirsovetov.ru/a/housing/cookery/index.html
видите разбивку на страницы - они пронумерованы (_http://mirsovetov.ru/a/housing/cookery/index-2.html)
идёте в конструктор урлов и конструируете (в данном случае проще будет ручками набить, страниц всего восемь)
с этиз страниц парсите линки на статьи, запихиваете их в to-parse.txt, настраиваете селективный парсинг под ваши нужды и вуаля)

юнипарс не универсален,  а заточен под определённую работу, если хотите скачать сайт целиком - юзайте телепорт=)</description>
		<content:encoded><![CDATA[<p>2 Dima &#8211; вы подойдите к парсеру с другой стороны &#8211; </p>
<p>выбирайте раздел, например _http://mirsovetov.ru/a/housing/cookery/index.html<br />
видите разбивку на страницы &#8211; они пронумерованы (_http://mirsovetov.ru/a/housing/cookery/index-2.html)<br />
идёте в конструктор урлов и конструируете (в данном случае проще будет ручками набить, страниц всего восемь)<br />
с этиз страниц парсите линки на статьи, запихиваете их в to-parse.txt, настраиваете селективный парсинг под ваши нужды и вуаля)</p>
<p>юнипарс не универсален,  а заточен под определённую работу, если хотите скачать сайт целиком &#8211; юзайте телепорт=)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: SciFi</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-1/#comment-1677</link>
		<dc:creator>SciFi</dc:creator>
		<pubDate>Wed, 11 May 2011 15:20:56 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1677</guid>
		<description>привет, &lt;strong&gt;Slo&lt;/strong&gt;, список сортируется, дубли урлов убиваются.</description>
		<content:encoded><![CDATA[<p>привет, <strong>Slo</strong>, список сортируется, дубли урлов убиваются.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Slo</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-1/#comment-1674</link>
		<dc:creator>Slo</dc:creator>
		<pubDate>Wed, 11 May 2011 01:14:40 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1674</guid>
		<description>Привет SciFi, всех с праздниками)

заметил такую штуку - при парсинге по списку урлов - урлы выстраиваются по порядку, а не берутся из файла так как есть. Я специально перемешивал  урлы в файле, но такая манипуляция на юнипарс не действует))</description>
		<content:encoded><![CDATA[<p>Привет SciFi, всех с праздниками)</p>
<p>заметил такую штуку &#8211; при парсинге по списку урлов &#8211; урлы выстраиваются по порядку, а не берутся из файла так как есть. Я специально перемешивал  урлы в файле, но такая манипуляция на юнипарс не действует))</p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: Dima</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-1/#comment-1571</link>
		<dc:creator>Dima</dc:creator>
		<pubDate>Sat, 16 Apr 2011 09:28:22 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1571</guid>
		<description>а как спарсить сайт

http://mirsovetov.ru/
почему-то парсит только 3 страницы и отсанавливается

http://mirsovetov.ru/javascript:show_login(&#039;hide&#039;);
http://mirsovetov.ru/javascript:show_login(&#039;show&#039;);
http://mirsovetov.ru/otveti/registration.php</description>
		<content:encoded><![CDATA[<p>а как спарсить сайт</p>
<p><a href="http://mirsovetov.ru/" rel="nofollow">http://mirsovetov.ru/</a><br />
почему-то парсит только 3 страницы и отсанавливается</p>
<p><a href="http://mirsovetov.ru/javascript:show_login(" rel="nofollow">http://mirsovetov.ru/javascript:show_login(</a>&#8216;hide&#8217;);<br />
<a href="http://mirsovetov.ru/javascript:show_login(" rel="nofollow">http://mirsovetov.ru/javascript:show_login(</a>&#8217;show&#8217;);<br />
<a href="http://mirsovetov.ru/otveti/registration.php" rel="nofollow">http://mirsovetov.ru/otveti/registration.php</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>Автор: SciFi</title>
		<link>http://ru-net-biz.ru/index.php/2011/01/07/obnovlenie-parsera-060111/comment-page-1/#comment-1550</link>
		<dc:creator>SciFi</dc:creator>
		<pubDate>Mon, 11 Apr 2011 15:47:40 +0000</pubDate>
		<guid isPermaLink="false">http://ru-net-biz.ru/?p=346#comment-1550</guid>
		<description>&lt;strong&gt;ani&lt;/strong&gt;, писал про картинки же... Ok, чуть позже подробнее напишу.</description>
		<content:encoded><![CDATA[<p><strong>ani</strong>, писал про картинки же&#8230; Ok, чуть позже подробнее напишу.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->
