четверг, 14 июня 2012 г.

PHP - парсинг bash.org.ru

Люблю писать парсеры, которые пройдутся по сайту и соберут весь контент и разложат его по полочкам. В этот раз под руку попал bash.org.ru - цитатник рунета.

Я решил пройтись по топу и собрать цитаты в базу данных sqlite3.

Вот, что получилось:
Чтобы собрать 5000 лучших цитат, понадобилось всего 20 минут при моем медленном интернете (512 кбит).

Конечно, я не забавы ради парсю сайты, все было сделано в рамках очередного приложения для android.