23 августа (обновлено 06 мая)

Универсальный парсер для Joomla

Сегодня последний день не только этого года, но и месяца. поэтому, дабы не портить статистику я все-таки собрался написать здесь небольшую статью.
Думаю, что теоретические и практические записи лучше чередовать или, по крайней мере, не увлекаться теорией, так как это не всем интересно, как показывает практика.

Контент сайта - его основная составляющая, и не всегда возможно его своевременно обновлять (сей блог тому пример), однако нельзя разочаровывать своих читателей\посетителей устаревшими данными. Зачастую для этого используются механизмы чтения и вывода лент новостей других сайтов; некоторые проекты даже предоставляют APi для этого.
Однако речь пойдет в первую очередь, о тех проектах которые не имеют никаких инструментов для экспорта.

Специально для этого я написал компонент com_auto или TJ-Parser, позволяющий извлекать любую часть стороннего сайта (используя синтаксис селекторов jQuery), а также исключать из извлеченного блока, с использованием того же синтаксиса.
Все это производится на серверной стороне, а чтобы не напрягать сторонний сервер, осуществляется кеширование извлекаемой страницы и, при желании, и всех изображений.
Также есть небольшие "плюшки" в виде возможности открытия ссылок из извлекаемого блока в модальном окне joomla (стандартный на motools) в iFrame, а также в возможности добавить якорную ссылку на открываемую страницу в фрейме.

Joomla 3.х
Компонент совместим с Joomla 3.x,
Пока присутствует только русская локализация, английская будет добавлена чуть позже.

Скачать старую версию

UPD 23.08.2015:


Рад сообщить, о новой версии TJ-Parser. Этот компонент позволяет очень просто парсить кусочки со сторонних сайтов, используя при этом синтаксис селекторов jQuery.
Была проделана большая работа, а именно:

  • исправлены основные недочеты прошлой версии
  • полностью переработана работа с кешем
  • исправлена работа с конфигурациями компонента

 

Demo Download

Комментарии  

Елена23 января 02:01
Как удалить все гиперссылки из полученной страницы?
Tod23 января 02:01
используя данный инструмент получится удалить гиперссылки, только вместе с их содержимым (текстом\изобра жениями) для этого используйте селектор "a", в качсетве удаляемых объектов
Николай13 апреля 07:04
Доброго дня, а Как он работает?! Как его запускать?!