Подписки на новую информацию в поисковых машинах без использования RSS-агрегаторов

В первую очередь речь идет о подписке на так называемые Новости Яндекса по поисковому запросу. Это не новости в их обычном понимании – последние события, произошедшие в мире. К новостям Яндекса относятся те новые ресурсы, которые недавно проиндексированы Яндексом. Реальный срок публикации этих документов в Интернете может быть достаточно давним, однако для Яндекса они считаются новинками и поэтому попадают в Новости Яндекса.

От Яндекс.Ленты эта услуга отличается тем, что новости приходят по электронной почте в виде гиперссылки на документ и небольшого фрагмента текста документа, тогда для чтения Ленты пользователь должен переходить на ее сайт.

Блоггеру, который ищет новый контент или новые идеи, появляющиеся в Сети, надо иметь возможность своевременно и точно отслеживать изменения на нужной интернет-страничке. Каждый может себе представить, насколько сложная, а чаще всего и вовсе неосуществимая задача встает в таком случае перед специалистом. Вряд ли даже самый внимательный и скрупулезный человек в состоянии быстро и точно оценить изменения в тексте, занимающем несколько страниц.

Для решения этой проблемы несколькими компаниями разработано специальное программное обеспечение – так называемые сторожевые роботы. Эти программы, посетив страницу в первый раз, сохраняют ее образ в своей базе данных, а при повторном посещении сравнивают ее актуальное состояние с этим образом. Если изменения выявлены, программа отмечает изменившиеся места (они становятся похожи на выделенные маркером на бумажном носителе фрагменты текста).

Более того, те фрагменты, которые из текста удалены, также обозначаются во многих программах этого класса – как правило, внизу страницы, дабы не мешать восприятию пользователем информации. Подобные программы могут запускаться пользователем вручную, а могут и работать автоматически, по расписанию.

Главный недостаток этих программ – то, что они платные. Правда стоимость их в момент написания книги колебалась в пределах 20–40 долларов и повторная оплата не требовалась, поэтому, на наш взгляд, человеку, который сделал блог своим хобби или тем более работой, вполне по силам заплатить такую сумму, чтобы сэкономить время и сделать свой блог более интересным и эффективным.

Давайте рассмотрим эти программы более подробно.

Сторожевой робот WebSite-Watcher. Программа выпущена в Германии, ее официальный сайт http://www.aignes.com. Стоимость продукта составляет около 40 долларов за индивидуальную лицензию. Кроме того, пользователю дается 30-дневная полнофункциональная версия, чтобы он успел удостовериться в нужности этого программного обеспечения. Заплатить за WebSite-Watcher требуется лишь один раз, после чего все обновления становятся доступны бесплатно и на неограниченный срок.

Интерфейс программы поддерживает русский и украинский языки, однако раздел «Помощь» до выхода в свет версии 4.06 был написан на английском. После появления версии 4.06 на сайте программы по адресу http://www.aignes.com/wswtrans.htm стал доступен exe-файл (wswhelp_russian.exe), который присоединяет к WebSite-Watcher справочную информацию на русском языке. Работа с русским языком не вызывает у программы никаких проблем.

Программа довольно часто обновляется (на момент написания книги была доступна версия 4.33) и работает со всеми версиями Windows – начиная с Windows’95 и заканчивая Vista.

WebSite-Watcher работает как клиент на компьютере пользователя. Это значит, что все закладки и конфигурации хранятся локально на жестком диске компьютера и сервер производителя не участвует в процессе поиска.

Вот что может проверять программа (приводится по данным производителя).

> Любые веб-страницы с текстовым содержанием, независимо от расширения файла. То есть статичные страницы (страницы с расширением файла .htm или .html) и динамичные страницы (страницы с расширением файла .asp, .php, и т. д.). WebSite-Watcher также выделит цветом все изменения в тексте.

> RSS/Atom feeds: RSS/Atom преобразовываются в читаемый html-формат и могут обрабатываться как обычные веб-страницы.

> Страницы, защищенные паролем. Для защищенных паролем страниц вы можете записать макрокоманду, после автоматического выполнения которой страница будет проверена на обновление.

> Форумы. Форумы обрабатываются как обычные страницы с небольшой оптимизацией, например, специальной технологией подсветки изменений.

> Страницы с Javascript. Для страниц, содержание которых отображается с Javascript, WebSite-Watcher поддерживает отдельную и более сложную технологию преобразования динамически сге нерированного содержания страницы в статичное содержание.

> Изображения. Если вы отслеживаете изображение, WebSite-Watcher способен обнаружить его обновление. Изменения в изображении не подсвечиваются.

> Двоичные (бинарные) файлы.WebSite-Watcher может обнаруживать обновление двоичных файлов (например, файлы zip или exe) сравнением даты файла, размера файла и/или части его содержания (двоичные файлы не будут полностью загружаться при проверке на обновление).

> Файлы PDF и Flash. Файлы PDF и Flash-анимации обрабатываются как двоичные файлы. WebSite-Watcher не подсвечивает изменения в их содержании.

> FTP-файлы и каталоги.WebSite-Watcher поддерживает отслеживание FTP-файлов и каталогов. FTP-файлы могут проверяться по дате/размеру файла или по содержанию.

> Интранет. Все страницы в сети Интранет могут быть проверены подобно обычным веб-страницам.

> Локально хранящиеся файлы.WebSite-Watcher может отслеживать любой файл на вашем жестком диске.

После того, как WebSite-Watcher установлен и запущен на компьютере, в правом верхнем углу всех наиболее распространенных браузеров (в частности, Internet Explorer, Mozilla Firefox, Opera) появляется значок программы, представляющий собой стилизованный глаз.

Добавление закладки в перечень закладок может производиться двумя способами.

1. Непосредственно из браузера.

Так можно добавить к закладкам ту страницу, которая в настоящий момент загружена в браузере. При нажатии и правой, и левой кнопкой мыши на значок WebSite-Watcher в правом верхнем углу браузера появляется всплывающее меню, первый пункт которого «Добавить в закладки» (рис. 23).

Рис. 23. Добавление страницы в закладки сторожевого робота WebSite Watcher

После того как выбирается этот пункт, появляется окно, в котором URL страницы уже автоматически внесены в соответствующее поле. Пользователю остается только ввести вручную имя страницы. Это имя не имеет никакого значения для компьютера и нужно только для того, чтобы пользователь смог определить, для чего нужна та или иная закладка, поэтому оно может назначаться произвольно. Начиная с версии 4.10 можно обойтись даже без ручного ввода названия страницы, поскольку программа в состоянии автоматически брать это название на самой странице.

ВНИМАНИЕ! После того, как URL страницы и имя закладки внесены в это окно, требуется нажать клавишу «ПРОВЕРИТЬ!», а не кнопку «ОК». В этом случае WebSite-Watcher отправится на страницу и сохранит в своем архиве ее образ, с которым и будет при следующем посещении страницы проводить сравнение. В главном окне программы WebSite-Watcher после этого напротив имени закладки появится надпись «ОК, инициализировано».

Если же пользователь выберет кнопку «ОК» вместо кнопки «Проверить!», то WebSite-Watcher сохранит закладку в меню, однако не будет посещать страницу, а соответственно, и не сохранит в архиве ее копию.

2. Из главного меню программыWebSite-Watcher.

Для этого надо открыть окно добавления новой закладки, щелкнув либо по второй слева кнопке на верхней панели программы (она называется «Мастер» и выглядит как жезл с икрящимся наконечником), либо по третьей слева кнопке в той же панели (она называется «Новая закладка» и выглядит как лист бумаги с размещенным на нем знаком «плюс» (+)).

Нажатие кнопки «Мастер» предпочтительно, когда проверяемая страница защищена паролем, поскольку там предусмотрен макрос, позволяющий вводить этот пароль автоматически. В остальных случаях мы предпочитаем кнопку «Добавить закладку».

Программа WebSite-Watcher позволяет проверять изменения на странице как вручную, так и автоматически.

Очень легко организовать новые папки и подпапки для систематизации закладок. Причем папки можно перемещать в новые места, просто перетаскивая их мышью.

Кроме того, в программе предусмотрены фильтры, которые позволяют исключать из проверки определенные строки (например, постоянно меняющееся время или дату в углу страницы либо афоризм, который оптимизаторы сайтов любят постоянно менять на странице).

Использование фильтров позволяет исключать неинформативные сообщения о наличии изменений на странице.

Архивирования страницы непосредственно в программе WebSite-Watcher не предусмотрено, однако производитель вместе с программой WebSite-Watcher поставляет бесплатную программу Local WebSite Archive, которая как раз и создает архивную копию странички Интернета. При этом Local WebSite Archive может запускаться из того же меню, встроенного в браузер, что и WebSite-Watcher.

Подробное описание этих и других возможностей программы WebSite-Watcher приведено в разделе «Помощь» этой программы, поэтому мы не будем останавливаться на них более детально.

Программа Check & Get. Это отечественный продукт. Преимуществом российского происхождения программы является не только корректная поддержка русского языка, но и возможность ее приобретения за российские рубли, а также доступность создателя программы, если к нему появляются вопросы. Причем техническая поддержка при этом также русскоязычная, в отличие от программ-конкурентов.

Автор этой книги на собственном опыте убедился, что Дмитрий Скорняков (press@activeurls.com) – человек, который создал и поддерживает программу Check & Get, — действительно всегда готов помочь разобраться с проблемой, если таковая возникает. Однажды нам пришлось столкнуться с ситуацией, когда ни одна из приведенных здесь программ не могла отслеживать изменения на сайте одного из российских университетов. Попытавшись понять причины этой проблемы, в бессилии расписались как создатели и администраторы проблемного сайта, так и служба технической поддержки WebSite-Watcher. И только Дмитрий Скорняков внимательно изучил тот проблемный сайт, разобрался в причинах возникшей ситуации и дал рекомендации, которые позволили устранить проблему. На взгляд, это немаловажное обстоятельство, говорящее в пользу программы Check & Get.

Скачать программу можно по адресу www.activeurls.com/ru/down-load.php

Вот что говорит о возможностях программы сам ее создатель.

? При обнаружении на веб-странице новой информации Check&Get автоматически сохраняет «снимок» этой страницы в локальную базу данных и информирует вас указанным вами способом. Check&Get может послать Вам сообщение электронной почты с содержанием измененной веб-страницы, при этом изменения на странице будут «подсвечены» для их легкой идентификации. Также программа может вывести сообщение на экран или проиграть звуковой файл, информируя Вас об изменениях.

Check&Get автоматически извлекает названия и описания вебстраниц при создании закладки, проверяет Вашу коллекцию на наличие «мертвых» ссылок, находит дублирующиеся ссылки в вашей коллекции закладок. Check&Get работает с Internet Explorer, Netscape, Mozilla, Opera, позволяя вам импортировать, экспортировать, и синхронизовать закладки. Благодаря этому вы всегда имеете в выбранном браузере актуальную и организованную коллекцию ссылок.

Список ссылок также может быть импортирован и добавлен к вашим закладкам из буфера обмена Windows, окна браузера, HTML-файла или офисного документа.

В дополнение ко всему, Check&Get позволяет конвертировать вашу коллекцию закладок в файл HTML с легкой и удобной навигацией. Это дает вам возможность опубликовать свои закладки на веб-сайте или создать в Интернет свой мини-портал буквально за пару минут[29].

На наш взгляд, способность программы импортировать все закладки или их часть в HTML-файл – интересная находка автора. В ряде случаев эта функция открывает очень полезные возможности. Такой файл может быть использован на сайте как страница с работающими гиперссылками. Причем если его обработать в любом редакторе HTML-файлов, например, в Frontpage или в Dreamweaver, то можно снабдить первоначальный документ необходимыми текстовыми пояснениями или иллюстрациями.

Кроме того, программа Check&Get позволяет одним кликом мыши извлечь все гиперссылки, которые есть на странице.

Полезна и функция удаления «мертвых» и дублирующихся ссылок.

Стоимость программы для частного лица на момент написания книги составляла 580 рублей.

Существует 30-дневная ознакомительная версия программы.









Главная | В избранное | Наш E-MAIL | Добавить материал | Нашёл ошибку | Вверх