• Мониторинг изменений на сайтах в Интернете
  • Сторожевой робот WebSite-Watcher
  • Программа Copernic Tracker
  • Программа Check & Get
  • Онлайновый сервис Infominder
  • Онлайновый сервис ChangeNotes
  • Архив сайтов Internet Archive Wayback Machine
  • Мониторинг появления новых сообщений на сайте
  • Программы для работы с информацией

    1. Метапоисковые машины, устанавливаемые на собственном компьютере.

    Яркий представитель программ такого рода – Коперник Мета (Copernic Meta). Это бесплатное программное обеспечение, которое можно скачать по адресу: http://www.copernic.com/en/products/meta/index.html.

    Для доступа к метапоисковой машине Copernic Meta пользователь устанавливает на своем компьютере плагин к Интернет Эксплореру, после чего в браузере появляется дополнительная панель.

    Создатели Copernic Meta говорят о том, что их машина имеет следующие преимущества:

    – позволяет провести метапоиск в Интернете с целью сравнения цен в сетевых магазинах, охватив при этом большое количество таких торговых площадок;

    – производит поиск картинок, аудиофайлов, новостей, предметов, продающихся на аукционах;

    – предоставляет пользователю возможность добавлять свои любимые поисковые машины и информационные ресурсы;

    – обеспечивает доступ к поиску из любого приложения простым нажатием клавиш «Windows Key + S»;

    – облегчает поиск ключевых слов на найденных страницах;

    – достаточно щелкнуть по любому слову на странице, удерживая клавишу Alt, чтобы начать поиск этого слова;

    – имеет панель с ярлыками для запроса в определенную поисковую машину.

    Авторы программных продуктов Коперник не ограничились созданием метапоисковой машиной. За дополнительную плату (около 50 долл. США) они предлагают такие продукты, как Copernic Tracker, а также Copernic Summarizer.

    Copernic Tracker способен отслеживать появление новых слов или графических элементов на веб-страницах. Кроме того, он имеет ряд дополнительных возможностей:

    – может отправлять оповещение об изменении на странице на электронный почтовый ящик либо на мобильный телефон;

    – подчеркивает изменения на странице, облегчая тем самым их обнаружение пользователем;

    – может проводить контроль изменений автоматически, по заданному расписанию – каждый день, каждую неделю или даже каждую минуту;

    – способен проверять наличие определенных ключевых слов на странице;

    – сохраняет в архиве разные версии проверенных страниц;

    – обеспечивает возможность проверки страницы непосредственно в тот момент, когда пользователь ее просматривает.

    Copernic Summarizer, который оценивается уже в 60 долл. США, способен анализировать текст любой длины, написанный на одном из четырех языков, и затем выдавать краткое содержание материала в том размере, который ему задали. При этом программа работает с документами, представленными в таких форматах, как документы Word, веб-страницы, PDF-файлы, сообщения электронной почты и даже текст в буфере обмена.

    Запуск программы Copernic Summarizer может быть произведен нажатием одной кнопки в таких приложениях, как браузер Интернет Эксплорер, а также программах Adobe Acrobat, Acrobat Reader, Outlook Express, Eudora, Microsoft Word, and Outlook.

    Документ, полученный в результате работы программы, можно распечатать на принтере либо сохранить в одном из нескольких допустимых форматов: как простой текст, документ Microsoft Word, файл HTML или XML formats. Кроме того, этот материал может быть немедленно преобразован в сообщение электронной почты и отправлен по любому адресу, выбранному пользователем.

    И наконец, производитель продуктов Коперник предлагает программу Copernic Agent Professional, которая объединяет все вышеописанные продукты под одной оболочкой. При этом стоимость ее относительно невелика для изобретения такого уровня и составляет около 80 долл. США.

    К сожалению, на этом несомненные плюсы программ Коперник заканчиваются. Минус у них, собственно, один. Но достаточно большой: Коперник не работает с русскоязычными поисковыми системами, русский язык в принципе не входит в число четырех языков, с которыми работает система.

    У автора этой книги есть опыт приобретения программы Copernic Agent. Так вот, на этапе ее эксплуатации выяснилось, что в данном случае невозможен не только анализ русскоязычных текстов, но и добавление русскоязычных поисковых машин в базу Copernic Meta, хотя легкость включения информационных систем в базу данных отдельно заявлена среди преимуществ продукта.

    Служба технической поддержки сообщила, что, к их большому сожалению, русский язык не поддерживается Коперником и в ближайшее время в этом направлении создатели программы работать не планируют.

    Однако, справедливости ради, отметим, что объявленный ими принцип: «Мы гарантируем возврат денег в течение 30 дней после покупки, если вам не понравится наш продукт» – действительно соблюдается. После того, как мы высказали по электронной почте просьбу компенсировать нам стоимость программы, в связи с указанными выше обстоятельствами, деньги действительно были зачислены на тот счет, с которого ранее производилась оплата.

    Однако для тех, кто работает с Интернетом на основных европейских языках, программные продукты Коперник могут действительно помочь сэкономить время при параллельном повышении качества работы. На наш взгляд, Copernic Agent – одно из самых доступных по цене решений для малого и среднего бизнеса, когда стоит задача мониторинга Сети и предварительного анализа полученных документов.

    2. Поиск информации на собственном компьютере.

    Сегодня у большинства пользователей на персональном компьютере хранится достаточно много информации, и ее количество стремительно растет. Это могут быть статьи, письма, договоры, какие-то другие документы различных форматов. Если владелец компьютера регулярно собирает какие-то сведения, то их объемы могут составлять сотни гигабайт, что обычно и происходит у профессионала конкурентной разведки. В такой ситуации достаточно скоро возникает вопрос, как найти нужные тексты, в том числе те, о которых пользователь уже забыл. Лучшее решение этой задачи предлагается компанией Apple, производящей компьютеры на базе операционной системы MacOS. Наш опыт показал, что заявленная ею возможность мгновенного поиска файлов по фрагменту слова, содержащегося в тексте, действительно работает. Это было достигнуто благодаря тому, что принципиальная организация MacOS обеспечивает индексацию содержимого файлов еще на этапе записи документа на жесткий диск. Однако большинство наших читателей пользуется операционной системой Windows, поэтому мы подробнее остановимся на предлагаемых для нее решениях.

    Встроенные в Windows XP средства поиска, которые вызываются нажатием виртуальных кнопок «Пуск» > «Найти» > «Файлы и папки», имеют один существенный недостаток. Дело в том, что этот алгоритм каждый раз открывает и просматривает все без исключения файлы, хранящиеся на компьютере в области, заданной для поиска. Такой способ работы с информацией обеспечивает высокую точность результатов, но, к сожалению, требует много времени, и чем больше становится количество файлов на персональном компьютере, тем больше времени расходуется впустую, в ожидании того, когда нужный файл будет найден. Именно поэтому на рынке появились программы, которые, подобно поисковым машинам Интернета, индексируют информацию на персональном компьютере и делают ее доступной пользователю практически мгновенно. Причем эти программы как правило предоставляются бесплатно.

    Наиболее известные из них – Яндекс Десктоп (Yandex Desktop http://desktop. yandex.ru/), Гугл Десктоп (Google Desktop http://desktop.google.com/ru/index. html) и Коперник Десктоп (Copernic Desktop Search http://www.copernic.com/en/ products/desktop-search/index.html). Первые две поддерживаются поисковыми системами Яндекс и Гугл, а третья – авторами метапоисковой машины и других продуктов под маркой «Коперник».

    Каждый из названных продуктов работает в фоновом режиме и по умолчанию проводит индексацию в то время, когда пользователь не прикасается к компьютерной мыши и не работает на клавиатуре.

    Для того, чтобы читателю было проще сделать свой выбор между этими тремя программами, мы поделимся результатами проведенных нами в свое время экспериментов. Мы исследовали, насколько безопасны поисковые программы для персональных компьютеров, с точки зрения утечки информации с компьютера без ведома пользователя.

    Персональные поисковики Гугл и Яндекс выпущены и поддерживаются одноименными поисковыми машинами Интернета. На наш взгляд, основная причина появления этих программ для настольного компьютера именно в бесплатном варианте – это привлечение людей к своим информационным системам как к основным средствам работы в Сети. Недаром в оба продукта встроена функция «Искать в Интернете», приводящая к машине по обработке запросов, которая создала настольный поисковик. Такое привлечение пользователей материально выгодно для информационных систем в силу ряда причин:

    – это позволяет эффективно продавать контекстную рекламу, так как количество посетителей поисковой машины возрастает;

    – дает дополнительный трафик поисковикам;

    – позволяет собирать статистику по ключевым словам, используемым пользователями;

    – помогает отслеживать перемещения людей от одной машины к другой и тем самым узнавать об их предпочтениях.

    Недаром при установке нового пакета программ Гугла, в котором персональный поисковик для настольного компьютера представляет собой лишь один из его компонентов, по умолчанию ставится «галочка» в графе о подтверждении согласия пользователя на сбор «неличной информации» с его компьютера.

    Вот текст этого дисклеймера, который появляется при установке Google Desktop.

    При использовании расширенных функций Вы можете передавать информацию о просмотренных сайтах и неличную информацию об использовании в Google. Например, для персонализации новостей, отображаемых на боковой панели, Google Desktop отправляет в Google информацию о посещаемых Вами страницах новостей. Мы используем неличные данные об использовании, включая сообщения о сбоях, в целях усовершенствования Google Desktop. Учтите, что эти данные на самом деле не содержат сведений, позволяющих нам узнать, кто Вы такой. Мы используем их только для расширения возможностей Google Desktop по предоставлению Вам наиболее релевантной информации.

    Существует два варианта установки поисковика Гугла отдельно от пакета (о «галочке» в этом случае можно забыть) – с расширенными функциями и без таковых. Если выбрать вариант, когда расширенные функции включены, то программа начнет соединяться с Интернетом сразу по множеству каналов, перебирая закладки на сайты, сделанные в браузере компьютера. В результате откроется боковая панель, с которой можно будут осуществлять быстрые переходы к ресурсам, которыми вы интересуетесь. Соединение при этом будет установлено с адресом kh.google.com и mt.google.com.

    Коперник, как известно, выпущен компанией, которая не имеет собственной поисковой машины, а владеет метапоисковиком, распределяющим запросы между поисковыми системами других владельцев, и затем анализирующим полученные результаты. Вероятно, поэтому столь выраженного интереса к сбору статистики, который характерен для поисковых машин, у владельцев и авторов Коперника нет.

    Проводя исследование передачи данных в Интернет настольными поисковыми системами, мы обратились за помощью к человеку, который профессионально занимается вопросами конфиденциальности сведений, представленных в Сети. В работе были использованы специальные программы для подробного анализа интернет-активности приложений – SmSniff и Ethereal.

    Владимир Казеннов, так зовут нашего эксперта, не только помог нам советами, но и непосредственно проделал основную часть экспериментальной работы. Если читателям потребуется связаться с ним для прояснения непонятных моментов, это можно сделать по электронной почте kentavr10@yandex.ru.

    Проведенное нами исследование подтвердило, что Коперник Десктоп и Яндекс Десктоп достаточно безвредны. Так, Коперник Десктоп вообще ничего не передавал в Интернет, а Яндекс Десктоп передавал лишь информацию о запросе, сделанном пользователем (да и то, как вначале предположил Владимир Казен-нов, а впоследствии подтвердили сотрудники Яндекса, это не преднамеренный поступок, а некритичная ошибка в написании программы).

    Однако с Гугл Десктоп ситуация оказалась более угрожающей, с точки зрения конфиденциальности информации на персональном компьютере. Мы выявили, что он передает на свой сервер некие неустановленные данные по зашифрованному каналу (именно потому, что они зашифрованы, их и не удалось установить). Кроме того, нами было доказано, что Гугл предоставляет своим хозяевам обширную статистическую информацию о параметрах машины, которая использует данную программу, и о работе системы поиска.

    Вместе с тем, исследование большей части полученных данных показало, что основная сетевая активность Гугла Десктоп осуществляется в незашифрованном виде и в большинстве своем неопасна с точки зрения угрозы конфиденциальным сведениям.

    А кроме того, было установлено, что часть программного кода, применяемого Гуглом – в частности, java-скрипт, – может при определенных условиях быть вредоносной, так как использует технологию скрытого сбора информации и не требует получения разрешения от пользователя на ее отправку поисковику. Во всяком случае, такие java-скрипты обычно запрещаются в защищенных системах.

    Так обстояло дело на момент написания книги. Мы не в состоянии спрогнозировать, каким будет поведение поисковых машин этих производителей завтра.

    Полное описание эксперимента с детализацией полученных на каждом этапе данных читатель может найти по адресу: http://yushchuk.livejournal.com/37721. html.

    Таким образом, если во главе угла – конфиденциальность информации на персональном компьютере, можно было бы рекомендовать в первую очередь Коперник Десктоп и, пожалуй, Яндекс Десктоп. Гугл, передающий в Интернет неустановленные зашифрованные данные с персонального компьютера, на наш взгляд, не может считаться полностью безопасным.

    Однако есть еще один параметр, по которому мы также проводили эксперимент, сравнивая два поисковик-лидера. Речь идет о том, что лучше – Яндекс Десктоп или Коперник Десктоп, с точки зрения языка запросов, который используется в этих программах. Интерфейс Коперника англоязычный, Яндекса – русскоязычный.

    Для того, чтобы разобраться в этом вопросе, на жесткий диск персонального компьютера были записаны четыре файла, созданных в Word и содержавших короткие, достаточно бессмысленные тексты, включающие в себя нестандартные, редко встречающиеся слова, а также понятия, намеренно написанные с орфографическими ошибками. Это позволило работать без «информационного мусора», который мог быть создан другими документами, хранящимися на том же компьютере. Полное описание эксперимента можно увидеть по адресу: http://yushchuk.livejournal.com/40521.html.

    В результате, нами были сделаны приведенные ниже выводы.

    На наш взгляд, программа Copernic Desktop Search обеспечивает больше возможностей для точного поиска на персональном компьютере, нежели Яндекс Десктоп.

    Коперник Десктоп больше подходит для человека, который знает, что такое Булева алгебра и которого не смущает англоязычный интерфейс.

    Яндекс, на наш взгляд, за счет упрощения языка запросов настольной поисковой программы, утратил свое главное преимущество – способность составить точный поисковый запрос.

    Если же пользователь не испытывает необходимости в составлении точного запроса, то Яндекс Десктоп – лучшее решение, нежели продукт Коперника, поскольку он прощает большее количество ошибок и неточностей.

    Особенности фактического языка запросов обеих испытанных программ. Яндекс Десктоп:

    – воспринимает слова в любой их форме, и возможности отменить процесс образования производных от исходного слова нет. Причем, не работают ни стандартный для поисковой машины Яндекс оператор «!», находящийся перед словом, ни заключение запроса в двойные кавычки;

    – не проводит различий между заглавной и прописной буквами в тексте;

    – ищет по целому слову, изменяя его, по фрагменту слова поиск не выполняется;

    – не поддерживает функцию принудительного включения слова в результат поиска. Если из двух слов, соединенных логическим «И» в пределах текста есть только одно, этот документ все равно попадет в выдачу, даже если перед обоими словами стоит знак «плюс»;

    – оператор логическое «И» внутри одного предложения («&») при этом действует;

    – оператор расстояния между словами не действует;

    – логическое «НЕ» существует, но всегда относится ко всему тексту (что соответствует двойной тильде «~~»);

    – точная фраза (оператор «кавычки») действует;

    – логическое «ИЛИ» также действует.

    Коперник Десктоп:

    – выдает результат в зависимости от того, с заглавной или прописной буквы написано слово. Эта зависимость исчезает, если перед словом поставить логическое «ИЛИ» (оператор OR – заглавными буквами);

    – ищет информацию по фрагменту слова;

    – словоформы не поддерживает. Если нужно любое производное от искомого понятия, надо написать его не до конца, чтобы все варианты окончаний могли быть добавлены к этому фрагменту;

    – если в запросе два слова связаны логтческим «И», представляет в выдаче только те тексты, в которых обязательно есть оба слова (напоминаем, что лучше писать слово без окончания, если нет уверенности в том, в какой форме оно присутствует в тексте);

    – логическое «НЕ» представляет знаком «минус», действие которого распространяется на любой фрагмент текста.

    Мониторинг изменений на сайтах в Интернете

    Ни специалисту конкурентной разведки, ни сотруднику отдела маркетинга или сбыта недостаточно просто знать, на какой страничке Интернета содержится нужная информация. Надо иметь возможность своевременно и точно отслеживать изменения на этой страничке. Каждый может себе представить, насколько сложна, а чаще всего и вовсе неосуществима эта задача. Вряд ли даже самый внимательный и скрупулезный человек в состоянии быстро и точно оценить изменения в тексте – скажем, в прайс-листе, – занимающем пять страниц.

    Для решения подобной проблемы несколькими компаниями разработано специальное программное обеспечение – так называемые «сторожевые роботы»: ознакомившись со страницей, они сохраняют ее образ в своей базе данных, а при повторном посещении сравнивают актуальное состояние ресурса с этим образом. Программа отмечает изменившиеся места, которые становятся похожи на выделенные маркером фрагменты текста на бумажном носителе. Более того, удаленние кусков материала также фиксируется многими программами данной категории – как правило, внизу страницы, дабы не мешать восприятию человеком информации. «Сторожевые роботы» могут запускаться пользователем вручную, а могут и работать автоматически, по расписанию.

    Предлагаем рассмотреть эти программы более подробно.

    Сторожевой робот WebSite-Watcher

    Программа выпущена в Германии, ее официальный сайт – http://www.aignes.com. Стоимость продукта составляет около 40 долл. США за индивидуальную лицензию. Кроме того, пользователю дается 30-дневная полнофункциональная версия, дабы он успел удостовериться в необходимости ему этого продукта. Заплатить за WebSite-Watcher требуется лишь один раз, после чего все обновления становятся доступны бесплатно и на неограниченный срок.

    Интерфейс программы поддерживает русский и украинский языки, однако раздел «Помощь» до выхода в свет версии 4.06 был написан на английском. После появления версии 4.06 на сайте программы по адресу http://www.aignes. com/wswtrans.htm стал доступен exe-файл (wswhelp_russian.exe), который присоединяет к WebSite-Watcher справочную информацию на русском языке. Работа с русским языком не вызывает у программы никаких проблем. Продукт довольно часто обновляется. Так, на момент написания книги была доступна версия 4.10.

    WebSite-Watcher работает как клиент на компьютере пользователя. Это значит, что все закладки и конфигурации хранятся локально на жестком диске компьютера и сервер хозяина не участвует в процессе поиска. Производитель утверждает, что выход в Интернет требуется продукту лишь для посещения страниц, проверяемых пользователем.

    Что же может проверять программа?

    Любые web-страницы с текстовым содержанием, независимо от расширения файла. То есть статичные страницы (с расширением файла. htm или. html) и динамичные страницы (с расширением. asp,php и так далее). WebSite-Watcher также выделит цветом все изменения в тексте.

    RSS/Atom feeds. Страницы RSS/Atom преобразовываются в читаемый html-формат и могут обрабатываться как обычные web-страницы.

    Страницы, защищенные паролем. Для таких страниц вы можете записать макрокоманду, после автоматического выполнения которой ресурс будет проверен на обновление.

    Форумы. Они обрабатываются как обычные страницы с небольшой оптимизацией, например, специальной технологией подсветки изменений.

    Страницы с Javascript. Для таких страниц WebSite-Watcher поддерживает отдельную и более сложную технологию преобразования динамически сгенерированного содержания ресурса в статичное содержание.

    Изображения. Если Вы отслеживаете изображение, WebSite-Watcher способен обнаружить его обновление. Изменения в изображении не подсвечиваются.

    Двоичные (бинарные) файлы. WebSite-Watcher может обнаруживать обновление двоичных файлов (например, файлы zip или exe) сравнением даты документа, его размера и/или части его содержания (двоичные файлы не будут полностью загружаться при проверке на обновление).

    Файлы PDF и Flash. Они обрабатываются как двоичные файлы. WebSite-Watcher не подсвечивает изменения в их содержании.

    FTP-файлы и каталоги. WebSite-Watcher поддерживает отслеживание таких документов и каталогов. FTP-файлы могут проверяться по их дате/размеру или содержанию.

    Интранет. Все страницы в сети Интранет могут быть проверены подобно обычным web-страницам.

    Локально хранящиеся файлы. WebSite-Watcher может отслеживать любой файл на вашем жестком диске.

    По крайней мере, такие данные приводит сам производитель.

    После того, как WebSite-Watcher установлен и запущен на компьютере, в правом верхнем углу всех наиболее распространенных браузеров (в частности, Internet Explorer, Mozilla Firefox, Opera) появляется значок программы, представляющий собой стилизованный глаз.

    Добавление закладки в перечень закладок может производиться двумя способами.

    1. Непосредственно из браузера.

    Таким образом можно добавить к закладкам ту страницу, которая в настоящий момент загружена в браузере. При щелчке любой кнопкой мыши по значку WebSite-Watcher в правом верхнем углу браузера появляется всплывающее меню, первый пункт которого «Добавить в закладки». После того, как выбирается этот пункт, появляется следующее окно, в котором URL страницы уже автоматически внесен в соответствующее поле. Вам остается лишь ввести ее имя вручную (причем оно не имеет никакого значения для компьютера и служит только для того, чтобы можно было определить, для чего та или иная закладка нужна, потому и назначается пользователем произвольно). Версия 4.10 позволяет обойтись даже без ручного ввода названия страницы, поскольку программа может автоматически брать это название на самом ресурсе.

    Внимание: после того, как URL страницы и имя закладки внесены в это окно, требуется нажать клавишу «ПРОВЕРИТЬ!», а НЕ кнопку «ОК». В этом случае WebSite-Watcher отправится на страницу и сохранит в своем архиве ее образ, с которым и будет при следующем посещении ресурса проводить сравнение. В главном окне программы WebSite-Watcher после этого напротив имени закладки появится надпись «ОК, инициализировано».

    Если же пользователь выберет кнопку «ОК» вместо кнопки «Проверить!», то программа сохранит закладку в меню, однако посещать страницу не будет и, соответственно, не будет и сохранять в архиве ее копию.

    2. Из главного меню программы WebSite-Watcher.

    Для этого надо открыть окно добавления новой закладки, щелкнув либо по второй слева кнопке на верхней панели программы (она называется «Мастер» и выглядет как жезл с икрящимся наконечником), либо по третьей слева кнопке в той же панели (она называется «Новая закладка» и выглядит как лист бумаги с размещенным на нем знаком «плюс»). Нажатие кнопки «Мастер» предпочтительно, когда проверяемая страница защищена паролем, поскольку там предусмотрен макрос, позволяющий вводить этот пароль автоматически. В остальных случаях лучше воспользоваться командой «Добавить закладку».

    Программа WebSite-Watcher позволяет проверять изменения на странице как вручную, так и автоматически.

    Организуются новые папки и подпапки для систематизации закладок также очень легко, а перемещаются в новые места простым перетаскиванием их их мышью.

    Кроме того, в программе предусмотрены фильтры, которые позволяют исключать из проверки определенные строки (например, постоянно меняющиеся время или дату в углу страницы либо афоризм, который некоторые оптимизаторы сайтов любят постоянно менять на своем ресурсе). Использование фильтров помогает исключать неинформативные сообщения о наличии изменений на странице.

    Архивирование страницы непосредственно в программе WebSite-Watcher не предусмотрено, однако производитель вместе с программой WebSite-Watcher поставляет бесплатную программу Local WebSite Archive, которая как раз и создает архивную копию странички Интернета. При этом Local WebSite Archive может запускаться из того же меню, встроенного в браузер, что и WebSite-Watcher.

    Подробное описание этих и других возможностей WebSite-Watcher приведено в разделе «Помощь» этой программы, поэтому детально останавливаться на них мы не будем.

    И напоследок нам хотелось бы отметить, что существует форум (http://www.aignes.com/forum/), где обсуждаются проблемы программы WebSite-Watcher и способы их преодоления. Форум, к сожалению, англоязычный, но он приносит реальную пользу, когда не понятно, как поступить в том или ином случае, либо когда требуется отыскать нужную функцию, не вынесенную в главное меню программы. Хотим поблагодарить его участников, советы которых неоднократно помогали нам в работе.

    Программа Copernic Tracker

    Эта программа может быть скачана из Интернета по адресу: http://www.copernic.com/en/products/tracker/index.html.

    К сожалению, Copernic Tracker, как и другие продукты компании, пока что плохо работает с русскими шрифтами, поэтому интересен, главным образом, для тех, кто проводит мониторинг европейских и американских сайтов. Тем, кто интересуется русскоязычными страницами, лучше сразу перейти к описанию следующей программы.

    Однако мы не сочли возможным обойти его вниманием, поскольку продукты Коперник – наиболее доступное программное обеспечение, позволяющее автоматизировать работу с сайтами, которые написаны на языках, основанных на латинском алфавите.

    Производители Copernic Tracker отмечают следующие его возможности:

    – мониторинг сайтов с целью поиска изменений в тексте и отслеживания новых изображений;

    – предоставление уведомлений об изменениях на интересующих пользователя сайтах не только на рабочий стол компьютера, но и по электронной почте, а также по мобильному телефону;

    – выделение цветом изменений на странице;

    – осуществление автоматической проверки страниц по расписанию – ежедневно, еженедельно и даже ежеминутно;

    – просмотр конкретных ключевых слов на странице;

    – архивирование разных версий просмотренных страниц;

    – просмотр одним щелчком мыши изменений страницы, которая загружена в данный момент в браузер.

    На наш взгляд, практический интерес представляет способность отправлять оповещение об изменениях на страницах в Интернете на адрес электронной почты или мобильный телефон. Эта функция может быть полезна всем пользователям. А вот разрекламированные возможности программы отслеживать новые рисунки мы в ходе тестирования обнаружить так и не смогли. Нами, в частности, был поставлен на мониторинг сайт новостей от BBC. Картинки на ресурсе менялись регулярно, располагаясь при этом в одних и тех же местах, и Copernic Tracker, исправно сообщающий об изменениях в тексте, никоим образом на манипуляции с изображениями не реагировал. А жаль, поскольку способность отслеживать изменения баннеров, например, очень востребована рекламными компаниями.

    В остальном программа очень похожа на вышеописанную.

    На момент написания книги пользователям был доступен только англоязычный интерфейс, в отличие от русскоязычного WebSite-Watcher. Функция запуска Copernic Tracker непосредственно из браузера работает не из любого распространенного браузера, как это было возможно в случае с программой WebSite-Watcher, а лишь из Internet Explorer.

    Стоимость Copernic Tracker – примерно 50 долл. США. На сайте производителя возможно скачать демонстрационную 30-дневную версию, и еще 30 дней даются покупателю на принятие окончательного решения о целесообразности приобретения, поскольку на Copernic Tracker распространяется обычная для программного обеспечения Copernic практика гарантии возврата денег в течение указанного срока, если пользователя по каким-то причинам продукт не устроит.

    Программа Check & Get

    Это отечественный продукт. Преимущество такой программы заключается не только в корректной поддержке русского языка, но и в возможности ее приобретения за российские рубли (что выступает решающим аргументом для крупных предприятий, в особенности – государственных, где использование иностранной валюты для оплаты товаров или услуг затруднительно), а также в доступности создателя продукта, если у вас появляются к нему вопросы. Причем техническая поддержка при этом также русскоязычная, в отличие от программ-конкурентов.

    Мы подтверждаем, что Дмитрий Скорняков (press@activeurls.com) – человек, который создал и поддерживает программу Check & Get, действительно всегда готов помочь разобраться с проблемой, если таковая возникает. Так, автор этой книги сталкивался с ситуацией, когда ни одна из приведенных здесь программ не могла отслеживать изменения на сайте одного из российских университетов. Попытавшись понять причины этой проблемы, в бессилии расписались как создатели и администраторы проблемного сайта, так и служба технической поддержки WebSite-Watcher. И только Дмитрий Скорняков внимательно изучил тот проблемный сайт, разобрался в причинах возникшей ситуации и дал рекомендации, которые позволили устранить проблему. На наш взгляд, это немаловажное обстоятельство, говорящее в пользу программы Check & Get.

    Скачать ее можно по адресу: http://activeurls.com/ru/download.php.

    Вот что говорит о возможностях продукта его создатель.[9]

    При обнаружении на веб-странице новой информации, Check&Get автоматически сохраняет «снимок» этой страницы в локальную базу данных и информирует Вас указанным Вами способом. Check&Get может послать вам сообщение электронной почты с содержанием измененной веб-страницы, при этом, изменения на странице будут «подсвечены» для их легкой идентификации. Также, программа может вывести сообщение на экран или проиграть звуковой файл, информируя Вас об изменениях.

    Check&Get автоматически извлекает названия и описания веб-страниц при создании Закладки, проверяет вашу коллекцию на наличие «мертвых» ссылок, находит дублирующиеся ссылки в вашей коллекции закладок. Check&Get работает с Internet Explorer, Netscape, Mozilla, Opera, позволяя вам импортировать, экспортировать, и синхронизовать закладки. Благодаря этому, вы всегда имеете в выбранном браузере актуальную и организованную коллекцию ссылок.

    Список ссылок также может быть импортирован и добавлен к вашим Закладкам из буфера обмена Windows, окна браузера, HTML файла или офисного документа. В дополнение ко всему, Check&Get позволяет конвертировать вашу коллекцию Закладок в файл HTML с легкой и удобной навигацией. Это дает вам возможность опубликовать свои Закладки на веб-сайте или создать в Интернет свой мини-портал буквально за пару минут.

    Приведем перечень функций программы, также взятый на ее официальном сайте (рис. 18).[10]

    Интуитивный и простой в использовании интерфейс на русском языке с поддержкой функций Drag & Drop.

    Поддержка «визуальных схем».

    Возможность проверки веб-страниц в ручном или автоматическом режиме на наличие изменений.

    Поддержка протокола SSL.

    Одновременная проверка веб-страниц.

    Расширенные функции поиска закладок и веб-страниц по общим полям (имя, описание, ключевые слова). Также возможен поиск по сохраненному содержанию веб-страниц.

    Встроенный браузер с поддержкой онлайнового и автономного (offline) режима.

    Подсветка изменений на веб-страницах, что позволяет легко идентифицировать новое содержание.

    Выбор пользователем режима оповещения об изменениях веб-страниц: по электронной почте (включая содержание страницы с подсвеченными изменениями), оповещением на экране пользователя, проигрыванием звукового файла.

    Автоматическое сохранение «снимков» веб-страниц с возможностью их просмотра в автономном режиме. Позволяет изучить изменение ресурса за указанный промежуток времени.

    Возможность открытия закладок в любом внешнем браузере (автоматически определяемые браузеры: Internet Explorer, Netscape, Mozilla, Opera, MyIE2, Avant Browser, etc.).

    Импорт закладок из Internet Explorer, Opera, Netscape, Mozilla.

    Экспорт закладок в Internet Explorer, Opera, Netscape, Mozilla.

    Синхронизация закладок с Internet Explorer, Opera, Netscape, Mozilla.

    Захват ссылок из буфера обмена Windows.

    Расширенные возможности импорта ссылок из буфера обмена, окна браузера, текстовых или HTML-файлов, офисных документов или любых других материалов, даже если они имеют неизвестный формат.

    «Мастер очистки Дублирующихся Ссылок», который позволяет обнаружить и вычистить дубликаты в коллекции закладок.

    Обнаружение «мертвых ссылок».

    Поддержка постоянного (локальная сеть/выделенная линия) или сеансового (коммутируемый модем) соединений с Интернет; функции авто-дозвона, авто-отсоединения от Интернет.

    Автоматическая загрузка программы при старте Windows, работа в системном лотке.

    Использование в коммерческих целях или внутри компании.



    Рис. 18. Check&Get главное окно и оповещение об изменении на странице.


    На наш взгляд, способность программы импортировать все закладки или их часть в HTML-файл – интересная находка автора. В ряде случаев эта функция открывает очень полезные возможности. Такой файл может быть использован на сайте как страница с работающими гиперссылками. Причем если его обработать в любом редакторе HTML-файлов, например, в Frontpage или в Dreamweaver, то можно снабдить первоначальный документ необходимыми текстовыми пояснениями или иллюстрациями.

    Кроме того, Check&Get позволяет одним кликом мыши извлечь все гиперссылки, которые есть на странице.

    Полезна и функция удаления «мертвых» и дублирующихся ссылок.

    А вот возможность по автоматическому занесению в закладки страницы, с которой пользователь пытается копировать текст, заложенную в программу по умолчанию, на наш взгляд, нельзя однозначно отнести к достоинствам продукта. По крайней мере, начинающим пользователям эта функция скорее досаждает, нежели облегчает их работу: на практике эта теоретически полезная способность программы проявляется в возникновении всплывающего окна всякий раз, когда вы всего лишь копируете фрагмент текста со страницы в буфер обмена (даже если вы вообще не планируете ничего ставить на мониторинг, а собираетесь, к примеру, просто скопировать часть документа, чтобы сохранить его в текстовом файле). Это всплывающее окно предлагает внести в закладки адрес страницы, и его каждый раз приходится закрывать вручную. В принципе, Check&Get предусмотрена возможность зайти в меню и отключить эту опцию, однако для начинающего пользователя обычно и столь, казалось бы, примитивная операция представляет немалую сложность.

    Существует 30-дневная ознакомительная версия программы.

    Стоимость персональной лицензии продукта при расчете наличными составляет около 600 рублей. Иностранные покупатели платят цену примерно вдвое большую, сопоставимую со стоимостью зарубежных программ-конкурентов.

    Онлайновый сервис Infominder

    Можно считать неизменной тенденцию к развитию онлайновых сервисов, которые если не полностью вытесняют, то, по крайней мере, дублируют программное обеспечение, устанавливаемое непосредственно на компьютере. А потому появление таких интернет-услуг, которые обеспечивали бы контроль содержимого страниц, было вполне логичным. Arthur Weiss.[11] рекомендует пользоваться ресурсом Infominder, который расположен по адресу: http://www.infominder.com/webminder

    30-дневная бесплатная версия сервиса позволяет проводить мониторинг изменений на веб-ресурсе один раз в день, ограничивая при этом количество просматриваемых страниц десятью. Платный сервис обеспечит проверку изменений до четырех раз в день. Стоимость услуги зависит от количества поставленных на мониторинг страниц. На момент написания книги годовой платеж за 20 страниц составлял 9 долл. США, за 100 страниц – около 25 долл., за 250 страниц – около 50 долл., за 500 страниц – порядка 99 долл. и за 1000 страниц – 179 долл.

    Независимо от того, какой версией пользуется клиент, он может получать уведомления об изменившихся страницах двумя способами: лично посетив свою страницу на сайте Infominder и введя при этом логин и пароль, либо запросив отправку соотвествующих сообщений по электронной почте. Последнее требует заполнения расширенной (Advanced) формы при добавлении новой закладки, приведенной на рис. 19.

    Онлайновый сервис ChangeNotes

    Сервис расположен по адресу http://www.changenotes.com.

    В принципе, существует возможность бесплатной постановки на мониторинг изменений на сайтах общим числом до 100 контролируемых страниц, а при том, что учет ведется по адресу электронной почты подписчика, мы бы сказали, что, скорее, кратно ста страницам. Оповещение пользователя производится один раз в день.

    Однако, как показывает практика, нередко поставщики бесплатных услуг не несут никакой ответственности в случае сбоев в работе. Кроме того, они не отвечают и за качество предоставленного сервиса. Хотим оговориться: к ChangeNotes (рис. 20) это опасение, вполне возможно, и не имеет никакого отношения. Потому мы и обращаемся к описанию этого сервиса, и в то же время считаем своим долгом напомнить читателю о возможных подводных камнях, когда дело касается установки бесплатных программ. Так что делайте выводы.



    Рис. 19. Расширенное меню добавления страницы в Infominder.



    Рис. 20. Онлайновый сервис ChangeNotes

    Архив сайтов Internet Archive Wayback Machine

    Электронный адрес – http://web.archive.org.

    Каждый, кто собирал информацию по интересующей его проблеме за достаточно длительный период, знает, как порой бывает важно найти сведения, опубликованные на сайте несколько лет назад. Иногда это просто необходимо: в частности, в случае обнаружения новых тенденций в развитии объекта, которое требует ретроспективной оценки времени их появления. Либо возникновения новой темы для изучения событий на рынке и, как следствие, сравнения реакции на них с тем, как вели себя в подобной ситуации участники рынка в прошлом. Конечно, специалист конкурентной разведки всегда старается архивировать интересующую его информацию. Однако в реальной жизни бывает так, что проблема просто не входила в сферу его интересов до определенного момента либо на предприятии эта служба появилась позже тех событий, которые и стали предметом ее пристального внимания.

    В таком случае на помощь нередко может прийти сервис, который нам также рекомендовал Arthur Weiss. Этот Internet Archive Wayback Machine, его изображение представлено на рис. 21. Сервис позиционируется как «Библиотека Интернета». Пауки, принадлежащие Internet Archive Wayback Machine, посещают веб-сайты и сохраняют архивную копию на сервере «библиотеки». Как написано на странице этого ресурса, интересующего нас сайта может и не оказаться в архиве. Например, в случае если паук не может его прочитать, поскольку тот защищен одним из способов, описанных нами в соответствующем разделе данной книги.

    Сервис Internet Archive Wayback Machine некоммерческий. Он работает с 1996 г. и, как утверждают его владельцы, существует на пожертвования меценатов и благодаря технической поддержке крупных интернет-компаний, таких как Alexa. Ежемесячно архив увеличивается в объеме на 20 терабайт. Ценным нам видится то обстоятельство, что Internet Archive Wayback Machine отслеживает копии даже тех сайтов, которых больше не существует в Сети.

    Для того, чтобы увидеть сохраненную версию нужного сайта, достаточно ввести в окно, расположенное в верхней части главной страницы, адрес ресурса и нажать клавишу «Take me Back». После этого пользователю будет предложен архив по запрошенному ресурсу. В пределах этого архива можно ознакомиться с копией сайта за искомую дату. На рис. 22 показан список копий ресурса «Росбизнесконсалтинг».



    Рис. 21. Главная страница Internet Archive Wayback Machine.



    Рис. 22. Архив по сайту РБК http://rbc.ru


    Архив, расположенный на сервере в Сан-Франциско, поражает своими возможностями. Вот как выглядела страница этого известнейшего интернет-ресурса 10 декабря 1997 г. (рис. 23).



    Рис. 23. Страница ресурса РБК от 10 декабря 1997 г.


    Надо сказать, что, помимо функций обеспечения нужд непосредственно конкурентной разведки, наши источники рассказывали о случаях, когда этот ресурс помогал компаниям в сборе доказательств по фактам информационной войны против них. Как правило, в таких ситуациях, когда нападающая сторона «затирала» сведения на сайте, Internet Archive Wayback Machine позволял доказать факт распространения порочащих организацию данных.

    Один из источников автора сообщил о факте, когда наличие копии сайта в архиве Internet Archive Wayback Machine позволило доказать в споре с контролирующими органами, что сайт, существование которого вызывало сомнения у контролеров, действительно существовал в тот период, когда компания получила деньги за его разработку и «раскрутку».

    Мониторинг появления новых сообщений на сайте

    Программы, которые устанавливаются на персональном компьютере и позволяют видеть все, что происходит с ресурсом, – не единственный инструмент мониторинга его модификаций. Преимущество таких программ – в том, что они фиксируют изменения, которые касаются даже одного-единственного слова.

    К недостаткам «сторожевых роботов» мы бы отнесли то обстоятельство, что работают они лишь на том компьютере, на котором непосредственно установлены. Технически возможно перенести базу данных с машины на машину, однако программу придется вновь инсталлировать на тот компьютер, с которого планируется осуществлять контроль изменений в Интернете. Кроме того, «сторожевые роботы» небесплатны.

    В связи с этим, представляют практический интерес два бесплатных сервиса, доступных любому пользователю с любой машины, которая подключена к сети. Речь идет об агрегаторах новостей и о новостях по запросу пользователя.

    Новости по запросу пользователя.

    В Яндексе, Гугле и некоторых других информационных системах этот сервис работает достаточно давно.

    Рассмотрим его более подробно на примере Яндекса (рис. 24). Для того, чтобы им воспользоваться, необходимо ввести запрос в строку поиска. Введем следующее: «курс доллара резко возрос», – а затем дождемся загрузки результатов.

    Если после появления результатов кликнуть по гиперссылке «Новости» под поисковой строкой, то откроется страница, на которой справа содержится гиперссылка с текстом:

    «Подписка на новости по запросу „курс доллара резко …“.



    Рис. 24. Подписка на Новости Яндекса по запросу.


    Переход по этой гиперссылке приведет пользователя еще на одну страницу, на которой ему будет предложено авторизоваться. Как обычно принято на Яндексе, для авторизации используются те же логин и пароль, которые пользователь задействует для доступа к своему почтовому ящику на Яндексе. После авторизации в почтовый ящик подписчика будут приходить все новости, обнаруженные Яндексом по этому запросу. Пользователь может добавлять подписки на новости по другим запросам, а может удалять те из них, которые перестали быть ему нужны.

    По мере появления новой информации в Яндексе по конкретному запросу, в почтовый ящик подписчика будут приходить ссылки и сниппеты (фрагменты текста), при переходе по которым пользователь получит возможность ознакомиться с содержимым страницы в подлиннике.

    Правда, хотим напомнить, что новостями Яндекс считает те ресурсы, которые были проиндексированы им недавно. Истинный возраст информации на этих страницах может быть сколь угодно большим, но поисковиком они будут восприниматься как новые на том основании, что он о них узнал с опозданием.

    Такой сервис существует и в Гугле, он называется GoogleAlert (что можно перевести как «Часовой от Гугла» или «Сторож от Гугла») и расположен по адресу http://www.googlealert.com/.

    После того, как пользователь авторизуется, а также укажет адрес своей электронной почты, ему будет предложено ввести в поисковую строку фразу, по которой он намерен получать новости.

    Когда в Гугле появится свежая информация по запросу, поставленному на мониторинг, адресат получит виртуальное письмо, содержащее ссылки на страницы, отвечающие заданным критериям.

    В целом, хочется отметить, что сервисы Гугла развиваются настолько стремительно, что мы уверены: к моменту публикации этой книги появятся новые программы, часть из которых еще находится в состоянии бета-тестирования, а часть пока только претендует на звание перспективных планов компании.

    Напомним о существовании универсального способа быть постоянно в курсе всех новинок Гугла. Дело в том, что вокруг этой поисковой (и просто сервисной) системы уже сложилось сообщество энтузиастов, которые любят ресурс и постоянно отслеживают, а также тестируют его новинки. Читателю достаточно выбрать нужные группы пользователей и поставить их на мониторинг любым удобным способом, либо просто периодически читать их переписку на форумах. Чтобы попасть на страничку с Группами Гугла, вам нужно перейти по ссылке «Группы» на первой странице.

    А можно воспользоваться другим вариантом – уже упомянутым ранее сайтом «Мир Google», расположенным по адресу: http://www.mir-google.ru.

    Этот полностью русскоязычный ресурс поддерживается энтузиастами во главе с Николаем Петровым из Пскова. Там всегда можно увидеть описание и комментарии к новым сервисам Гугла, в том числе и к тем, которые находятся в тестовой эксплуатации, и получить приглашение для пользования ими.








    Главная | В избранное | Наш E-MAIL | Добавить материал | Нашёл ошибку | Вверх