ГОЛУБЯТНЯ: Трубные звуки золоченых рогов
Написал Максим Белозеров: «Вы неоднократно в своих статьях поддерживали идею свободного и бесплатного распространения программ и нещадно гнобили пропиндосских шареварщиков. Но что-то меня стали посещать нехорошие мысли - а не поразил ли Вас, часом, мучнистый дух Скупого Феликса? Или Вас выкрал Ернар Шамбаев и подменил алчным роботом? Неужели Вам слабо выложить для страждущей публики свои книги в виде халявных ебучков - хоть бы и урезанных ознакомительных демо-версий?»
В этом ироничном крике души столько путаницы и непонимания моей позиции, что я просто обязан дать пояснения. Первое: я никогда в жизни не боролся за идею бесплатного распространения программ! Я боролся за право каждого человека пользоваться интеллектуальным продуктом бесплатно. Capici разницу? Если программист хочет бесплатно раздавать свои программы соотечественникам, ограничивая продажи пиндосским рынком, - флаг ему в руки и народная адорация. Если не хочет - нема проблема! Только не нужно роптать, когда вашу шаревару в один прекрасный день порвут на гербарий. Программист волен продавать, пользователь крякать. Jedem Das Seine.
Второе: про книги. Де-юре «мои книги» принадлежат не мне, а издательствам - «Бестселлеру» и «НК Пресс». Что - мне предлагается скоммуниздить их собственность и выложить на халяву онлайн? Если бы меня с этими издательствами ничего личного не связывало, то никакой морально-этической вломности от сканирования книг и их распространения в Интернете не возникало бы. Однако в конкретной ситуации - меня с ними именно что связывает. В адской иерархии Данте Алигьери подобный поступок называется обманом доверившихся, квалифицируется как наиподлейшее преступление и карается соответственно. Никогда в жизни я не передавал в третьи руки ни единой регистрации программ, полученной от самого автора. Точно так же никогда не написал ни одного плохого слова о программах, авторами же предоставленных. Принципы эти святы.
Третье: в опубликованных книгах мне принадлежат авторские права только на текст, и текст этот давным-давно находится в свободном доступе - либо на internettrading.net, либо на порталах журналов «Инфо-бизнес», «Бизнес-журнал» и «Компьютерра». Ищите внимательно и обрящете. Так что наезд Максима Белозерова смело свожу к претензии: «Почему не поднесли на блюдечке с голубой каемочкой да шоб мед сразу по усам потек?» На что отвечаю: «Приходите вчера!»
Итак, «Архивариус». Эту замечательную программу открыл для меня Илья Шутов, за что ему - чистосердечный спасимбарий! Скачал демо-версию. Понравилась настолько, что сразу же ринулся покупать (редкостный порыв!), а там - засада: ненаглядный «Софткей»! Согласитесь, было бы странно после пламенных призывов к бойкоту этой работорговой лавки самому в ней отовариваться. Написал письмо Евгению Троицкому с просьбой принять оплату через WebMoney. Евгений справедливо рассудил, что добросовестный тестировщик в обойме поважнее будет, чем 295 рублей (стоимость лицензии для соотечественников), и регистрационный ключ мне просто отдарил.
И не прогадал: я гонял «Архивариус» с пристрастием, отлавливал баги и жаловался демиургу на отсутствие важных (на мое скромное имхо) фич. Поразительна оперативность, с которой Евгений Троицкий вносит изменения в программу, дополняя ее не косметическими рюшками, а фундаментальными опциями. Так, прочитав из любопытства последние «Голубятни», посвященные Data Mining, Евгений аки змей-искуситель буквально в течение одного дня усилил «Архивариус» поддержкой формата MyBase (Nyf).
Напомню читателям, которые сегодня первый раз в жизни услышали про «Голубятню»: весь октябрь нас основательно клинило на датамайнинге (или инфокопстве) - процессе сбора, обработки и анализа информации. Одним из важнейших аспектов этого процесса является создание реляционных индексируемых баз данных, и именно к этой софтверной группе относится «Архивариус».
Долгие годы эталонной для меня была программа Cros, вознесшаяся на небосклон датамайнинга за счет скорости индексации: огромные информационные массивы, которые «Евфрат» - любимец россиянской бюрократии - был даже не в состоянии обработать (зависая), Cros проглатывал в считанные минуты. Но то, что в 1999 году казалось огромным (300 Мбайт), сегодня играючи отъедается какими-нибудь четырьмя (из шестнадцати) томами «Энциклопедии животных Гржимека» в формате PDF. Сам же книжный мой архив давно перевалил за три гигабайта. Тут-то и нанес «Архивариус» роковую хиза-гери-мовашу в ухо Cros’а: и не просто опередил по скорости индексации былого фаворита, а прямо-таки растерзал его (рис. 1).
32 тысячи документов и 190 миллионов слов: на обработку этого монстра «Архивариус» затратил 53 минуты! Размер созданного индекса - 1,32 Гбайт: меньше половины исходного материала. Феноменальный результат, учитывая, что треть файлов в моей библиотеке упакована в изначально компрессированный формат PDF. А что же Cros? В моей персональной Библии - «Цитадели» Сент-Экзюпери - сказано: «Нельзя унижать тех, кто главенствовал и кому воздавали почести. Нельзя отнимать у царя царство и превращать в нищего подававшего милостыню». Посему не буду придавать огласке ужасающие показатели, продемонстрированные Cros при индексации моего нового книжного архива. Ограничусь щадящей констатацией: цифры моего любимца хуже на порядок.
Наиболее рельефно технологическое отставание Cros проявляется на фоне многообразия настроек, демонстрируемых «Архивариусом» при создании индекса. Начнем с того, что программа Евгения Троицкого умопомрачительно всеядна: кроме файлов, директорий и жестких дисков она индексирует почтовые базы The Bat!, Netscape, Mozila, Thunderbird, Firebird, Firefox, Outlook Express, Outlook и Eхchange всех версий (рис. 2).
Дальше - больше: Cros обрабатывает исходные документы в форматах TXT, MS Word, HTML, RTF, Lexicon, Excel, PDF и ряда архивов (ZIP, ARJ, RAR, IMP и LHA). «Архивариус» же играючи расправляется с сорока (!) форматами - причем такими, что и назвать страшно: Adobe PageMaker, журнал Zinio Reader (ZNO), таблицы Moxcel и внешние отчеты «1С:Предприятия», база данных WinOrganizer (GSO), таблицы Lotus 1-2-3, файл ICQ-chat и т. д. до полного мозгового эклипса (рис. 3).