3.3.1.1. Средства анализа данных на персональных компьютерах


Для успешного функционирования в условиях жесткой конкурен­ции западные фирмы, банки, страховые компании и т.д. нуждаются в тщательном анализе имеющейся информации и получении из нее на­дежных и обоснованных выводов. Поэтому потребность в средствах ста­тистического анализа данных на Западе очень велика, что и послужило причиной для развития рынка статистических программ, на котором предлагаются более тысячи программ. Различные по объему и качеству реализованной статистики, области возможного применения, пользова­тельскому интерфейсу, цене, требованиям к оборудованию и т.п., они отражают многообразие потребностей обработки данных в различных областях человеческой деятельности.

Даже справочники, содержащие очень краткие описания пакетов, составляют солидные тома. В этих справочниках содержатся описания назначения пакетов, требования к техниче­ским характеристикам компьютера, дополнительные сервисные возмож­ности пакетов, цены и адреса фирм-поставщиков. Информацию о новых версиях пакетов можно найти в популярных компьютерных журналах и газетах типа «PC Magazine», «PC World», «BYTE», «PC Week» и др. Не­которые рекомендации по выбору статистических пакетов периодически публикует «Мир ПК».

Число статистических пакетов, получивших распространение в Рос­сии, тоже достаточно велико (несколько десятков) и спрос на них заметно возрос в середине 90-х годов. Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP, SAS, CSS, STATISTICA, S-plus, и др. (кстати, большинство из этих пакетов занимают по качеству лидирующее места в мире). Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП:СтатЭксперт, Статистик-Консультант, САНИ, КЛАСС-МАСТЕР и др. Проблема вы­бора наиболее подходящего пакета для данной категории пользовате­лей, круга решаемых задач, типа и возможностей компьютеров и т.д., весьма непроста.

Виды статистических пакетов. Основную часть имеющихся статистических пакетов составляют специализированные пакеты и пакеты общего назначения.

Специализированные пакеты обычно содержат методы из одного-двух разделов статистики или методы, используемые в конкретной пред­метной области (контроль качества промышленной продукции, расчет страховых сумм и т.д.). Чаще всего встречаются пакеты для анализа вре­менных рядов (например, Эвриста, МЕЗОЗАВР, ОЛИМП:СтатЭксперт, Forecast Expert), регрессионного и факторного анализа, кластерного анализа, многомерного шкалирования. Обычно такие пакеты содержат весьма полный набор традиционных методов в своей области, а ино­гда включают также и оригинальные методы и алгоритмы, созданные разработчиками пакета. Как правило, пакет и его документация ори­ентированы на специалистов, хорошо знакомых с соответствующими методами. Применять такие пакеты целесообразно в тех случаях, когда требуется систематически решать задачи из той области, для которой предназначен специализированный пакет, а возможностей пакетов об­щего назначения недостаточно.

Пакеты общего назначенияОсобое место на рынке занимают так называемые статистические пакеты общего назначения. От­сутствие прямой ориентации на специфическую предметную область, широкий диапазон статистических методов, дружелюбный интерфейс пользователя привлекает в них не только начинающих пользователей, но и специалистов. Универсальность этих пакетов особенно полезна:

  • на начальных этапах обработки,  когда речь идет о подборе статистической модели или метода анализа данных;
  • когда поведение статистических данных выходит за рамки ис­пользовавшейся ранее модели;
  • в процессе обучения основам статистики.

Именно пакеты общего назначения составляют большинство прода­ваемых на рынке статистических программ. К таким пакетам относятся системы STADIA и STATGRAPHICS, рассмотренные в этой книге, а также пакеты SPSS, SYSTAT, S-plus и др.

Неполные пакеты общего назначения. Некоторое хождение на рынке статистических программ (особенно в нашей стране) имеют пакеты, которые можно было бы назвать неполными пакетами общего назначения. Чаще всего они содержат простейшие методы описательной статистики и некоторые методы из двух-трех других разделов статистики. Как правило, это либо недоработан­ные первые версии вновь создаваемых пакетов, либо вынесенные на рынок программы для внутреннего, узкоспециализированного использования. Послед­ние, кроме ограниченности статистических методов, обычно характеризуются недоработанными интерфейсами, скудностью сервисных возможностей. Отли­чительной чертой таких пакетов является отсутствие или слабая методическая проработка документации.

По-видимому, использование неполных пакетов общего назначения вряд ли может быть целесообразным, так как при практической работе почти наверняка (и, скорее всего, очень быстро) потребуются те методы, которые разработчи­ки не смогли включить в пакет. Образно выражаясь, неполный пакет общего назначения похож на автомобиль, рассчитанный, скажем, на работу при тем­пературе только от 15 до 20 градусов – иногда его можно использовать, а очень часто нельзя.