Руководства, Инструкции, Бланки

статистика 6 руководство пользователя

Категория: Руководства

Описание

Руководства по программе статистика 6 - Форум врачей-аспирантов

Группа: Пользователи
Сообщений: 936
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704

Цитата(Совочка @ 12.10.2009 - 23:32)

большое спасибо за подсказку! литературу прочитала
хотелось бы теперь самостоятельно провести дискриминантный анализ. данные получаена, а вот алгоритма нет. я не нашла примеров что и в какой последовательности надо твыполнять и как интерпретировать результаты. Подскажите, пожалста, как это сделать!


Я опишу больше с точки зрения демонстрации различий и интерпретации. Это дискриминантный анализ с переходом к каноническим функциям (как обычно сам и использую). А ещё можно сделать упор именно на качестве классификации (мне это обычно не нужно, но часто довольствуются именно этим).
1. Войти в модуль анализа, сделать доступными Advanced опции. Определить группирующую и независимые переменные.
2. Выбрать закладку Advanced и определиться с методом: стандартный (войдут все заданные переменные) или пошаговый (войдут только переменные-лучшие дискриминаторы, отобранные программой по заданным условиям). Разные программы используют различное значение F-критерия для пошагового включения-исключения переменных из набора. Чем больше F, тем настройка "грубее" - будут выбраны только самые основные дискриминаторы. Стандартный анализ не проходит если объём выборок мал по сравнению с количеством переменных или если переменные мультиколлинеарны - здесь также может помочь пошаговая техника.
3. В результатах анализа посмотреть значимость всего анализа: Лямбду Уилкса, F-критерий, Р.
4. На новой закладке Advanced можно посмотреть какие переменные вошли в анализ (если использовалась пошаговая техника), можно количественно оценить дистанции между группами в многомерном пространстве признаков (квадрат расстояния Махаланобиса).
5. Если интерпретация особо не важна, а важна классификация - уходить на закладку Classification. Это как бы грубая классификация, не учитывающая взаимной корреляции переменных. Почитайте Реброву!
6. Если нужно разобраться в данных - следует выбрать Канонический анализ и снова закладка Advanced. Здесь можно посмотреть:
- значимость выделенных дискриминантных осей (смотреть статистику хи-квадрат. Рассматривать оси с P<0,05 как главные и статистически значимые, можно также оси с 0,05<P<0,10 рассматривать как "дополнительные", типа по ним проявилась тенднция к различиям. Главные и дополнительные нужно интерпретировать, остальные (P>0,10) можно упомянуть, но не обсуждать);
- стандартизированные и нестандартизированные коэффициенты дискрим. функции;
- факторную структуру осей. Это - коэффициенты корреляции признака с канонической функцией. По ним и проводится интерпретация осей по величине и знакам входящий в неё переменных. Именно на этом этапе возможны трудности, поскольку: (1) желателен опыт интерпретации многомерных данных, (2) нужно глубоко разбираться в предметной области чтобы провести интерпретацию не формально, а по существу процессов, стоящих за наблюдаемой картиной и (3) факторная структура канонических осей всегда интерпретируется хуже факторной структуры главных компонент или факторного анализа т.к. содержит не общие для групп факторы (их проще понять), а, напротив, квинтэссенцию групповых особенностей.
- посмотреть средние значения дискрим. функций для групп.
На основании этих данных можно создать решающее правило (дискриминантный ключ). В него войдут нестандартизированные коэффициенты, а отнесение к той или иной группе будет проводиться в зависимости от знака рассчитанной функции для конкретного объекта. Какая группа в положительной зоне, какая в отрицательной смотреть по знаку групповых средних.
7. На вкладке канонических значений можно посмотреть степень разделения групп разными осями (если ось одна - то только ей).
8. Здесь же нужно построить диаграмму рассеяния (Scatterplot). Это возможно если осей несколько (если одна - строить гистограммы групповых распределений по данной оси (см. пунк 7). Для наглядности рисунок желательно дополнить. Для этого рисунок нужно вырезать из отчёта (Workbook - Extract as. - Copy). Довести его до ума (толщина и цвет линий, шрифты, можно перенести легенду внутрь рисунка: правой клавишей по легенде и convert to floating text) и только после этого рисовать (иначе рисунок сдвинется). Обычно рисуют так: выбрать на панели рисования "Polygon" и соединить линиями крайние точки для облака точек одной группы (выбрать цвет и/или тип линий), аналогично для других групп. Будет хорошо видно какие группы разделяются в данных канонических дискриминантных осях полностью, а какие трансгрессируют. Вы должно быть с такими рисунками сталкивались в литературе. Рисунок сохраните в двух форматах: в векторном stg (для возможности правки в будущем) и в bmp (для вставки в документ или презентацию).

А вообще, если хорошо проработать литературу, то алгоритм в конкретной программе легко нащупать методом тыка. Чтобы понять этот анализ лучше всего прочитать соответствующий раздел в книге "Факторный, дискриминантный и кластерный анализ" (есть в и-нете): достаточно подробно и очень доступно. Это поможет правильно представить результаты анализа (что писать, а что можно опустить). Чему там не уделено внимания, так это распределению исходных признаков. Дискриминантный анализ - параметрическая техника, подразумевается примерно нормальное распределение исходных переменных. Это нужно проверить до анализа и в случае необходимости - преобразовать данные к более симметричному виду.

Сообщение отредактировал nokh - 15.10.2009 - 06:01

статистика 6 руководство пользователя:

  • скачать
  • скачать
  • Другие статьи

    STATISTICA полное руководство пользователя

    Пользователи, знакомые с предыдущей версией STATISTICA. обнаружат следующие новшества в 6-й версии системы:

    • Усовершенствованный интерфейс пользователя, который полностью настраивается и может быть легко (а в некоторых случаях автоматически) приспособлен для работы различных пользователей: от новичков до профессиональных аналитиков. В новой версии STATISTICA более удобна работа с диалоговыми окнами, которые теперь разделены на вкладки. Новый интерфейс предоставляет полностью настраиваемые меню и панели инструментов. Вы можете организовать собственные способы доступа к любому элементу системы STATISTICA. используя средства автоматизации, средства управления обработкой событий и т.п.

    • Язык программирования SVB, сочетающий все возможности языков STATISTICA BASIC и SCL (реализованных в версии 5.5) с большим количеством новшеств. Все функциональные возможности STATISTICA 6 доступны из среды Visual Basic в виде стандартной библиотеки объектов.

    • Отсутствие практически всех системных ограничений, которые имелись в версии 5.5. Например, файлы данных теперь могут содержать практически неограниченное число переменных. Также сняты ограничения на количество символов в названиях переменных, наблюдений, в текстовых метках. Документы в новой версии системы могут: содержать любое число внедренных и связанных объектов.

    • Документы нового формата, поддерживающие технологию ActiveX, а также новые оптимизированные средства управления выводом, в том числе мультимедийные таблицы, иерархические Рабочие книги и мощный редактор Отчетов.

    Возможность одновременного открытия нескольких файлов данных в одном или нескольких приложениях STATISTICA. средства для запуска нескольких анализов в одной рабочей области. (STATISTICA краткое руководство пользователя )

    Дальнейшее усовершенствование графических возможностей STATISTICA. Появились новые типы графиков и сотни новых параметров их настройки. Имеется мощная система управления графическими стилями. Все параметры настройки графиков доступны с помощью SVB. Новая технология доступа к базам данных, основанная на запросах, которая позволяет работать с очень большими файлами данных.

    Полная интеграция с Internet. Возможности объединения системы STATISTICA с другими программными окружениями включают в себя средства для запуска системы STATISTICA на сервере в сети и средства доступа к процедурам STATISTICA с помощью Internet-браузера. Имеются гибкие средства ввода вывода через Internet.

    Большое число специализированных усовершенствований. Например, параметры настройки безопасности, новые мощные средства импорта экспорта, новые опции построения условий выбора наблюдений, интеллектуальные редакторы Отчетов, средства построения графиков и оформления мультимедийных таблиц, возможность отмены и повтора нескольких последних действий и многое другое.

    STATISTICA Общий обзор

    Управление выводом в STATISTICA

    Рабочие книги STATISTICA

    Таблицы данных в STATISTICA

    MKSTAT - сервер отраслевой статистики Минкультуры России

    Руководство пользователя АИС «Статистическая отчетность отрасли»

    Если в форме большое число разделов, то при вводе пояснительной записки поле выбора пути к файлу пояснительной записки и кнопка Сохранить могут быть не видны одновременно

    Для ориентирования в больших таблицах рекомендуется включить флажок Показывать подсказку (в левом верхнем углу формы) (см. Рис. 10 ). Если поле Показывать подсказку отмечено галкой, то при перемещении по ячейкам формы в окне подсказки можно включить отображение названия текущего элемента формы. Смена отображаемого значения происходит при перемещении курсора мыши или изменении текущего элемента путем нажатия клавиши табуляции. Окно подсказки может быть перемещено на удобное место с помощью курсора мыши. При прокрутке страницы оно будет автоматически перемещаться, сохраняя свою позицию на экране.

    Поля Разделы подробно, Графы подробно и Строки подробно позволяют установить удобный вид формы, показывать названия разделов, граф и строк для матрицы раздела, если соответствующие поля отмечены галкой, или показывать только их номер.

    На форме цветом отображаются поля, для которых значения зафиксированы в описании формы или которые рассчитываются автоматически и не могут быть изменены вручную. А поля, для которых определены формулы расчета значений, но которые, тем не менее, могут быть изменены вручную, отображаются цветом:.

    Для перехода между полями ввода можно использовать клавиши Ввод или Таб. Направление обхода полей задается в поле перебор полей по вертикали. Если в этом поле нет галки, то при нажатии клавиши Ввод осуществляется переход в соседнюю ячейку в той же строке, если поле отмечено галкой, то переход осуществляется в соседнюю ячейку в той же графе.

    Для разделов форм, содержащих переменное количество строк, которые формируются путем ввода показателя в поле ввода или выбора значения из справочника, на форме появляются кнопки Добавить строку и Удалить строку. При нажатии на строку появляется новая строка, для текущего раздела формы отчетности, над кнопкой. Для удаления строки выберите ее курсором мыши или кнопкой табуляции и нажмите кнопку Удалить строку .

    Рис. 12. Форма ввода данных раздела

    При открытии отчета пользователем система блокирует отчет от редактирования другими пользователями. При попытке открыть заблокированный отчет пользователю выводится сообщение о блокировке документа, сам отчет открывается в режиме чтения информации (отсутствуют кнопки для редактирования или сохранения отчета).

    Рис. 13. Сообщение о блокировке отчета

    Документ будет разблокирован в следующих случаях:

    · Пользователь, заблокировавший документ, закрыл окно редактирования отчета либо была прервана сессия работы (например, выключился компьютер).

    · Сработал таймаут на блокировку отчета. Время блокировки настраивается администратором системы. Значение по умолчанию 1 час. Время отсчитывается с момента открытия документа и продлевается при каждом сохранении отчета.

    · Администратор системы принудительно снял блокировку с отчета.

    Для отметки завершения ввода, следует отметить галкой поле Ввод данных завершен. если при этом в протоколе обработки данных остаются ошибки, то система потребует приложить пояснительную записку. Это можно сделать в последнем разделе списка разделов в левой части формы.

    Рис. 14. Форма прикрепления пояснительной записки

    Предоставление отчетности в форме загрузки файлов наиболее удобно для тех организаций, которые используют для формирования отчетности свои информационные системы, а также удобна для ситуации, когда подключение к Интернет осуществляется по медленным или неустойчивым каналам связи.

    Для загрузки данных в АИС «Статистика» выполните следующие действия:

    Для создания отчета используйте выгруженный с сайта шаблон формы статистики (см. п. 4.3 Выгрузка шаблона форм статистики ).

    Нельзя использовать иные шаблоны форм при работе с АИС «Статистика». Для подготовки отчета по новой или измененной форме, загрузите шаблон файла с портала

    При необходимости подготовьте файл пояснительной записки в разрешенном формате (pdf, zip, rar, tiff, jpg, 7z) с учетом требований, описанных в разделе 6.5 Правила создания файлов отчетов, пояснительной записки, подписанного отчета.

    Для загрузки отчетов выберите пункт меню Загрузка данных в базу статистики (пункт меню Загрузка в АИС «Статистика» -> Загрузка данных в базу статистики). Откроется окно Загрузка отчета (см. Рис. 15 ):

    Рис. 15. Страница загрузки отчетов в базу статистики

    1. Для загрузки отчета в формате Excel выберите форму статистической отчетности из выпадающего списка Форма и период за который представляется отчет в поле За период.

    2. Затем нажмите кнопку Обзор напротив поля «Отчет в формате Excel». В открывшемся окне Выбор файла для выгрузки выберите подготовленный файл и нажмите кнопку Открыть.

    3. Для загрузки пояснительной записки нажмите кнопку Обзор напротив поля «Пояснительная записка». В открывшемся окне Выбор файла для выгрузки выберите подготовленный файл и нажмите кнопку Открыть.

    4. Нажмите на кнопку Загрузить. Результаты операции загрузки файлов отобразятся на странице.

    Файл Пояснительной записки нужно загружать только в том случае, если в отчете имеются данные, которые не могут пройти логический контроль, но по тем или иным причинам не могут быть изменены. Для изложения этих причин и предназначен файл Пояснительной записки .

    Файл Пояснительной записки без загрузки файла отчета не может быть загружен. При попытке загрузить файл пояснительной записки без отчета, система выдаст сообщение «Отчет?».

    При загрузке отчетов по формам, форматно-логический контроль которых содержит ссылки на другую форму того же отчетного периода должна быть следующая последовательность загрузки: первая форма, вторая форма, первая форма (потому, что при первой загрузке заведомо будет ошибка отсутствия данных второй формы).

    При загрузке файлов возможны сообщения об ошибках, перечень которых приведен в таблице в разделе 6.6 Перечень об ошибках загрузки файлов .

    Отсканируйте подписанный отчет и сохраните его в разрешенном формате (pdf, zip, rar, tiff, jpg, 7z) с учетом требований, описанных в разделе 6.5 Правила создания файлов отчетов, пояснительной записки, подписанного отчета.

    Загрузка подписанного отчета производится после загрузки отчета в формате Excel, в котором нет формальных ошибок (статус – зелёный ) или, при наличии формальных ошибок, после утверждения отчета.

    1. Для загрузки подписанного отчета нажмите кнопку Обзор напротив поля «Подписанный отчет» (см. Рис. 15 ). В открывшемся окне Выбор файла для выгрузки выберите подготовленный файл и нажмите кнопку Открыть.

    2. Нажмите на кнопку Загрузить. Результаты операции загрузки файла отобразятся на странице.

    1. Файлы со статистическими данными, предназначенные для загрузки в БД, должны быть подготовлены на основании шаблона размещенного в системе в MS Excel в формате XLS (Excel 97-2003).

    Недопустимо вносить изменения в формат шаблона, это может привести к неверной обработке данных.

    Ячейки с данными в обязательном порядке должны быть заполнены (при отсутствии данных – нулем).

    2. Файлы с документами, сопроводительными к файлам данных. должны быть в в одном из разрешенных форматов формате (pdf, zip, rar, tiff, jpg, 7z) .

    3. После загрузки файлов отчета и подписанного файла система автоматически присваивает им имена в формате:

    А имена файлов пояснительной записки в формате:

    NN – код регионального органа управления в сфере культуры по справочнику КОПУК, например, «010356»;

    ФФФ – код формы статистической отчетности;

    ГГММ – год (ГГ) и месяц (ММ) отчетного периода;

    p – строчная (маленькая) буква латинского алфавита.

    · Архив. - см. пункт 7.4

    Форма Данные статистики за отчетный период обеспечивает анализ статистических отчетов «в совокупности» различными средствами.

    Для просмотра Данных статистики за отчетный период в АИС «Статистическая отчетность отрасли» выберите пункт меню Данных статистики ( пункт меню Загрузка в АИС «Статистика» -> Данных статистики). Откроется окно Данных статистики за отчетный период:

    Рис. 16. Закладка Отчеты страницы Данные статистики за отчетный период

    Для поиска отчетов используйте Фильтр поиска. Задав требуемые условия поиска нажмите кнопку Новый поиск. На закладках Отчеты \ По подразделениям будет представлена информация по отчетам, удовлетворяющим заданным условиям.

    При использовании фильтров следует идти сверху вниз, сначала указывается период, за который нужно найти отчеты. Он может быть задан выбором года и периода отчетности в поле За период. либо интервалом дат Период с по. В поле Код формы отобразятся те формы, которые сдаются в выбранный период. После выбора формы из этого выпадающего списка в группе полей Организации отобразятся те организации, которые сдавали или должны сдать отчеты для выбранных периода и формы. Если не одно поле не помечено галкой в этой группе, то фильтрации данных по организациям не осуществляется. Если какое-то поле помечено галкой, то соответствующий фильтр по организациям используется. Для изменения состава организаций для поиска по ним следует нажать иконку . При этом откроется форма выбора организаций.

    Поле Статус отчета позволяет отобрать отчеты с определенным статусом.

    Поле Отчеты позволяет фильтровать отчеты с учетом их завершенности: только завершенные, только незавершенные, все.

    Поиск сведений по отчетам организаций ограничен их принадлежностью, так например, музей или образовательное учреждение могут увидеть только свои отчеты и отчеты своих филиалов. Органы управления в сфере культуры могут увидеть отчеты только тех организаций, которые действуют на их территории. Для этого должно быть отмечено поле Иные. Если отмечено поле Свои. то поиск осуществляется только по отчетам, сданным организацией, от имени которой действует пользователь.

    В табличной форме представлены найденные записи об отчетах, можно изменять количество отчетов на странице, изменять порядок вывода записей нажатием на заголовок графы, по которой надо изменить порядок следования записей, переходить по ссылкам на страницы.

    В нижней части формы отображаются сведения о «легенде» иконок цветовой индикации и количестве записей с соответствующим статусом.

    В закладке Отчеты представлены записи о статистических отчетах, удовлетворяющих условиям фильтрации.

    Рис. 17. Закладка Отчеты страницы Данные статистики за отчетный период ( с результатами поиска)

    В таблице указываются:

    · № п/п – номер строки;

    · Форма – название формы отчета;

    · Территория – наименование территории;

    · КОПУК – код подразделения согласно классификатору организаций, предприятий, учреждений культуры;

    · Подразделение - наименование подразделения;

    · Период - последний месяц отчетного периода;

    · Статус - статус отчета;

    · Утвержден - пометка об утверждении отчета Администратором системы;

    · Загружен – дата загрузки отчета;

    · Завершен – признак завершенности отчета;

    · E - cтолбец отметки наличия отчета в формате Excel;

    · W - cтолбец отметки наличия пояснительной записки к отчету в формате PDF;

    · P - cтолбец отметки наличия подписанного файла в формате PDF к пояснительной записке.

    Статус отчета определяет состояние представленного отчета, отображается цветными кружками:

    · - данные полностью предоставлены и проверены в рамках раздела, но возможны ошибки в рамках формы;

    · - данные не загружены, срок сдачи формы отчетности еще не прошел

    · - данные загружены, срок сдачи формы отчетности уже прошел

    Для просмотра содержания результатов формально-логического контроля щелкните на иконку статуса (цветной кружок): откроется окно с текстом результата формально-логического контроля.

    Иконка позволяет перейти просмотру или вводу отчета в форме ручного ввода. Доступность ввода данных определяется статусом отчета и фактом его утверждения администратором.

    Иконка позволяет перейти к загрузке отсканированного образа отчета. Выберите в открывшейся форме файл отчета и нажмите на кнопку Загрузить для загрузки подписанного отчета.

    Рис. 18. Загрузка подписанного отчета

    Если отчет блокирован каким-либо пользователем (открыт на редактирование), то он помечен иконкой . Администратор имеет возможность снять блокировку с документа.

    По ссылке производится выгрузка отображаемой таблицы в формате Excel. По ссылке производится выгрузка отчетов в виде ZIP-архива. По ссылке производится выгрузка пояснительных записок в виде ZIP-архива. По ссылке производится выгрузка подписанных отчетов в виде ZIP-архива.

    Для оперативной проверки отдельных статистических параметров реализована форма Значение ячейки по подразделениям статистики. Форма позволяет просматривать данные непосредственно в базе данных.

    Для просмотра данных непосредственно в базе данных нажмите на пункт меню Значение ячейки по подразделениям (пункт меню Выходная информация» -> Значение ячейки по подразделениям). Откроется окно Значение ячейки по подразделениям:

    Рис. 19. Страница Значение ячейки по подразделениям

    Для поиска отчетов используйте Фильтр поиска. Задав требуемые условия поиска нажмите кнопку Новый поиск.

    На странице Диаграмма ( пункт меню Выходная информация» -> Диаграмма) графически приведены данные о количестве отчетов, представленных организациями Министерства культуры Российской Федерации в соответствии с условиями фильтрации:

    Рис. 20. Страница Диаграмма

    Нажмите на столбец диаграммы для отображения в нижней части той же страницы таблицы организаций и форм, данные которых вошли в выборку для этого столбца. Например, на Рис. 21 представлен список организаций, представивших отчеты с ошибками:

    Рис. 21. Источники данных для выбранного столбца диаграммы

    Архивные статистические данные годы хранятся в архиве (страница Список файлов ) и доступны для просмотра (и сохранения на локальном компьютере) в виде файлов. Для открытия страницы Список файлов нажмите на пункт меню Архив (пункт меню Выходная информация» -> Архив):

    Рис. 22. Страница Список файлов (Архив)

    Структура архива может быть любая, например, древовидная. Переход с уровня на уровень осуществляется по двойному щелчку.

    Для просмотра либо сохранения архивного файла щелкните мышью на иконку () рядом с именем файла.

    Загрузка файлов в архив доступна только Администратору системы.