Продукти STATISTICA. ІІІ. Огляд використання пакету statistica Neural Networks Лабораторна робота statistica neural networks

Розмір: px

Починати показ зі сторінки:

Транскрипт

2 УДК ББК Н45 Н45 Нейронні сіті. STATISTICA Neural Networks: Методологія та технології сучасного аналізу даних / За редакцією В. П. Боровикова. 2-ге вид., перераб. та дод. М: Гаряча лінія Телеком, с, іл. ISBN Викладено нейромережевые методи аналізу даних, засновані на використанні пакету STATISTICA Neural Networks (фірма виробник StatSoft), повністю адаптованого для російського користувача. Дано основи теорії нейронних мереж; велику увагу приділено вирішенню практичних завдань, всебічно розглянуто методологію та технологію проведення досліджень за допомогою пакету STATISTICA Neural Networks потужного інструменту аналізу та прогнозування даних, що має широкі застосування в бізнесі, промисловості, управлінні, фінансах. Книга містить безліч прикладів аналізу даних, практичні рекомендації щодо аналізу, прогнозування, класифікації, розпізнавання образів, управління виробничими процесами з допомогою нейронних мереж. Для широкого кола читачів, які займаються дослідженнями у банківській сфері, промисловості, економіці, бізнесі, геологорозвідці, управлінні, транспорті та інших галузях. Адреса видавництва в Інтернет Довідкове видання Нейронні мережі STATISTICA Neural Networks: Методологія та технології сучасного аналізу даних ББК Коректор В.М. Міхін Підготовка оригінал-макету О.В. Кормакова Обкладинка художника В.Г. Ситникова Підписано до друку Формат70 100/16. Ум. вид. л. 32,5. Вид ТОВ «Науково-технічне видавництво «Гаряча лінія Телеком» Надруковано в друкарні «Тіль-2004» Замовлення 05 ISBN STATISTICA Neural Networks (SNN), 2008 В. П. Боровиков, 2008

3 Передмова до другого видання Друге видання одержала популярність книги суттєво доповнено та перероблено. Написано нові розділи, присвячені введенню в аналіз даних, теорію ймовірностей, теорію нейронних мереж. Матеріал, що міститься у цих розділах, дозволяє поглиблено розуміти методологію застосування нейронних мереж. В даний час нейронні мережі інтенсивно використовуються в банках, промисловості, маркетингу, економіці, медицині та інших галузях, де потрібне прогнозування та поглиблене розуміння даних. Загальновизнано, що нейронні мережі є природним доповненням класичних методів аналізу та застосовуються там, де стандартні процедури не дають потрібного ефекту. STATISTICA Neural Networks є єдиним у світі програмним продуктом для проведення нейромережевих досліджень, повністю перекладеним російською мовою. Це означає, що весь інтерфейс (десятки діалогових віконта сценаріїв дослідження) та довідкова система STATIST1CA Neural Networks перекладені російською мовою та доступні користувачеві в єдиному середовищі. Ми включили до книги додатковий розділ з класичних методів аналізу, що дозволяє читачеві порівняти різні підходи. Окрема глава книги присвячена методам видобутку даних (Data Mining) сучасним технологіям аналізу даних, що поєднує класичні та нейромережеві моделі. У роботі над книгою взяли участь співробітники StatSoft Russia: B.C. Растунков, А.К. Петров, В.А. Панів. Всім ним ми висловлюємо щиру подяку. Наша особлива вдячність Людмилі Єкатової за складну та копітку роботу з підготовки рукопису до друку. Науковий директор StatSoft Russia В.П. Боровиків

4 Вступ Запрошення в нейронні мережі За останні кілька років інтерес до нейронних мереж суттєво зріс: вони застосовуються у фінансах, бізнесі, медицині, промисловості, техніці, геологорозвідці та інших галузях. Нейронні мережі використовуються скрізь, де потрібно вирішувати завдання прогнозування, класифікації або управління, оскільки вони застосовні практично в будь-якій ситуації, коли є зв'язок між змінними предикторами (вхідними змінними) і прогнозованими змінними (вихідними змінними), навіть якщо цей зв'язок має складну природу та її важко висловити у звичайних термінах кореляцій чи відмінностей між групами. Методи нейронних мереж можуть використовуватися незалежно або бути прекрасним доповненням до традиційних методів аналізу даних. Більшість статистичних методів пов'язані з побудовою моделей, заснованих на тих чи інших припущеннях і теоретичних висновках (наприклад, у припущенні, що залежність є лінійною або змінні мають нормальний розподіл). Нейросетевой підхід вільний від модельних обмежень, він однаково годиться для лінійних і складних нелінійних залежностей і особливо ефективний у розвідувальному аналізі даних, коли необхідно з'ясувати, чи є взагалі залежність між змінними. Сила нейронних мереж полягає у їх здатності самонавчати. Процедура навчання полягає в налаштуванні синаптичних терезів з метою мінімізації функції втрат. У цій книзі для побудови нейронних мереж використовується пакет STATISTICA Neural Networks, що має зручний інтерфейс і дозволяє проводити дослідження у діалоговому режимі. Всі діалогові вікна та підказки, включаючи електронну довідкову систему, повністю перекладені російською мовою та доступні користувачам. Нейронні мережі STATISTICA це єдиний у світі програмний продукт для нейромережевих досліджень, повністю перекладений російською мовою. Істотною перевагою пакету STATISTICA Neural Networks є те, що він природно вбудований у потужний арсенал аналітичних засобів програми STATISTICA. Саме поєднання класичних та нейромережевих методів дає потрібний ефект. Справжня книга складається з одинадцяти розділів. У першому розділі ми описуємо основні поняття аналізу даних, у другому даємо введення у теорію ймовірностей. Третій розділ містить теоретичне введення в нейронні мережі. Зауважимо, теорія ймовірностей є основою нейронних мереж. Ця глава необхідна поглибленого розуміння методів і принципів роботи нейронних мереж. У ній

5 ми описуємо знамениту формулу Байєса та правило оптимальної байєсівської класифікації. Четвертий розділ містить загальний огляд нейронних мереж, реалізованих у STATISTICA Neural Networks, знайомить читача з інтерфейсом програми, опціями, допомагає засвоїти основні напрямки аналізу. У п'ятому розділі читач навчається робити перші кроки у STATISTICA Neural Networks. У шостому розділі описуються подальші можливості нейронних мереж. Детально розглядаються мережі на основі радіально базисних функцій, описуються багатошарові персептрони, карти, що самоорганізуються, імовірнісні і узагальнено імовірнісні моделі. Розповідається, як побудувати мережу за допомогою Майстра рішень, зручного засобу проведення нейромережевого аналізу для користувачів-початківців; дається уявлення про генетичні алгоритми зниження розмірності. У сьомому розділі представлені практичні поради щодо вирішення завдань за допомогою нейронних мереж. У восьмому розділі є рішення конкретних завдань (case studies). Цей розділ особливо цікавий широкому колу читачів, оскільки показує технологію нейронних мереж у дії. Приклади охоплюють широке коло додатків: від геології та промисловості до фінансів; розглядаються завдання класифікації, розпізнавання образів, прогнозування, управління виробничими процесами. У дев'ятому розділі читач знайде короткий посібник із використання нейромережевого пакету STATISTICA Neural Networks. Десята глава присвячена методам статистики, альтернативним нейронним мережам. Тут описуються методи дискримінантного аналізу, факторного аналізу та логістичної регресії. Очевидно, користувач повинен мати можливість порівняти методи та вибрати найбільш адекватні. У одинадцятому розділі ми коротко описуємо сучасні технології видобутку даних, у яких методи нейронних мереж поєднуються з класичними методами аналізу. Наведемо типові приклади застосування нейронних мереж. У промисловості актуальним є завдання управління виробничими процесами (виробничою установкою). Наприклад, у газовій галузі промисловості ви можете налаштувати нейронну мережу та автоматично змінювати параметри, щоб контролювати якість продукту на виході. Аналогічні завдання виникають під час переробки нафти. Можна контролювати якість бензину на основі спектральних характеристик, вимірюючи спектр, відносити вироблений продукт до певного класу. Оскільки залежності носять нелінійний характер, то нейронні мережі є відповідним інструментом щодо класифікації. У фінансовій сфері актуальним завданням є споживче кредитування. За останні роки споживче кредитування інтенсивно розвивалося і стало одним із найбільш зростаючих секторів банківського бізнесу. Число фінансових установ, що надають товари та послуги у кредит, зростає

6 день за днем. Ризик цих установ залежить від того, наскільки добре вони можуть відрізняти хороших претендентів на отримання кредиту від поганих. Аналізуючи кредитну історію позичальника, можна передбачити спосіб його дій та ухвалити рішення про видачу позики або відмову в кредиті. Цікавим завданням є розрізнення електронного підпису, розпізнавання голосу, різноманітні завдання, пов'язані з геологорозвідкою Для вирішення цих завдань можуть застосовуватись нейронні мережі. Далі ми представимо ланцюжок діалогових вікон у пакеті Нейронні мережі STATISTICA та покажемо, як організований діалог із користувачем системи. Звернемо увагу на зручний інтерфейс та наявність інструментів Майстра рішень та Конструктора мереж, що дозволяють користувачам конструювати власні мережіта вибирати найкращі. Отже, перш за все запустимо пакет STATISTICA Neural Networks. Крок 1. Починаємо зі стартової панелі (рис. 1). Мал. 1. Стартова панель нейронних мереж У цій панелі можна вибрати різні види аналізу, які потрібно виконати: регресію, класифікацію, прогнозування часових рядів, кластерний аналіз. Виберіть, наприклад, часові ряди, якщо хочете побудувати прогноз. Далі слід вибрати інструмент рішення у розділі Інструмент. Для початківців рекомендується вибрати Майстер рішень, для досвідченого користувача використовувати Конструктор мереж. Ми

7 оберемо Майстер рішень. Крок 2. Натиснувши Дані, відкрийте файл даних. Якщо файл вже відкритий, натискати цю кнопку не слід. При натисканні кнопки Додатково з'являється вікно, де є додаткові інструменти, зокрема процедури зниження розмірності, генератор коду та ін. (рис. 2). Мал. 2. Стартова панель Нейронні мережі STATISTICA Крок 3. З відкритого файлувиберемо змінні для аналізу. Змінні можуть бути безперервними та категоріальними; крім того, спостереження можуть належати різним вибіркам (рис. 3).

8 Мал. 3. Вікно вибору змінних Крок 4. Задамо тривалість аналізу, вказавши кількість мереж, що випробовуються, або час рішення (рис. 4). Мал. 4. Майстер рішень вкладка Швидкий Крок 5. Виберемо тип мереж, пропоновані програмою, з якими працюватимемо: лінійна мережа, ймовірнісна мережа, мережа, заснована на радіальних базисних функціях, багатошаровий персептрон. Можна вибрати будь-який тип мереж чи комбінацію (рис. 5).

9 Мал. 5. Майстер рішень вкладка Тип мережі Крок 6. Задамо формат подання підсумкових результатів (рис. 6). Мал. 6. Майстер рішень вкладка Крок 7. Запускаємо процедуру навчання нейронних мереж, натиснувши кнопку ОК (рис. 7).

10 Мал. 7. Відображення процесу навчання Крок 8. У вікні результатів можна проаналізувати отримані рішення. Програма відбере найкращі мережі та покаже якість рішення (рис.8). Мал. 8. Вікно результатів вкладка Швидкий Крок 9. Вибираємо певну мережу (рис. 9).

11 Мал. 9. Діалогове вікно вибору моделей Крок 10. Одним із способів перевірки є порівняння значень, що спостерігаються, і передбачуваних результатів. Порівняння спостережуваних та передбачуваних значень для обраної мережі представлено на рис. 10.

12 Pіc. 10. Таблиця значень і передбачених значень Крок 11. Зберігаємо кращі мережі з метою подальшого використання, наприклад, для автоматичної побудови прогнозів (рис. 11 і 12). Мал. 11. Стартова панель вибір та збереження мереж/ансамблів

13 Мал. 12. Стандартне вікно збереження файлу мережі Саме такий типовий сценарій дослідження в пакеті Нейронні мережі STATISTICA. Найбільш систематичний виклад міститься у інших розділах книги.

14 Розділ 9 КОРОТКЕ КЕРІВНИЦТВО У цьому розділі ви знайдете короткий посібник з роботи в системі STATISTICA Neural Networks (Нейронні мережі STATISTICA). У пакеті Нейронні мережі STATISTICA реалізовані всі типи нейронних мереж, які використовуються в даний час для вирішення практичних завдань, а також найсучасніші алгоритми швидкого навчання, автоматичного конструювання та відбору значущих предикторів. ДАНІ ВСТУП Нагадаємо ще раз, що нейронні мережі навчаються на прикладах і будують модель за навчальними даними. Навчальні дані є певною кількістю спостережень (зразків), кожному з яких зазначені значення кількох змінних. Більшість із цих змінних будуть задані як вхідні, і мережа буде вчитися знаходити відповідність між значеннями вхідних та вихідних змінних (найчастіше вихідна змінна буває одна), використовуючи для цього інформацію, що міститься в навчальних даних. Після того, як мережа навчиться, вона може бути використана для передбачення невідомих вихідних значень за пред'явленими вхідними значеннями. Таким чином, перший етап роботи з нейронною мережею пов'язаний із формуванням набору даних. Створити таблицю даних у пакеті STATISTICA (Neural Networks) можна за допомогою команди Створити меню Файл (або відповідної кнопки на панелі інструментів), вказавши кількість змінних та спостережень. Створений в результаті новий файл даних спочатку міститиме тільки порожні осередки, а значення всіх змінних у ньому буде встановлено як пропущені (рис. 9.1).

15 Мал. 9.1 Вибір вхідних/вихідних змінних, а також множин, на які поділяються змінні, проводиться всередині модуля Нейронні мережі (але вже після того, як таблиця з даними підготовлена). Однак зазвичай надходять не так: файл даних імпортується з якогось іншого пакета за допомогою команди Відкрити (при цьому потрібно вказати формат даних) або команди Зовнішні дані меню Файл, яка дозволяє створювати складні запити до різних баз даних (рис. 9.2 та 9.3).

16 Мал. 9.2 Мал. 9.3 У модулі Нейронні мережі є можливість безпосередньо зчитувати файли даних системи STATISTICA, при цьому автоматично визначаються номінальні змінні (тобто змінні, які можуть приймати одне з кількох заданих текстових значень, наприклад Пол = (Чоловік, Жін)), а такі типи даних, як дати і час, перетворюються на числове подання (на вхід

17 нейронної мережі можуть подаватися лише числові дані). Якщо ви отримуєте дані в якійсь іншій програмі (наприклад, електронних таблицях), то, перш за все, потрібно буде здійснити імпорт даних засобами STATISTICA. Окрім функції імпорту в системі STATISTICA реалізовані й інші можливості доступу до зовнішніх джерел інформації: використання буфера обміну Windows (STATISTICA розуміє формати даних у буфері обміну, які застосовуються в таких програмах, як Excel та Lotus); доступ до різних баз даних за допомогою інструмента побудови запитів STATISTICA Query. Текстові файлиз роздільниками знаками табуляції або комами можна імпортувати безпосередньо до пакету STATISTICA. При цьому за бажанням перший рядок файлу можна залишати для імен змінних, а перший стовпець для імен спостережень (рис. 9.4). Мал. 9.4 Після того, як файл даних відкритий або знову створений, його можна редагувати як звичайну таблицю середовища STATISTICA. У STATISTICA реалізовані основні операції з даними, характерні для табличних процесорів, у тому числі: редагування, виділення блоку осередків,

18 пересилання буфер обміну і т.д. Крім цього, тут є спеціальні операції для завдання типу та імен змінних та спостережень, їх додавання, видалення, переміщення та копіювання. Типи змінних та спостережень У програмі STATISTICA Нейронні мережі всі спостереження з файлу даних поділяються на чотири групи (множини): навчальні, контрольні, тестові та невраховані. Навчальна множина служить для навчання нейронної мережі, контрольне для незалежної оцінки ходу навчання, тестове для остаточної оцінки після завершення серії експериментів. Невраховуємо безліч не використовується зовсім (воно може знадобитися, якщо частина даних зіпсована, ненадійна або їх просто занадто багато). Аналогічно всі змінні поділяються на вхідні, вихідні, вхідні/вихідні (наприклад, при аналізі часових рядів) і не враховуються (останні зазвичай є «кандидатами на роль вхідних змінних», чия корисність для побудови прогнозу заздалегідь неясна, і тому в процесі експериментування деякі з них відключають). Тип змінних та спостережень задається в модулі Нейронні мережі. Кількість вхідних та вихідних змінних, а також навчальних, контрольних та тестових спостережень виводиться у відповідних полях у верхній частині стартового вікна STATISTICA Нейронні мережі. Можна змінити пропорції між типами, редагуючи установки в цих полях. Це не призведе до додавання нових або видалення наявних спостережень або змінних: змінюватиметься лише тип уже існуючих спостережень або змінних. Подібна операція використовується для формування незміщеної контрольної множини. Спочатку потрібно вказати розмір цієї множини (зазвичай на неї приділяється половина всього набору даних, а інша половина на навчальну; якщо ж необхідно ще й тестове безліч, то файл треба розбити на три частини). Потім, за допомогою опції Випадковий вибір, всі наявні спостереження випадковим чином розподіляються по різним типам. При першому читанні файлу даних у програмі STATISTICA Нейронні мережі необхідно визначити, які зі змінних будуть вхідними, а вихідними; так само і для спостережень необхідно задати параметри вибірок для навчання, перевірки, тестування. Налаштування, що стосуються змінних, необхідно проводити на стартовому вікні модуля Нейронні мережі, а установки, що стосуються спостережень, потрібно проводити за допомогою інструмента Вибірки у діалоговому вікні завдання параметрів аналізу (на нього ви переходите після стартового вікна). Зауважимо, однак, що якщо задана змінна ідентифікація вибірок, її необхідно задавати на стартовому вікні при заданні вхідних/вихідних змінних. Імена змінних та спостережень Є можливість присвоювати імена окремим змінним та/або

19 спостережень. Це робиться за допомогою команди Специфікації змінних, команди Усі специфікації змінних, Менеджер спостережень меню Дані. Можна і просто двічі натиснути на ім'я в полі заголовка рядка або стовпця, і ім'я можна буде ввести безпосередньо до таблиці. У програмі STATISTICA Нейронні мережі не потрібно обов'язково надавати імена спостереженням або змінним. Якщо ім'я було задано, то таблиці виводиться умовне ім'я, прийняте за умовчанням. Визначення змінної (номінальні значення) У програмі STATISTICA Нейронні мережі є спеціальні можливості для роботи з категоріальними (номінальними) змінними. Для номінальних змінних є спеціальні методи перетворення значень, а тип вихідних змінних дозволяє відрізнити завдання класифікації (де використовуються номінальні змінні) від завдань регресії (де використовуються числові змінні). Змінна може бути чисельною, чи номінальною, але не те й інше разом. Щоб визначити номінальну змінну в пакеті STATISTICA Нейронні мережі, потрібно вибрати цю змінну як категоріальну (або на вкладці Швидкий, натиснувши кнопку Змінні, або перейти на вкладку Додатково і натиснути кнопку Тип змінної). При імпорті файлів із роздільниками знаками табуляції або комами, якщо вони містять номінальні значення (представлені рядками тексту), програма STATISTICA Нейронні мережі автоматично розпізнає їх і сама визначає потрібні номінальні значення. Додавання та видалення спостережень та змінних Додавати, видаляти, копіювати та переміщувати спостереження та змінні можна за допомогою меню Дані або безпосередньо в таблиці. Різні команди меню Дані Змінні та Дані Спостереження допомагають досягти більшої ефективності, а засоби роботи з таблицею безпосередньо зручніші у роботі. Додати нові спостереження можна двома способами: 1. Виділити якесь спостереження. Клацнути лівою кнопкою миші на заголовок цього спостереження та вибрати Додати спостереження. Можна зробити так: зайти в меню Дані Спостереження Додати. 2. Спостереження можна вставляти з буфера обміну. Для цього необхідно клацнути лівою кнопкою миші на назву спостереження або змінної, в яку ми хочемо вставити дані. Щоб видалити спостереження або групу спостережень, потрібно виділити їх через заголовки рядків, а потім натиснути Ctrl+X. Насправді, при цьому спостереження будуть поміщені в буфер обміну, тому якщо ви перемістите курсор

20 в інше місце і натиснете Ctrl+V, спостереження будуть поміщені на місце курсору, а за допомогою клавіш Ctrl+С і Ctrl+V спостереження можна копіювати і вставляти. Переміщення та копіювання змінних здійснюється аналогічно. Пропущені дані У модулі STATISTICA Нейронні мережі є спеціальні засоби для обробки пропущених даних, які аналогічні використовуваним в інших модулях STAT1STICA. Незважаючи на те, що програма STATISTICA Нейронні мережі може працювати з пропущеними даними, підставляючи замість них розумні оцінки, проте як під час навчання мережі, так і при її роботі не рекомендується використовувати пропущені значення, якщо є така можливість. Хоча буває, що обсяг наявних навчальних спостережень занадто малий, і ми змушені використовувати всі спостереження. Програма STATISTICA Нейронні мережі можуть автоматично позначати всі змінні або спостереження, що містять пропущені дані, як не враховані (щоб вони не використовувалися під час аналізу). Що саме буде оголошуватися спостереження, що не враховуються, або змінні визначається вибором користувача. Якщо в якійсь із змінних занадто багато значень пропущено, то її, можливо, варто виключити з розгляду. Якщо ж у змінної відсутня всього кілька значень, має сенс оголосити відповідні спостереження, що не враховуються. Можна рекомендувати наступну послідовність дій: спочатку оголосити зміну, що не враховується, і переглянути, скільки значень насправді відсутнє. Якщо таких рядків небагато, то знову зробити змінну вхідний, а не врахувати оголосити спостереження. У імпортованому файлі з роздільниками знаками табуляції або комами пропущені дані можуть бути позначені пропуском. МЕРЕЖІ Вступ Після того, як створено або імпортовано набір даних, можна приступати до побудови та навчання нейронних мереж. Мережа пакету STAT1STICA Нейронні мережі може містити шари для пре і постпроцессування, в яких відповідно вихідні дані перетворюються до виду, що підходить для подачі на вхід мережі, а вихідні дані до вигляду, зручного для інтерпретації. При цьому номінальні значення перетворюються на числову форму, числові значення масштабуються у відповідний діапазон, проводиться підстановка пропущених значень, а в завданнях з тимчасовими рядами формування блоків послідовних спостережень. Дані пре і постпроцесування включають набір вхідних і вихідних змінних, кожної з яких вказується її ім'я і тип, як у вихідному наборі даних.

21 Примітка щодо вхідних та вихідних змінних Набір вхідних та вихідних змінних у пакеті STATISTICA Нейронні мережі існують окремо від файлу даних. Щоб спростити процедуру побудови мережі, програма STATISTICA Нейронні мережі автоматично копіює імена та визначення змінних з набору даних до створюваної мережі, а потім відокремлює мережу та дані один від одного. Завдяки цьому мережу можна використовувати для аналізу нових даних, не звертаючись до вихідний файл(оскільки мережа пам'ятає імена та типи своїх змінних, вона знатиме, що робити). Створення мережі Щоб створити нову мережу, слід скористатися інструментом Майстер рішень або Конструктор мереж. У послідовності діалогових вікон Майстра рішень та Конструктора мереж є засоби для завдання та редагування параметрів змінних пре і постпроцессування. Попередньо, звичайно, необхідно визначити змінні та вибрати для них відповідний метод перетворення, а також архітектуру мережі. Щоб перейти до діалогу завдання параметрів аналізу, необхідно на стартовому вікні натиснути кнопку ОК. Залежно від того, яким інструментом ми користуємося, опція вибору типу мережі буде на вкладці Тип мережі (для Майстра рішень) або на вкладці Швидкий (Конструктор мереж). Якщо вирішується завдання моделювання часового ряду, то під час використання будь-якого інструменту буде доступна вкладка Тимчасові ряди. У Майстері рішень на цій вкладці встановлюються межі для вікна прогнозу (тобто числа спостережень, які використовуються для прогнозування на одне спостереження вперед). У Конструкторі мереж на цій вкладці доступні опції для визначення точного значення вікна прогнозу та параметр кількості кроків вперед. У завданнях, не пов'язаних з часовими рядами, ці опції недоступні. У завданнях аналізу часових рядів кількість кроків уперед береться рівним 1 або більше (найчастіше 1, що відповідає прогнозу на один крок вперед), а тимчасове вікно числу попередніх значень ряду, за якими прогнозуватиметься його наступне значення. Крім того, у завданнях аналізу часових рядів перед запуском відповідного інструменту слід вибрати змінну, що містить значення часового ряду, як вхідну та вихідну одночасно, оскільки ви збираєтеся передбачати наступні значення змінної за її попередніми значеннями. Якщо будується багатошаровий персептрон, можна змінювати кількість шарів у мережі; для мереж інших типів цей параметр змінювати не можна (за одним винятком: імовірнісна мережа може складатися з трьох або чотирьох шарів залежно від того, чи входить до неї матриця втрат). У опції Правка (доступна для інструмента Конструктор мереж у діалозі завдання параметрів мережі) видається інформація про змінні пре і постпроцесування, включаючи їх імена та визначення, а також функцію

22 перетворення, яка використовується для підготовки даних до подачі на вхід нейронної мережі. Можна змінювати спосіб встановлення пропущених значень і керуючі параметри перетворення. Зазвичай, пропоновані за умовчанням значення виявляються цілком підходящими. У цьому ж діалозі показано поточні параметри архітектури мережі: кількість елементів у кожному шарі та (якщо прокрутити таблицю праворуч) ширина шарів. Кількість вхідних і вихідних змінних зазвичай жорстко пов'язана з числом вхідних і вихідних змінних пре і постпроцессування, функцією перетворення і (у задачах аналізу часових рядів) розміром часового вікна. Програма STATISTICA Нейронні мережі сама визначає відповідні параметри і виводить їх сірим кольором, тим самим показуючи, що редагувати їх не можна. Кількість проміжних шарів можна змінювати довільно на власний розсуд, проте зазвичай програма пропонує їм евристично певні розумні значення за промовчанням. Ширина шару не несе ніякого функціонального сенсу, за винятком вихідного шару мережі Кохонена і, як правило, ігнорується. Для створення мережі, маючи вже завантажений набір навчальних даних, зазвичай буває достатньо: 1) Задати типи змінних у стартовому вікні (Вхідні або Вихідні). 2) Вибрати тип мережі та часові ряди. 3) Задати значення параметрів Тимчасове вікно та Прогноз вперед (тільки у задачах аналізу часових рядів). 4) Встановити кількість шарів (лише багатошарових персептронів). 5) Задати кількість прихованих елементів (якщо використовується Конструктор мереж). 6) Задати кількість елементів та ширину вихідного шару (тільки для мереж Кохонена). 7) Натиснути ОК. Редагування мереж Після того, як мережа побудована, її конструкцію можна змінювати за допомогою інструмента Редактор моделей. При цьому можна змінювати всі параметри, використані при її побудові, а також ряд додаткових характеристик. Інструмент також дозволяє змінювати імена та визначення вхідних та вихідних змінних, їх функції та параметри перетворення та методи заміни пропущених значень. Також тут є можливості для додавання нових та видалення вже існуючих змінних та зміни параметрів часового ряду (Тимчасове вікно та Прогноз вперед). Цими можливостями користуються нечасто. Крім того, редактор пре і постпроцессування дає можливість змінювати параметри класифікації, які не задаються при побудові мережі, у той час як при роботі може виникнути необхідність їх коригування. Значення параметрів класифікації застосовуються лише під час вирішення завдань класифікації, тобто. коли принаймні одна з вихідних змінних є номінальною. Під час роботи мережі програма STATISTICA Нейронні мережі приймає рішення щодо класифікації, ґрунтуючись на значеннях цих вихідних змінних. Так, якщо є номінальна вихідна змінна з трьома можливими

23 значеннями і застосовується кодування 1 з N, програма повинна вирішувати, чи, наприклад, слід трактувати вихідний вектор (0,03;0,98;0,02) як приналежність до другого класу (рис. 9.5). Мал. 9.5 Це питання вирішується завданням порогів прийняття та заперечення. При кодуванні методом 1 N рішення про класифікації приймається, якщо одне з N вихідних значень перевищить поріг прийняття, а інші виявляться нижче порога відкидання; якщо ця умова не виконується, то результат вважається невизначеним (і видається як пропущене значення). При встановлених у програмі за умовчанням значеннях порога прийняття (0,95) і відкидання (0,05) наведений вище приклад дійсно буде віднесено до другого класу. Вибір менш жорстких порогів дасть результативнішу класифікацію, але може призвести до більшого відсотка помилок. Спосіб інтерпретації значень параметрів Прийняти та Відкинути залежить від типу мережі. Для деяких типів мереж (наприклад, мереж Кохонена) великі значення призводять до великих помилок, а рішення про класифікацію приймається, якщо вихідне значення виявилося нижчим за поріг прийняття (рис. 9.6 і 9.7).

24 Мал. 9.6

25 Мал. 9.7 Редактор мережі дозволяє змінювати деякі інші параметри мережі. Так, можна змінити тип функції помилок, яка використовується під час навчання мережі та для оцінки якості її роботи. Можна також вибрати конкретні шари мережі та змінити функції активації та постсинаптичні потенційні (PSP) функції. Також можна додавати або видаляти елементи мережі. Як правило, це можна робити тільки з проміжними шарами, оскільки вхідні та вихідні елементи прив'язані до змінних пре і постпроцессування (при додаванні або видаленні змінних будуть додаватися або видалятися відповідні елементи). Виключіть складові мережі Кохонена, де можна додавати та видаляти вихідні елементи. Щоб додати або видалити приховані елементи, потрібно зайти на вкладку Шари та видалити елементи прихованого шару. Також можна використовувати засоби вирізання, копіювання та вставки стовпців таблиці ваг, яку можна редагувати на вкладці Ваги. Все це дозволяє експериментувати з різними архітектурами мереж, не створюючи мережу щоразу наново. З мережі можна видалити деякий шар повністю. Це потрібно в окремих випадках, наприклад, для відділення препроцесуючої половини автоасоціативної мережі при зниженні розмірності. У таблиці ваг показані всі ваги та пороги або для виділеного шару, або для всієї мережі. За бажання ваги та пороги можна редагувати безпосередньо, проте це дуже нехарактерно (значення ваг встановлюються алгоритмами навчання). Ці дані виводяться головним чином у тому, щоб значення ваг можна було переслати іншу програму для подальшого аналізу. НАВЧАННЯ МЕРЕЖ Після того, як мережа побудована, її потрібно навчити на наявних даних. У пакеті STATISTICA Нейронні мережі для навчання мереж кожного типу є спеціальні алгоритми, що згруповані за типами в меню Навчання (ці параметри доступні лише при використанні Конструктора мереж). Багатошаровий персептрон Для навчання багатошарових персептронів у пакеті STATISTICA Нейронні мережі реалізовано п'ять різних алгоритмів навчання. Це добре відомий алгоритм зворотного розповсюдження, швидкі методи другого порядку спуск по сполученим градієнтам і Левенберга Маркара, а також методи швидкого поширення і «дельта з рисою» (що являють собою варіації методу зворотного поширення, які в деяких випадках працюють швидше). Всі ці методи є ітераційними та способи їх застосування багато в чому схожі. У більшості ситуацій слід зупинитися на методі сполучених градієнтів, тому що тут навчання відбувається значно швидше (іноді

26 порядок величини), ніж шляхом зворотного поширення. Останній слід віддати перевагу тільки в тому випадку, коли в дуже складному завданні потрібно швидко знайти задовільне рішення, або коли даних дуже багато (близько десятків тисяч спостережень) і навіть є їхній відомий надлишок. Метод Левенберга Маркара для деяких типів завдань може виявитися набагато ефективнішим за метод пов'язаних градієнтів, але його можна використовувати тільки в мережах з одним виходом, середньоквадратичною функцією помилок і не дуже великою кількістю ваг, так що фактично область його застосування обмежується невеликими за обсягом завданнями регресії. Ітераційне навчання Алгоритм ітераційного навчання послідовно проходить ряд так званих епох, на кожній з яких на вхід мережі подається спостереження за спостереженням весь набір навчальних даних, обчислюються помилки та за ними коригуються ваги мережі. Алгоритми цього класу схильні до небажаного явища перенавчання (коли мережа добре вчиться видавати ті самі вихідні значення, що й у навчальній множині, але виявляється нездатною узагальнити закономірність на нові дані). Тому якість роботи мережі слід перевіряти на кожній епосі за допомогою спеціальної контрольної множини (крос-перевірка). За ходом навчання можна стежити у вікні Графік помилки навчання, де на графіці зображується середньоквадратична помилка на навчальній множині на цій епосі. У випадку, якщо включена перевірка крос, виводиться також середньоквадратична помилка на контрольній множині. За допомогою розміщених під графіком елементів керування можна змінювати масштаб зображення, а якщо графік повністю не міститься у вікні, під ним з'являються лінійки прокручування (рис. 9.8).

27 Мал. 9.8 Якщо потрібно порівняти результати різних прогонів навчання, потрібно натиснути кнопку Додатково у вікні навчання, а потім знову натиснути кнопку Навчити (повторне натискання кнопки Навчити без ініціалізації просто продовжить навчання мережі з того місця, де воно було перервано). Після закінчення навчання за допомогою кнопок, розташованих над полем умовних позначень, графік можна переслати до системи STATISTICA (кнопка). Важливо, що на графіку можна легко помітити ефект перенавчання. Спочатку і помилка навчання, і контрольна помилка зменшуються. З початком перенавчання помилка навчання продовжує зменшуватися, а помилка контролю починає зростати. Зростання перевірочної помилки сигналізує про початок перенавчання і свідчить про те, що алгоритм навчання починає бути деструктивним (і одночасно про те, що більш підходящою може стати мережа меншого розміру). Якщо спостерігається перенавчання, процедуру навчання можна перервати, натиснувши кнопку Стоп Stop у вікні навчання або клавішу Esc. Можна також встановити автоматичну зупинку STATISTICA Нейронні мережі за допомогою умов зупинки. Умови зупинки встановлюються в однойменному вікні, доступ до якого здійснюється через меню Навчання Закінчення аналізу. Крім максимальної кількості епох, що відводиться на навчання (яке задається на вкладці Швидкий), тут можна зажадати, щоб навчання припинялося при досягненні певного рівня помилки або коли помилка перестає зменшуватися на певну величину. Цільове значення та мінімальне зменшення можуть задаватися окремо для помилки навчання та контрольної помилки. Найкращий засіб боротьби з перенавчанням задати нульовий рівень мінімального поліпшення (тобто не допускати найменшого погіршення). Однак, оскільки при навчанні є шум, зазвичай не рекомендується припиняти навчання тільки тому, що на одній черговій епосі помилка погіршилася. Тому в системі введено спеціальний параметр покращення Вікно, в якому задається кількість епох, протягом яких має спостерігатися погіршення, і лише після цього навчання буде зупинено. У більшості випадків для цього параметра цілком підходить значення 5. Збереження кращої мережі Незалежно від того, чи застосовується рання зупинка, в результаті перенавчання ви можете отримати мережу, яка вже встигла погіршити свої властивості. У такому разі можна відновити найкращу конфігурацію мережі з усіх, отриманих у процесі навчання, за допомогою команди Краща мережа (меню Навчання Додатково) (рис. 9.9).

28 Мал. 9.9 Якщо функція Найкраща мережа включена, програма STATISTICA Нейронні мережі автоматично зберігає найкращу мережу, отриману під час навчання (за показником контрольної помилки). При цьому враховуються усі прогони навчання. Таким чином, програма STATISTICA Нейронні мережі автоматично зберігає найкращий результат усіх ваших експериментів. Можна також встановити штраф за елемент (Unit Penalty) для того, щоб при порівнянні штрафувати мережі з великою кількістю елементів ( найкраща мережазазвичай є компроміс між якістю перевірки і розміром мережі). Зворотне поширення Перед застосуванням алгоритму зворотного розповсюдження необхідно задати значення ряду параметрів, що управляють. Найбільш важливими керуючими параметрами є швидкість навчання, інерція та перемішування спостережень у процесі навчання (зауважимо тут, що перевага методу сполучених градієнтів полягає не тільки в швидкості, а й малій кількості керуючих параметрів) (рис. 9.10).

29 Рис Параметр П Швидкість навчання задає величину кроку при зміні ваги: ​​при недостатній швидкості алгоритм повільно сходиться, а за занадто великий він нестійкий і схильний до осциляцій. На жаль, величина найкращої швидкості залежить від конкретного завдання; для швидкого та грубого навчання підійдуть значення від 0,1 до 0,6; для досягнення точної збіжності потрібні набагато менші значення (наприклад, 0,01 або навіть 0,001, якщо епох багато тисяч). Іноді корисно зменшувати швидкість у процесі навчання. У програмі STATISTICA Нейронні мережі можна встановити початкове і кінцеве значення швидкості, у разі у міру навчання виробляється інтерполяція з-поміж них. Початкова швидкість визначається в лівому полі, кінцева в правому (рис. 9.11).

30 Рис Коефіцієнт інерції (Момент) допомагає алгоритму не застрягати в низинах та локальних мінімумах. Цей коефіцієнт може мати значення інтервалі від нуля до одиниці. Деякі автори рекомендують його змінювати в процесі навчання. На жаль, тут також «правильне» значення залежить від завдання і його можна знайти лише досвідченим шляхом. При використанні методу зворотного поширення зазвичай рекомендується від доби до епохи змінювати порядок спостережень, оскільки це знижує ймовірність того, що алгоритм застрягне в локальному мінімумі, а також зменшує ефект перенавчання. Щоб скористатися цією нагодою, встановіть режим Перемішувати спостереження. Оцінка якості роботи мережі Після того, як мережа навчена, варто перевірити, наскільки добре вона працює. Середньоквадратична помилка, яка видається у вікні Графік помилки навчання, є лише грубою мірою продуктивності. Більше корисні характеристики видаються у вікнах Статистики класифікації та Статистики регресії (доступ до обох відбувається через вікно Результатів аналізу). Вікно Статистики класифікації діє у разі номінальних вихідних змінних. Тут видаються відомості про те, скільки спостережень кожного класу з файлу даних (кожен з яких відповідає номінальному значенню) було класифіковано правильно, скільки неправильно і скільки не класифіковано, а також подробиці про помилки класифікації. Навчивши мережу, потрібно відкрити вікно Описові статистики (рис. 9.12).

31 Рис Статистики можуть бути отримані окремо для навчального, контрольного та тестового множин. У верхній частині таблиці наводяться сумарні статистики (загальна кількість спостережень у кожному класі, кількість класифікованих правильно, неправильно та некласифікованих), а в нижній частині крос результати класифікації (скільки спостережень з даного стовпця було віднесено до цього рядка) (рис. 9.13). Рис Якщо в цій таблиці багато відповідей Невідомо, але мало чи зовсім немає відповідей Неправильно, то, ймовірно, слід послабити пороги прийняття та заперечення (меню Правка Пре/постпроцессування Edit PrelPost Processing) (рис. 9.14).

32 Рис Вікно Статистики регресії використовується у разі числових вихідних змінних. У ньому підсумовується точність регресійних оцінок. Найбільш важливою статистикою є відношення стандартних відхилень (S.D. ratio), наведене внизу таблиці. Вона є відношенням стандартного відхилення помилки прогнозу до стандартного відхилення вихідних даних. Якби в нас взагалі не було вхідних даних, то найкраще, що ми могли б взяти як прогноз для вихідної змінної це її середнє значення за наявною вибіркою, а помилка такого прогнозу дорівнювала б стандартному відхилення вибірки. Якщо нейронна мережа працює результативно, ми маємо право очікувати, що її середня помилка на наявних спостереженнях буде близька до нуля, а стандартне відхилення цієї помилки буде менше стандартного відхилення вибіркових значень (інакше мережа давала б результат не краще, ніж просте вгадування). Таким чином, відношення стандартних відхилень значно менше одиниці, говорить про ефективність мережі. Величина, що дорівнює одиниці мінус відношення стандартних відхилень, дорівнює частці поясненої дисперсії моделі. Мережі Кохонена Алгоритм навчання мереж Кохонена в деяких відносинах схожий на алгоритми навчання багатошарових персептронів: він є ітераційним і здійснюється за епохами, при цьому на графік може бути виведена середньоквадратична помилка навчання (хоча насправді вона є середнім квадратом зовсім іншої міри помилки, ніж у багатошарових персептронах). Проте алгоритм Кохонена має низку особливостей. Найбільш істотна їх у тому, що тут некероване, тобто. даних може взагалі не міститися ніяких вихідних значень, а якщо такі є, то вони ігноруються. Робота алгоритму визначається двома параметрами: Швидкість навчання та Околиця. Навчання відбувається так: чергове спостереження подається на вхід мережі, обробляється нею, вибирається радіальний елемент, що виграв (найактивніший) (тобто елемент другого шару мережі), і потім він і його найближчі сусіди коригуються так, щоб краще відтворювати навчальне спостереження. Швидкість навчання керує ступенем адаптації, а околиця визначає

33 кількість елементів, що коригуються. Зазвичай робота алгоритму Кохонена розбивається на два етапи упорядкування та тонке налаштування, на кожному з яких швидкість навчання та розмір околиці поступово змінюються від своїх початкових значень до кінцевих. У програмі STATISTICA Нейронні мережі можна задавати початкові та кінцеві значення як швидкості навчання, так і розміру околиці. Розмір околиці визначає квадрат з центром у елементі, що виграв; нульовий «розмір» відповідає одному елементу, що виграв; «розмір 1» квадрату 3 3 з центром у елементі, що виграв; "розмір 2" квадрату 5 5 і т.д. Якщо елемент, що виграв, розташований близько до краю, то околиця обрізається (а не перекидається на протилежну). Незважаючи на те, що за своїм змістом такий параметр є цілим числом, можна задати його в речовинному вигляді, щоб точніше керувати ним, коли алгоритм починає зменшувати розмір околиці. У цьому випадку програма STATISTICA Нейронні мережі спочатку коригує це число, а потім округляє його до найближчого цілого. Після завершення роботи алгоритму навчання Кохонена слід позначити радіальні елементи значками відповідних класів (див. розділ «Топологічна карта»). ІНШІ ТИПИ МЕРЕЖ Навчання мереж інших типів відбувається досить просто; у кожному випадку є лише кілька встановлюваних параметрів навчання, і вони описані нижче. Радіальні базисні функції (РБФ) Навчання складається з трьох етапів: розміщення центрів радіальних елементів, вибір їх відхилень та оптимізація лінійного вихідного шару. Для перших двох етапів є кілька варіантів роботи алгоритму, вибір яких здійснюється у вікні Радіальна базова функція (доступ через меню Навчання); Найбільш популярним поєднанням є метод До середніх для першого етапу та До найближчих сусідів для другого. Лінійний вихідний шар оптимізується за допомогою класичного алгоритму псевдозворотних матриць (сингулярного розкладання). Програма STATISTICA Нейронні мережі дозволяє будувати гібридні РБФ мережі за рахунок вибору інших функцій активації для вихідного шару (наприклад, логістичних), і в цьому випадку для навчання цього шару можна використовувати якийсь з алгоритмів навчання багатошарових персептронів, наприклад, метод сполучених градієнтів. Лінійні мережі Тут під виглядом двошарової мережі реалізовано звичайну лінійну модель, яка оптимізується за допомогою алгоритму псевдозворотних матриць у вікні Радіальна базова функція.

34 Лінійну мережу можна застосовувати також для аналізу основних компонентів, щоб спробувати зменшити кількість змінних перед обробкою даних мережею іншого типу. Імовірнісні та узагальнено регресійні нейронні мережі PNN/GRNN Імовірнісні (PNN) та узагальнено регресійні нейронні мережі (GRNN) ґрунтуються на статистичних методах ядерних оцінок щільності ймовірності та призначені відповідно до завдань класифікації та регресії. Їх характерні прості і швидкі алгоритми навчання, але нейросетевые моделі, що виходять в результаті, виявляються великими і працюють порівняно повільно. Автоматичний конструктор мережі Процес вибору відповідного типу мережі та її архітектури може бути довгим і малопродуктивним, оскільки він складається з великої кількості проб та помилок. Більше того, оскільки в навчанні є шум, і алгоритм може застрягати в локальних мінімумах, кожен експеримент необхідно повторювати кілька разів. Цю нудну роботу можна звести до мінімуму, використовуючи реалізовані в пакеті STATISTICA Нейронні мережі можливості автоматичного конструювання мереж, при цьому використовуються досить складні алгоритми оптимізації, що дозволяють автоматично проводити великі серії експериментів та вибирати найкращу архітектуру та розмір мережі. Функції автоматичного конструювання мережі викликаються під час вибору інструмента Майстер рішень. Тут потрібно просто вказати ті типи архітектур, які повинні бути розглянуті, задати кількість ітерацій (або час аналізу), що визначає тривалість пошуку (оскільки робота алгоритму може зайняти багато часу, має сенс спочатку задати невелику кількість ітерацій, щоб оцінити, скільки часу може піти на весь пошук), і вибрати Критерій вибору мережі, що зберігається, який буде штрафувати мережу з невиправдано великою кількістю елементів. Алгоритм виконає належну серію експериментів та вкаже найкращу з отриманих мереж. Якщо цей алгоритм застосовується у задачі аналізу часового ряду, то додатково потрібно задати значення параметра Тимчасове вікно. Генетичний алгоритм відбору вхідних даних Одне з найважчих питань, які доводиться вирішувати при застосуванні нейронних мереж, це питання, які з вхідних змінних слід використовувати (рідко буває відомо заздалегідь, які важливі вирішення завдання, які немає). За допомогою інструмента Зниження розмірності,

35 доступному із вкладки Додатково стартового меню, можна в автоматичному режимізнайти відповідний набір вхідних змінних. Шляхом побудови та тестування великої кількості PNN або GRNN мереж (для завдань класифікації чи регресії відповідно) з різними наборами вхідних змінних, генетичний алгоритм (а також алгоритми з включенням та виключенням) здійснює відбір комбінацій входів та шукає найкращу з них. Як і у випадку з автоматичним конструктором мережі, ця процедура може вимагати багато часу, але саме вона часто виявляється єдиним способом вирішення завдання. У процесі роботи генетичний алгоритм породжує велику кількість пробних бітових рядків (їх число задається параметром Популяція) і штучно схрещує їх протягом заданого числа поколінь, використовуючи при цьому операції штучного відбору мутацію і схрещування, інтенсивністю яких можна керувати. Мережа PNN або GRNN навчається з заданим параметромзгладжування (розумно перед застосуванням генетичного алгоритму пропустити кілька тестів для визначення відповідного коефіцієнта згладжування), а для того, щоб надати перевагу невеликим наборам вхідних змінних, можна задати параметр Штраф за елемент. Алгоритм переглядає всі вхідні змінні, що є в наборі даних. Щоб запустити алгоритм, необхідно натиснути кнопку ОК. Коли його робота закінчиться, у таблиці в нижній частині вікна навпроти корисних змінних буде виведено слово Так, а навпроти марних Прочерк. Щоб скористатися результатами роботи алгоритму, потрібно попередньо в меню Зниження розмірності на вкладці Кінець аналізу вибрати Запустити Конструктор мереж для вибраних змінних або Запустити Майстер рішень для вибраних змінних. РОБОТА З МЕРЕЖЕЮ Отримання вихідних значень Після того, як мережа навчена, з її допомогою можна проводити аналіз даних: проганяти мережу на окремих спостереженнях з поточного набору даних, на всьому наборі даних або довільних, заданих користувачем спостереженнях. Мережею можна обробляти будь-який інший сумісний набір даних, що має вхідні змінні з такими ж іменами та визначеннями, як і в мережі. Це означає, що побудувавши мережу, ми більше не прив'язані до навчальної множини. Якщо аналізується набір даних, у якого крім входів сумісні і вихідні значення, програма STATISTICA Нейронні мережі обчислить значення помилок. При відкритті мережі або набору даних програма STATISTICA Нейронні мережі перевіряє, чи є у наборі даних змінні, сумісні з вхідними змінними мережами. Якщо такі є, їх тип у наборі даних автоматично встановлюється таким, як потрібно, проте інші змінні ігноруються. Таким чином, можна мати кілька мереж (у вигляді файлів), що працюють з


РОЗДІЛ 10 Надбудови Деякі утиліти Excel стають доступними лише після підключення надбудов. Насамперед зупинимося на надбудовах Пошук рішення та Пакет аналізу. Продемонструємо, які

Лабораторна робота 105. Застосування алгоритму кластеризації: карти Кохонена, що самоорганізуються, Основна мета Навчитися використовувати метод обробки даних «Самоорганізовані карти Кохонена». Теоретична

Лабораторна робота 3. Аналітична платформа Deductor (імпорт даних та очищення даних) (у даній роботі використовується демо-версія продукту) Deductor складається з п'яти компонентів: аналітичного додатку

ЗМІСТ Глава 13: РОЗМІЩЕННЯ КІЛЬКАХ ГРАФІКІВ Зміст ОГЛЯД...2770 МАЙСТЕР АВТОМАТИЧНОГО РОЗМІЩЕННЯ КІЛЬКАХ ГРАФІКІВ...2771 Використання вікна Майстер автоматичного розміщення декількох

БЕЗПЕКА СИСТЕМ БАЗ ДАНИХ тема 10 Лекція 10. Використання макросів у Access Макросом називають набір з однієї або більше команд, що виконують певні, часто використовувані операції, наприклад, відкриття

Лек 6 Конс зводн 1 КУРС ІСЕ 1 ЛЕКЦІЯ Тема 8: Технологія та методи обробки економічної інформації за допомогою консолідованих та зведених таблиць План 1. Поняття консолідованої таблиці. Способи консолідації.

ЛАБОРАТОРНА РОБОТА 14 Автоматична класифікація статей, пов'язаних з політикою Цей приклад заснований на "стандартному" наборі документів новин, що публікуються інтернет-сайтом lenta.ru. З цього сайту

Електронний науковий журнал«ДОСЛІДЖЕНО В РОСІЇ» 270 http://zhurnalaperelarnru/articles/2006/36pdf Застосування нейронних мереж для вирішення завдань прогнозування Солдатова ВП, Семенов ВВ ( [email protected])

Лабораторна робота 2 Тема: Технологія аналітичного моделювання у СППР. Технології аналізу та прогнозування на основі трендів Мета: вивчення можливостей та формування вміння використання універсальної

Лекція 11 ВИЛІЧЕННЯ В ТАБЛИЧНОМУ ПРОЦЕСОРІ MS EXCEL 2010 Мета лекції. Вивчити особливості проведення обчислень із використанням формул у табличному процесорі Ms Excel 2010. Питання лекції: 1. Формули

ЧАС ВИКОНАННЯ РОБОТИ: 2 години. 1. Позаурочна підготовка Оформити титульний лист. Дивись ДОДАТОК 1 2. Робота в лабораторії Основні відомості Відразу після запуску Word автоматично створює новий документ

Інструкція по роботі з програмою «Нейросимулятор» (на прикладі моделювання таблиці множення) Програма «Нейросимулятор» дозволяє створювати та застосовувати нейронні мережі персептронного типу. Мал. 1. Робоче

Розділ 1 Основи побудови діаграм Дані в електронній таблиці представлені у вигляді рядків та стовпців. При додаванні діаграми цінність цих даних можна підвищити, виділивши зв'язки та тенденції, які не

Лекція 7 курс 1 СППР 1 15.12.2012 Лекція ТЕМА 9: Інформаційні технології створення систем підтримки ухвалення рішення та методи прогнозування План: 1. Способи прогнозування в електронних таблицях MS

1. Зведення витрат, форма КС-3... 2 1.1. Створення документа, загальний опис... 2 1.2. Додавання даних у документ... 5 1.2.1. Синхронізація підсумкових значень у рядку... 6 1.2.2. Типи доданих

Навчання нейронних мереж У процесі роботи нейронна мережа реалізує деяке перетворення даних, яке в загальному виглядіможе бути описано функцією багатьох змінних Y = f (X), де = x x,...,

Глава 8 Налаштування уявлень Що таке уявлення Що таке уявлення Подання це спосіб візуалізації (або іншими словами уявлення) користувачеві інформації на підставі даних, що зберігаються

Робота 9 Форми в Access Мета роботи: навчитися створювати та редагувати форми за допомогою автоформ та в режимі майстра форм Зміст роботи 1 Види форм 2 Створення форм 1 Види форм Введення та перегляд даних

Щоб створити тест Вам необхідно: З ЧОГО ПОЧАТИ? Крок 1. Додати запитання (до тестів) до банку питань. Два способи додавання: імпорт із блокнота (створюємо файл блокнота (формат.txt), додаємо туди запитання,

Робота з табличним процесором Microsoft Excel Короткі теоретичні відомості Windows Excel дозволяє формувати та виводити на друк документи, представлені в табличному вигляді, виконувати розрахунки

1. Введення Лабораторна робота 3 Підбір параметрів Під час вирішення різних завдань часто доводиться займатися проблемою підбору одного значення шляхом зміни іншого. Для цієї мети дуже ефективно використовується

Загальна інформаціяПри плануванні випуску системи 2007 Microsoft Office розробниками було поставлено завдання зробити основні програми Microsoft Office зручніше в роботі. В результаті було створено користувальницький

Основна мета Лабораторна робота 104. Логістична регресія та ROC-аналіз Навчитися обробляти дані та прогнозувати події, використовуючи можливості логістичної регресії та ROC-аналіз. Теоретична

МЕТОД ГРУППОВОГО ОБЛІКУ АРГУМЕНТІВ Метод групового обліку аргументів, МГУА (Group Method of Data Handling, GMDH) метод породження та вибору регресійних моделей оптимальної складності. Під складністю моделі

Урок 1: Інтерфейс Excel * версія 2010 * 1.0 Вступ Дані в Excel розташовуються в «комірках», які у свою чергу утворюють стовпці та рядки. Це допомагає нам краще сприймати ці дані та дозволяє

Моделі бінарних відгуків У попередньому розділі ми провели регресійний аналіз у припущенні, що відгук змінна Тест є безперервною випадковою величиною, що має нормальний розподіл. на

Знайомство з програмою Access Access це додаток для роботи з базами даних або системи управління базами даних (СУБД). Комп'ютерні бази даних використовуються майже в усіх сферах діяльності. Вміння

Інструкція з наповнення сайту кафедри Культурологи та Соціології (Частина 2 «Редактор наповнення сайту») 1 Зміст 1 Інтерфейс редактора... 3 2 Зміна розміру редактора... 4 3 Панель інструментів...

Розділ 17 Пошук, сортування та виведення інформації в базі даних У ЦІЙ ГОЛОВІ...» Пошук та фільтрація даних» Сортування бази даних» Створення та застосування запитів Якщо потрібно знайти в базі даних певне

6 Частоти 97 Покрокові алгоритми обчислень 102 Подання результатів 105 Завершення аналізу та вихід із програми У цьому розділі розглядаються частоти, їх графічне уявлення (стовпцеві та кругові)

ПРАКТИЧНЕ ЗАНЯТТЯ 5 ТЕМА: Комплексне використання можливостей MS Word для створення великих документів МЕТА РОБОТИ: Навчитися комплексно використовувати можливості MS Word для створення великих документів

МОУ «Ліцей 43» р.о. Саранськ Методична розробка «ДОСЛІДЖЕННЯ СУБД ACCESS ПРИ СТВОРЕННІ ТА РЕДАКТУВАННІ БАЗИ ДАНИХ» Автор вчитель інформатики Жебанов А. А. Саранськ 2014 ДОСЛІДЖЕННЯ СУБД ACCESS ПРИ

РОЗДІЛ 1 Підготовка до роботи з Excel Багато читачів більшою чи меншою мірою знайомі з електронними таблицями Excel. Проте необхідно дати визначення термінів, що найчастіше зустрічаються

Практичне заняття 3. Створення звітної документації. З'єднання та консолідація даних. Зведені таблиці Мета роботи: навчитися створювати консолідацію даних у таблицях, створювати та застосовувати зведені таблиці

Практична робота 3 Створення форми Форма є об'єктом бази даних, який можна використовувати для введення, зміни або відображення даних з таблиці або запиту. Форми можуть застосовуватися для керування

Ай Ті Ві Груп Посібник з роботи з утилітою «ArpEdit» Версія 1.4 Москва, 2014 Зміст ЗМІСТ... 2 1 ВСТУП... 4 1.1 Призначення документа... 4 1.2 Призначення утиліти «ArpEdit»... 4 2

Робота з шаблонами типових документів Посібник користувача Cognitive Technologies Москва, 2015 2 АННОТАЦІЯ У цьому документі наводяться відомості про використання у програмному комплексі «Е1 Євфрат»

СТВЕРДЖУЮ Директор ДБОУ ДПО ЦПКС СПб «Регіональний центр оцінки якості освіти та інформаційних технологій» Є.В. Михайлова АІСУ «Параграф» для освітніх установСервіс НОВИЙ СПИСОК Керівництво

Лабораторна робота 6 Зведені таблиці Теоретичний розділ Поняття про зведені таблиці Для всебічного та ефективного аналізу даних великих таблиць в Excel використовуються звані таблиці.

OpenOffice.org Impress Impress програма у складі OpenOffice.org для роботи зі слайд-шоу (презентаціями). Ви можете створювати слайди, які містять багато різних елементів, включаючи текст, марковані

Введення в ACCESS Насамперед Access це система управління базами даних (СУБД). Як і інші продукти цієї категорії Access призначена для зберігання та отримання даних подання їх у зручному вигляді

Електронний майданчик FINTENDER.RU Система СТАР Сервіс обґрунтування НМЦ Москва 2017 Зміст Сервіс обґрунтування НМЦ... 3 Формування протоколу ручним введенням переліку позицій... 4 Формування протоколу

Підсистема редагування розміщення Розділ. Підсистема редагування розміщення Вікно Розміщення осередків...-1 Режим планування...-2 Режим розміщення...-2 Довжина зв'язків...-2 Активна підсхема...-2 Таблиця

СТО МІ користувача «Налаштування звітів у 1С: Підприємстві» Опис Інструкція користувача описує роботу зі звітами у програмі 1С: Підприємство. Ця інструкція дозволяє отримати навички з налаштування

На вкладці Поля діалогового вікна Параметри сторінки в полях верхнє, нижнє, ліве та праве встановлюються відступи від краю сторінок до таблиці. Від величини відступів залежить висота та ширина поля таблиці,

90 Розділ 5 Напис Ця вкладка доступна для об'єктів, у яких було набрано текст. З її допомогою можна відрегулювати внутрішні поля та вказати, чи змінюватиметься розмір об'єкта, якщо текст не вміщується

1. Вставка та створення таблиць у Word 2007 Таблиці Word застосовуються для структурування вмісту сторінки. Крім того, таблиці використовуються для обчислень. У Word використовується технологія вставки та створення

Робота з примітками Про примітки Примітка являє собою інформацію (дані), що відноситься до комірки та зберігається незалежно від вмісту цієї комірки. Це може бути будь-яка інформація, що пояснює,

Організація захисту документів засобами пакету Microsoft Office 2010 Мета роботи навчитися організовувати захист текстових документів, захист електронних таблиць, захист баз даних Виконавши цю роботу,

Пошук і заміна даних Пошук даних Пошук даних можна проводити на всьому аркуші або у виділеній області аркуша, наприклад, лише в деяких стовпцях або рядках, а також одразу у всій книзі. 1. У групі

1. Текстовий процесор OpenOffice.org Writer. Введення та форматування тексту Загальні відомостіТекстовий процесор Writer на сьогоднішній день є найвідомішим додатком OpenOffice.org. Як текстовий

Модуль "Контроль розкладу руху". Коротка інформація...3 Перші настоянки...3 Панель управління модуля «Контроль розкладу руху»...4 Робота з редактором маршрутів...4 Склад редактора...4 Точки

Багатошаровий персептрон У багатошаровому персептроні нейрони розташовані в кілька шарів Нейрони першого шару отримують вхідні сигнали перетворюють їх

Порядок оновлення релізів конфігурацій ЗРОБІТЬ АРХІВНУ КОПІЮ ВАШОЇ ІНФОРМАЦІЙНОЇ БАЗИ. Перед внесенням будь-яких змін необхідно зробити архівну копію вашої інформаційної бази на жорсткому диску,

ПРАКТИКУМ Базові навички роботи в Deductor Studio 5.2 Заняття 7. Використання скриптів Введення Скрипти призначені для автоматизації процесу додавання до сценарію однотипних гілок обробки.

Модуль інтеграції системи Нормування матеріалів та САПР ТП ВЕРТИКАЛЬ Посібник користувача Інформація, що міститься в даному документі, може бути змінена без попередження. Жодна

Завдання 2. Створення та редагування таблиць. Робота зі схемою даних Мета завдання: Навчитися створювати нову базуданих, створювати та редагувати структуру таблиць та встановлювати зв'язки між ними, використовуючи

За редакцією В.П. Боровікова

2-ге вид., перераб. та дод.

2008 м.

Тираж 1000 екз.

Формат 70x100/16 (170x240 мм)

Виконання: у м'якій обкладинці

ISBN 978-5-9912-0015-8

ББК 32.973

УДК 004.8.032.26

Анотація

Викладено нейромережевые методи аналізу даних, засновані на використанні пакету STATISTICA Neural Networks (фірма виробник StatSoft), повністю адаптованого для російського користувача. Дано основи теорії нейронних мереж; велику увагу приділено вирішенню практичних завдань, всебічно розглянуто методологію та технологію проведення досліджень за допомогою пакету STATISTICA Neural Networks – потужного інструменту аналізу та прогнозування даних, що має широкі застосування в бізнесі, промисловості, управлінні, фінансах. Книга містить безліч прикладів аналізу даних, практичні рекомендації щодо аналізу, прогнозування, класифікації, розпізнавання образів, управління виробничими процесами з допомогою нейронних мереж.

Для широкого кола читачів, які займаються дослідженнями у банківській сфері, промисловості, економіці, бізнесі, геологорозвідці, управлінні, транспорті та інших галузях.

Передмова до другого видання

Вступ. Запрошення до нейронних мереж

Глава 1. ОСНОВНІ ПОНЯТТЯ АНАЛІЗУ ДАНИХ

Глава 2. ВСТУП В ТЕОРІЮ ІМОВІРНОСТЕЙ

Глава 3. ВСТУП В ТЕОРІЮ НЕЙРОННИХ МЕРЕЖ

Глава 4. ЗАГАЛЬНИЙ ОГЛЯД НЕЙРОННИХ МЕРЕЖ
Паралелі з біології
Базова штучна модель
Застосування нейронних мереж
Пре- та постпроцесування
Багатошаровий персептрон
Радіальна базова функція
Ймовірнісна нейронна мережа
Узагальнено-регресійна нейронна мережа
Лінійна мережа
Мережа Кохонена
Завдання класифікації
Завдання регресії
Прогнозування часових рядів
Відбір змінних та зниження розмірності

Глава 5. ПЕРШІ КРОКИ У STATISTICA NEURAL NETWORKS
Починаємо роботу
Створення набору даних
Створення нової мережі
Створення набору даних та мережі
Навчання мережі
Запуск нейронної мережі
Проведення класифікації

Глава 6. ПОДАЛЬШІ МОЖЛИВОСТІ НЕЙРОННИХ МЕРЕЖ
Класичний приклад: Іриси Фішера
Навчання з крос-перевіркою
Умови зупинки
Розв'язання задач регресії
Радіальні базисні функції
Лінійні моделі
Мережі Кохонена
Імовірнісні та загально-регресійні мережі
Конструктор мереж
Генетичний алгоритм відбору вхідних даних
Тимчасові ряди

Глава 7. ПРАКТИЧНІ ПОРАДИ З РІШЕННЯ ЗАВДАНЬ
Подання даних
Виділення корисних вхідних змінних.
Зниження розмірності
Вибір архітектури мережі
Користувальницькі архітектури мереж
Тимчасові ряди

Глава 8. ПРИКЛАДИ ЗАСТОСУВАННЯ (CASE STUDIES)
Приклад 1. Зниження розмірності в геологічному дослідженні
Приклад 2. Розпізнавання образів
Приклад 3. Нелінійна класифікація двовимірних множин
Приклад 4. Сегментація різних зразків палива за даними лабораторного дослідження
Приклад 5. Побудова моделі поведінкового скорингу
Приклад 6. Апроксимація функцій
Приклад 7. Прогнозування продажу нафти
Приклад 8. Моніторинг та передбачення
температурного режиму на установці
Приклад 9. Визначення достовірності цифрового підпису

Глава 9. КОРОТКЕ КЕРІВНИЦТВО
Дані
Мережі
Навчання мереж
Інші типи мереж
Робота з мережею
Пересилання результатів до системи STATISTICA

Глава 10. КЛАСИЧНІ МЕТОДИ, АЛЬТЕРНАТИВНІ НЕЙРОННИМ МЕРЕЖАМ
Класичний дискримінантний аналіз у STATISTICA
Класифікація
Логіт-регресія
Факторний аналіз у STATISTICA

Глава 11. Видобуток даних у STATISTICA

Додаток 1. Генератор коду

Додаток 2. Інтеграція STATISTICA з ERP-системами

Список літератури

Предметний покажчик

Ці книги можна придбати в офісі StatSoft.

Популярне введення в сучасний аналіз даних та машинне навчання на Statistica

В.П. Боровиків

Об'єм: 354 стор.

Ціна: 1000 руб.

Популярно та захоплююче висвітлено сучасні можливості аналізу даних та машинного навчання, що є трендом сучасної комп'ютерної аналітики. У викладі акцент робиться на розумінні методів та їх застосуванні до практичних завдань. "Робіть слідом за нами, і ви навчитеся аналізувати дані!" - Основний лейтмотив книги.

Докладно описані класичні статистичні методи, включаючи багатовимірні методи: кластерний, дискримінантний аналіз, множинна регресія, факторний аналіз, метод основних компонентів, аналіз виживання та регресія Коксу. В окремих розділах викладено нейромережеві методи, методи видобутку даних, дерева класифікації та регресії (CART – моделі). Розглянуто приклади з різних галузей людської діяльності: промисловості, рітейлу, інфокомунікацій, бізнесу, медицини. Спеціальні розділи присвячені теорії ймовірностей та методів оптимізації, що лежать в основі методів машинного навчання.

Для широкого кола читачів: інженерів, технологів, менеджерів, аналітиків, лікарів, дослідників, які цікавляться сучасними аналітичними методами та технологіями аналізу даних та машинного навчання та їх застосуванням на практиці.

Популярне введення у сучасний аналіз даних у системі STATISTICA

В.П. Боровиків

Об'єм: 288 стор.

В унікальній книзі наукового директора StatSoft Володимира Боровикова зібрано все найкраще, що відомо у галузі аналізу даних.

На простих, зрозумілих прикладах з бізнесу, маркетингу, медицини описані сучасні методи аналізу даних - візуальний аналіз та графічне представлення даних, описові статистики, методи класифікації та прогнозування.

Книга є освітнім стандартом у галузі аналізу даних у провідних вузах Росії: НДУ МІЕМ ВШЕ, МДУ, Кубанський державний університетта ін.

Велика увага приділяється систематиці аналізу даних, починаючи від описового аналізу, чищення та верифікації даних, візуального подання, угруповання та методів класифікації до новітніх технологійнейронних мереж та data mining, що дозволяють знайти закономірності у ваших даних.

Теорія ймовірностей, математична статистика та аналіз даних: Основи теорії та практика на комп'ютері. STATISTICA. EXCEL. Понад 150 прикладів вирішення завдань

Халафян А.А., Боровіков В.П., Калайдіна Г.В.

Об'єм: 320 стор.

Ціна: 600 руб.

Надіслати заявку можна на адресу

Сучасний рівень розвитку комп'ютерних технологій дозволяє вивчення теорії ймовірностей та математичної статистики вивести на новий освітній рівень, наголосивши на прикладній частині дисципліни – математичну статистику та комп'ютерний аналіз даних.

У навчальному посібнику викладено елементи комбінаторики, різні способи обчислення ймовірностей, дано поняття випадкової величини, її функціональні та числові характеристики. Теоретичний матеріал супроводжується прикладами та спеціально підібраними завданнями, що дозволяють глибше вивчити матеріал. В окремому розділі описано використання Excelі STATISTICAна вирішення прикладних завдань. Excel входить до складу Microsoft Office і на сьогоднішній день є одним із найпопулярніших додатків у світі. STATISTICAзаймає лідируючу позицію серед програм аналізу даних, має понад мільйон користувачів по всьому світу. Програму повністю русифіковано, створено Інтелектуальний портал знань, який представляє глобальний мультимедійний ресурс для широкого кола користувачів: школярів, студентів, аспірантів – усіх бажаючих розвинути свій інтелект, познайомитись із сучасними технологіями комп'ютерного аналізу даних.

Навчальний посібник адресовано широкому колу учнів та викладачів, студентам, бакалаврам гуманітарних та природничо-наукових спеціальностей нематематичного спрямування, які вивчають вищу математику.

Нейронні сіті STATISTICA Neural Networks: Методологія та технологія сучасного аналізу даних

За ред. В.П. Боровікова

Об'єм: 392 стор.

Надіслати заявку можна на адресу

У книзі викладено нейромережні методи аналізу даних, що базуються на використанні пакета STATISTICA Neural Networksповністю адаптованого для російського користувача.

Дано основи теорії нейронних мереж; велику увагу приділено вирішенню практичних завдань, всебічно розглянуто методологію та технологію проведення досліджень за допомогою пакету. STATISTICA Neural Networks– потужний інструмент аналізу даних, побудови залежностей, прогнозування, класифікації.

В даний час нейронні мережі інтенсивно використовуються в банках, промисловості, маркетингу, економіці, медицині та інших галузях, де потрібне прогнозування та поглиблене розуміння даних. Загальновизнано, що нейронні мережі є природним доповненням класичних методів аналізу та застосовуються там, де стандартні процедури не дають потрібного ефекту.

Книга містить безліч прикладів аналізу даних, практичні рекомендації щодо аналізу, прогнозування, класифікації, розпізнавання образів, управління виробничими процесами з допомогою нейронних мереж.

Книга буде корисною для широкого кола читачів, що займається дослідженнями у банківській сфері, промисловості, бізнесі, геологорозвідці, управлінні, транспорті та інших галузях.

STATISTICA: мистецтво аналізу даних на комп'ютері (2-е видання)

+ Мультимедійний Підручник StatSoft

В. П. Боровиков

Об'єм: 700 стор.

На даний час книга відсутня у продажу. Найближчим часом планується нове видання книги. Ваші заявки, будь ласка, надсилайте на адресу:

Книга є найбільш фундаментальним текстом із сучасного аналізу даних і включає близько 700 сторінок опису методів та процедур аналізу даних. Друге видання книги доповнено новими матеріалами, не включеними до попередньої версії книги, зокрема: описаний аналіз потужності, оцінка обсягу вибірки, приватні кореляції, аналіз головних компонентів, дана нова інтерпретація нейронних мереж та багато іншого. До книги додається компакт-диск, де Ви знайдете демо-версії програмних продуктів StatSoft, приклади аналізу даних, знаменитий електронний підручник StatSoft, підручник з промислової статистики, матеріали навчальних курсів, а також величезна кількість даних для навчання та проведення самостійних досліджень.

Головну особливість другого видання представляє новий розділ про мову STATISTICA Visual Basic (SVB), що розширює можливості системи STATISTICAі дозволяє користувачам створювати власні програми.

У книзі з прикладу реальних даних докладно описані основні поняття аналізу даних у системі STATISTICA: дескриптивний та візуальний аналіз, аналіз таблиць сполученості, побудова залежностей, множинна регресія, аналіз виживання, непараметричні методи, аналіз відповідностей, нейронні мережі, класифікація та прогнозування за допомогою нейронних мереж, контроль якості, планування експериментів, включаючи найрізноманітніші плани та багато іншого.

Особливість книги полягає в тому, що Ви не тільки бачите результати аналізу, але й можете повторити їх за нами на системі STATISTICA, таким чином, використовуючи новітні комп'ютерні технологіїаналізу даних від StatSoft, Ви вчитеся крок за кроком аналізувати та розуміти дані.

Дане фундаментальне видання розраховане на найширше коло читачів та користувачів системи STATISTICA, які бажають стати професіоналами в аналізі даних у різних галузях: бізнесі, маркетингу, фінансах, управлінні, економіці, промисловості, страхуванні, медицині та інших додатках

Прогнозування у системі STATISTICAу середовищі WINDOWS

В.П. Боровиков, Г.І. Івченка

Об'єм: 368 стор.

На даний час книга відсутня у продажу.

Секрети прогнозування із перших рук.

Особливістю книги є поєднання двох взаємопов'язаних та взаємодоповнюючих один одного частин: практичної, в якій докладно, з перекладом основних опцій та діалогових вікон, описано прогнозування у сучасній версії системи STATISTICA, і теоретичної, в якій викладено основні ідеї, методи та результати теорії стохастичного прогнозування

На думку авторів, синтез теорії та практики має призвести до того, що читач не тільки механічно освоює методи та прийоми прогнозування, а отримує пов'язане уявлення про них: від знайомства з математичними основами до набуття практичних навичок у системі STATISTICA.

В основі книги лежить курс, який читають автори в Московському державному інституті електроніки та математики (МДІЕМ - Технічний Університет). Додаток містить вичерпний англо-російський словник основних термінів прогнозування.
Книга орієнтована на науковців, аналітиків та фахівців, які використовують методи прогнозування у повсякденній діяльності, а також може бути використана викладачами вищих навчальних закладів під час читання курсів з прогнозування та математичної статистики.

Геостатистика. Теорія та практика

В.В. Дем'янов, Є.А. Савельєва

Об'єм: 327 стор.

На даний час книга відсутня у продажу.


Ця книга відповість на запитання:
- Що таке геостатистика?
- Які існують методи просторової інтерполяції?
- Що таке кригінг?
- Чим корисна варіограма?
- навіщо потрібне стохастичне моделювання?
і багато інших

У монографії докладно викладено методи геостатистики та суміжних розділів просторового моделювання. Виклад теорії супроводжується прикладами використання моделей у різних галузях: екології, геології, гідрогеології, нафтовидобутку, енергетиці, оцінці рибних запасів тощо. У заключному розділі окреслено основні напрямки розвитку сучасної геостатистичної теорії. Видання може бути використане як навчальний посібник.

Матеріал викладається з поступовим ускладненням. Для закріплення отриманих знань є питання та вправи. До книги включені додатки, що дозволяють використовувати її як довідник геостатистики.


Академія Аналізу Даних StatSoft також пропонує широкий вибір курсів за сучасними методами та технологіями аналізу даних у галузі геоаналітики.

Промислова статистика Контроль якості, аналіз процесів, планування експериментів у пакеті STATISTICA

Халафян А.А.

Об'єм: 384 стор.

На даний час книга відсутня у продажу.


Дане видання присвячене опису статистичних методів, які дозволяють при обмежених обсягах аналізованих виробів із заданим ступенем точності та достовірності судити про стан якості продукції, що випускається. Статистичний аналіз якості продукції забезпечує прийняття вірних управлінських рішень не так на основі інтуїції, а з допомогою наукових методів виявлення закономірностей в масивах числової інформації.

У підручнику розглянуто такі розділи промислової статистики як: карти контролю якості; аналіз процесів; шість сигма; планування експериментів у середовищі широко відомого у всьому світі пакету STATISTICA. Дано детальний опис технології роботи з модулями програми.

Видання адресоване студентам напрямів "Економіка", "Управління якістю", "Стандартизація та метрологія", "Метрологія, стандартизація та сертифікація", аспірантам, науковцям, викладачам вузів, аналітикам та управлінцям, а також усім, хто цікавиться статистичними методами в управлінні якістю .

Як виграти світовий чемпіонат. Методи математичної статистики в управлінні національним футболом

Петрунін Ю.Ю., Рязанов М.А.

Об'єм: 56 стор.

На даний час книга відсутня у продажу.


Сучасні методи статистики та аналізу даних призвели до створення нових наукових дисциплін – футболономіки та футболометрії. Використовуючи розроблений у них апарат, можна оцінити якість роботи державних (Міністерство спорту) та некомерційних організацій (футбольних асоціацій та спілок), розробити та застосувати методи регулюючих впливів, здатних підняти рівень національного футболу та його престиж на світовій арені.

STATISTICA– Короткий посібник користувача

Об'єм: 250 стор.

На даний час книга відсутня у продажу.

У книзі викладено основні принципи роботи з системою, розглядаються панелі інструментів, інтерфейс користувача, файли даних, практичні приклади використання пакета. Окрема глава присвячена налаштуванню системи. Також книга містить вичерпний довідник, який є короткими відомостями про найчастіше використовувані угоди, функції та можливості системи STATISTICA, та предметний покажчик.

Викладено нейромережевые методи аналізу даних, засновані використання пакета Statistica Neural Networks (фірма виробник StatSoft), повністю адаптованого російського пользователя. Дано основи теорії нейронних мереж; велику увагу приділено вирішенню практичних завдань, всебічно розглянуто методологію та технологію проведення досліджень за допомогою пакету Statistica Neural Networks - потужного інструменту аналізу та прогнозування даних, що має широкі застосування в бізнесі, промисловості, управлінні, фінансах. Книга містить безліч прикладів аналізу даних, практичні рекомендації з проведення аналізу, прогнозування, класифікації, розпізнавання образів, управління виробничими процесами за допомогою нейронних мереж. та інших областях. Зміст Передмова до другого видання Вступ. Запрошення в нейронні сетіГлава 1. Основні поняття АНАЛІЗУ ДАННИХГлава 2. ВСТУП В ТЕОРІЇ ВЕРОЯТНОСТЕЙГлава 3. ВСТУП В ТЕОРІЇ нейронних СЕТЕЙГлава 4. ЗАГАЛЬНИЙ ОГЛЯД нейронних СЕТЕЙПараллелі з біологііБазовая штучна модельПрімененіе нейронних сетейПре- і постпроцессірованіе.Многослойний персептронРадіальная базисна функціяВероятностная нейронна сетьОбобщенно-регресійна нейронна сетьЛінейная МережаМережа КохоненаЗадачі классіфікацііЗадачі регрессііПрогнозірованіе тимчасових рядовОтбор змінних і зниження размерностіГлава 5. ПЕРШІ кРОКИ В STATISTICA NEURAL NETWORKS.Начінаем работуСозданіе набору даннихСозданіе нової сетіСозданіе набору даних і сетіОбученіе сетіЗапуск нейронної сетіПроведеніе классіфікацііГлава 6. НАСТУПНІ МОЖЛИВОСТІ нейронних СЕТЕЙКлассіческій приклад: Іриси ФішераОбученіе з крос-проверкойУсловія остановкіРешеніе завдань регрессііРадіальние базисні функціїЛінійні моделі.Мережі КохоненаВірогіднісні та узагальнено-регресійні мережіКонструктор мережГенетиче ський алгоритм відбору вхідних даннихВременние рядиГлава 7. ПРАКТИЧНІ ПОРАДИ ЗА РІШЕННЯМ ЗАДАЧПредставленіе даннихВиделеніе корисних вхідних переменнихПоніженіе размерностіВибор архітектури сетіПользовательскіе архітектури сетейВременние рядиГлава 8. Приклади застосування (CASE STUDIES) Приклад 1. Зниження розмірності в геологічному ісследованіеПрімер 2. Розпізнавання образовПрімер 3. Нелінійна класифікація двовимірних множествПрімер 4 Сегментація різних зразків палива за даними лабораторного дослідження Приклад 5. Побудова моделі поведінкового скорінгаПрімер 6. Апроксимація функційПрімер 7. Прогнозування продажів нефтіПрімер 8. Моніторинг і прогнозування температурного режиму на установкеПрімер 9. Визначення достовірності цифрової подпісіГлава 9. Короткий РУКОВОДСТВОДанниеСетіОбученіе сетейДругіе типи сетейРабота з сетьюПересилка результатів в систему STATISTICAГлава 10. КЛАСИЧНІ МЕТОДИ, АЛЬТЕРНАТИВНІ нейронів СЕТЯМКлассіческій дискримінантний аналіз у STATISTICAКласифікаціяЛогіт-регресіяФакторний аналіз у STATISTICAГлава 11. ВИБУТОК ДАНИХ У STATISTICAДодаток 1. Генератор кодуДодаток 2. Інтеграція STATISTICA з ERP-системамиСписок литературыПредметный покажчик

R - це вільне програмне середовище для статистичних обчислень та графіків.
Це проект GNU, схожий на мову та середовище S, який був розроблений у Bell Laboratories (раніше AT&T, зараз Lucent Technologies) Джоном Чамберсом та його колегами. R може розглядатися як інша реалізація S. Є деякі важливі відмінності, але більшість коду, написаного для S, працює без змін під R

Безкоштовна Відкритий код Mac Windows Linux BSD

  • RStudio

    RStudio ™ - це інтегроване середовище розробки (IDE) для мови програмування R. RStudio поєднує в собі інтуїтивно зрозумілий інтерфейс користувача і потужні інструменти кодування, які допоможуть вам максимально використовувати можливості R.

    Безкоштовна Відкритий код Mac Windows Linux Xfce

  • PSPP

    PSPP - це безкоштовний програмний додаток для аналізу вибіркових даних. Воно має графічний інтерфейскористувача та звичайний інтерфейс командного рядка. Він написаний на C, використовує наукову бібліотеку GNU для своїх математичних процедур і plotutils для створення графів. Він призначений для безкоштовної заміни пропрієтарної програми SPSS.

    Безкоштовна Відкритий код Mac Windows Linux

  • IBM SPSS Statistics

    Програмна платформа IBM SPSS пропонує розширений статистичний аналіз, велику бібліотеку алгоритмів машинного навчання, аналіз тексту, розширюваність з відкритим вихідним кодом, інтеграцію з великими даними та плавне розгортання у додатках.

    Платна Mac Windows Linux

  • SOFA Statistics

    SOFA Statistics - це статистичний пакет із відкритим вихідним кодом, в якому особливу увагуприділяється простоті використання, навчанню по ходу роботи та чудовим результатам. Назва розшифровується як Статистика, відкрита для всіх. Він має графічний інтерфейс користувача і може безпосередньо підключатися до MySQL, SQLite, MS Access та MS SQL Server

    Безкоштовна Відкритий код Mac Windows Linux

  • Що у цьому списку?

    У списку міститься програми, які можна використовувати для заміни STATISTICA на платформах Windows. Цей список містить 6 програм, схожих на STATISTICA.

    2021 wisemotors.ru. Як це працює. Залізо. Майнінг. Криптовалюта.