пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

38. Інтелектуальний аналіз даних (Data Mining)

З штучним інтелектом тісно пов’язаний напрям інтелектуального аналізу даних - дейтамайнінгу, або здобування знань, що може використовуватись як один із способів одержання знань для систем штучного інтелекту. Дейтамайнінг  (Data Mining) - це дослідження й виявлення за допомогою спеціальних алгоритмів і засобів штучного інтелекту в «сирих» даних схованих знань, що раніше не були відомі і є нетривіальними, практично корисними і доступними для інтерпретації людиною.

Термін «Data Mining» запропонував Григорій П’ятецький-Шапіро у 1992 р.

В широкому сенсі  Data Mining - це сучасна концепція аналізу даних, яка передбачає те, що:

  • дані можуть бути неточними, неповними (мати пропуски), суперечливими, різнорідними, непрямими, і при цьому мати гігантські об’єми; тому розуміння даних у конкретних застосуваннях вимагає значних інтелектуальних зусиль;
  • самі алгоритми аналізу даних можуть мати «елементи інтелекту», зокрема, здатність навчатися на прецедентах, тобто робити загальні висновки на основі окремих спостережень; розроблення таких алгоритмів також потребує значних інтелектуальних зусиль;
  • процеси перероблення сирих даних в інформацію, а інформації у знання вже не можуть бути виконані вручну, і потребують нетривіальної автоматизації.

Основні методи дейтамайнінгу включають:

  • кластерний аналіз;
  • нечітка логіка;
  • дерева рішень;
  • генетичні алгоритми;
  • нейромережі та ін.

Кластерний аналіз – процес розділення набору даних (чи об’єктів) у набір значущих підкласів, що називаються кластерами. Кластери допомагають користувачу зрозуміти природне групування чи структуру в наборі даних.

Нечітка логіка застосовується для таких наборів даних, де приналежність даних до якої-небудь групи є імовірносною і може бути оцінена в інтервалі від 0 до 1.  На відміну від традиційної математики, що вимагає на кожному кроці моделювання точних і однозначних формулювань закономірностей, нечітка логіка пропонує підхід м’яких формулювань і надає математичні методи для представлення і оброблення таких даних.

Дерево рішень – це схема (граф), яка відображає структуру задачі багатокрокового процесу прийняття рішень у вибраній сфері аналізу (класифікація набору даних або зразків, пошук оптимального рішення на множині альтернатив, отримання логічного висновку за допомогою евристики (бази правил)).

Генетичні алгоритми.  Ці алгоритми певним чином імітують процес природного добору і є потужним засобом рішення різноманітних комбінаторних задач і задач оптимізації. У цьому методі рішення подається у вигляді хромосоми, яку утворює набір генів. Пошук оптимального рішення при цьому схожий на еволюцію популяції індивідів, представлених їхніми наборами хромосом.

Нейромережні і нейрокомп’ютерні технології. Штучні нейронні мережі та нейрокомп’ютери значною мірою відтворюють принципи роботи людського мозку. Знання в них не відокремлені від процесора, а рівномірно розподілені й існують неявно у вигляді ваг синаптичних зв’язків. Такі знання не закладаються з самого початку, а набуваються в процесі навчання.


хиты: 459
рейтинг:0
Точные науки
информатика
Информационные науки
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь