Рано или поздно практически любая компания, которая развивается интенсивным, а не экстенсивным путем сталкивается с поиском неиспользованных возможностей в бизнесе. Чаще всего на помощь приходит аналитика в самых разных вариантах (от базового варианта до интеллектуального анализа данных). Расширенная аналитика (advanced analytics) является технологическим трендом, который включен в TOP-10 Gartner стратегических технологий на 2009-2010, 2011, 2012 года.

Ирина Чубукова, блог


Если в компании не внедрена система Business Intelligence, то поиск подходящего решения чаще всего лежит в плоскости отдельных специализированных инструментов для анализа данных.

В противном случае вопросы выбора инструмента для расширенной аналитики должны согласовываться с уже существующими решениями в компании. Как показывает практика внедрений, это вопрос не тривиальный и требует взгляда со стороны.

Функциональность аналитики

Аналитика является одной из функциональностей платформ Business Intelligence. Одним из важных вопросов при выборе аналитического решения являются возможности существующей Business Intelligence: включает ли она специальный инструмент и/или возможности аналитики на том уровне, который необходим компании.

Кратко напомню, что согласно классификации Gartner, Business Intelligence обеспечивает интеграцию, доставку и аналитику данных. К средствам аналитики в BI относятся:

  • OLAP (Online Analytical Processing)
  • Продвинутая визуализация
  • Predictive Modelling и data mining
  • Карты показателей (Scorecards)

В сегодняшней статье рассматривается business intelligence & data mining от одного вендора .

Data mining от лидеров BI рынка

Далеко не все вендоры BI обеспечивают свои платформы возможностью проведения полноценной аналитики. Некоторые платформы реализуют только интеграцию и доставку данных. При этом на рынке существует ряд инструментов data mining, которые не являются BI.

Таким образом, ассоциировать BI и data mining не совсем правильно, необходимость использования BI и data mining от одного вендора зависит от стратегических целей и тактических задач компании.

В виде диаграмм Венна (Venn diagrams) проиллюстрировать это можно так:

bi_data mining

Рисунок означает следующее: не каждый разработчик платформы BI предоставляет возможность использовать методы data mining, не каждый инструмент data mining является BI (или его частью) от определенного вендора.

bi_datamining

Большинство лидеров-разработчиков BI платформ (о лидерах 2011 можно прочитать здесь) позаботились о том, чтобы в их «арсенале» были средства не только базовой, но и продвинутой аналитики. Достаточно часто появление функциональности data mining в BI платформе связано с приобретением компании, специализирующейся на аналитике.

bi_data mining_u

Ниже перечислены инструменты data mining от вендоров BI: IBM SPSS, SAS, SAP Business Objects, Oracle, MicroStrategy, ThinkAnalytics, Pentaho, Angoss.

Инструменты предиктивного моделирование и data mining от BI-вендоров, источник — bi-insider

bi_data mining2011

IBM SPSS Moleler, ранее известный как Clementine, пожалуй, является одним из лучших (наиболее популярным и мощным) инструментом для решения задач Data Mining. Квадраты Gartner по Data Mining можно увидеть с описанием здесь, а сами квадраты с нанесенными на них рекомендациями вот:

bi квадраты гартнера

Работа в IBM SPSS Moleler реализуется через интерфейс визуального программирования для построения стримов.

spss_modeler

В список data mining от BI-вендоров не включен Microsoft от Data Mining, хотя Integration Services позволяют использовать большинство методов Data Mining.

Несколько советов по выбору Data Mining инструмента

microsoft_dataminingСовет 1: если в Вашей компании существует BI решение, поиск инструмента data mining должен начинаться с возможностей системы от «знакомого» вендора.

Совет 2: при выборе аналитического инструмента не следует ограничиваться только решениями от своего вендора, большинство data mining инструментов имеют достаточно широкие возможности работы с максимально возможным количеством источников данных.

Совет 3: при выборе инструмента расширенной аналитики ключевое значение играют: функционал (методы), возможность автоматизации процесса (workflow), стоимость решения и удобство использования.