Проектирование платформы аналитики

Технология Data-Select
Разработанная нами инновационная технология Data-Select позволит вам уменьшить затраты на ИТ и ускорить рост вашего бизнеса.

Businesswoman inspecting graph on interactive display

Проектирование платформы с современной архитектурой  для аналитики данных.

Для проектирования платформы нужно  изучить структура данных и бизнес  требования  заказчика чтобы учесть при проектировании аналитической платформы следующие параметры:

  1. Параметр: Приобретение или  создание  аналитической платформы:

Приобретение: SAS, SAS, splunk>, Teradata

  • время окупаемости
  • сценарий использования стандартного оборудования
  • простота стоит денег
  • эволюция, расширение существующих систем
  • существующие специалисты
  • низкое разнообразие использование источников

Создание: Hadoop, cloudera, hortonworks, databrics,

  • уникальный источник прибыли
  • схема снежинки
  • дешевизна как плата за сложность
  • более низкие затраты на дальнейшую поддержку
  • культура поддержки талантливых специалистов+ DevOps
  • значительный масштаб приложений и разнообразие данных
  1. Параметр: Пакетная передача данных против потоковой передачи:

Пакетная передача: Oracle? Hadoop, Mepreduce< Spark

  • Описательная статистика
  • Важна точность
  • Большие объёмы
  • Создание моделей
  • время относительно
  • по расписанию

Потоковая: Apach Storm, Splunk>,  kafka

  • потенциальные прогнозы
  • скорость важнее точности
  • параллельные потоки данных
  • внедрение разработанных моделей данных
  • культура поддержки талантливых специалистов DevOps
  • Большое количество источников и разнообразия данных
  1. Параметр: Публичное хранилище против частного

Публичные: Amazon, Azur, rockspase, Atos

  • происхождение данных
  • данные притягивают
  • безопасность, соответствие требованием
  • гибкость использования
  • экономичность
  • талантливые специалисты

Частное: готовые системы и узлы,  блоки стойки устройства, внутренние облака, конвергентные решения

  • происхождение данных
  • важность данных
  • безопасность соответствие требованиям
  • гибкость использования
  • экономичность
  • специалисты
  1. Параметр: Постоянное или временное хранение

Постоянные:

  • хранилище больших данных
  • определены сценарии использования
  • Hadoop для архива
  • Исходные данные

Временные:

  • тестирование и разработка
  • потоковая обработка
  • ориентация на проекты
  • обработка в памяти
  1. Параметр:Виртуальное против физического хранения 
  1. Параметр: DAS, SAN, NAS 
  1. Параметр: Ёмкость или производительность