Базовый курс по большим данным предоставляет необходимые знания для участия в  проектах по анализу больших данных. Включает информацию о фазах жизненного цикла  процессов аналитики больших данных при переходе бизнеса к использованию Big Data.  Материал курса обеспечивает слушателей знанием базовых и расширенных аналитических  методов и техник, применяемых для поиска и извлечения знаний из больших массивов  разнородных данных. Сравнение различных версий дистрибутивов платформы Hadoop,  облачные сервисы для хранения и аналитики данных, "open source" и коммерческие  инструменты используемые для хранения, обработки, визуализации и аналитики больших данных.  

Вы научитесь

    • Создавать и обрабатывать числовые массивы.
    • Создавать диаграммы и графики различных видов и форматов.
    • Объединять и переформировывать данные.

Вы будете знать

  • Основы анализа и визуализации данных, применяемый для этой цели базовый инструментарий языка Python;
  • Основные понятия и методики библиотеки numpy: массив, скаляр, массовая операция, основные операции с массивами, основные функции библиотеки;
  • Библиотеку Matplotlib ее основные понятия и методики применения;
  • Основные виды графиков и диаграмм, способы их построения;
  • Основные понятия и методики библиотеки Pandas.