Големи данни

  • Автор: проф. д-р Станимир Стоянов
  • Предназначен за: ОКС „бакалавър“: Софтуерно инженерство, редовно, IV курс
Живеем в зората на „Четвъртата индустриална революция“, белязана от появата
на "кибер-физически системи", където софтуерът се свързва безпроблемно с мрежи от
физически системи, като сензори, смартфони, превозни средства, електрически мрежи или
сгради, за да се създаде нов свят на интернет на нещата (IoT). Данните и информацията са
„гориво“ на тази нова епоха, където мощни аналитични алгоритми „изгарят“ това гориво,
за да генерират решения.
Тази нова технологична област се определя наука за големите данни. Големите
данни се определят като колекции от масиви данни, чийто обем, скорост или разнообразие
са толкова големи, че е трудно да се съхраняват, управляват, обработват и анализират с
помощта на традиционни бази данни и инструменти за обработка на данни. През
последните години се наблюдава експоненциално нарастване на структурираните и
неструктурираните данни, генерирани от информационните технологии,
промишлеността, здравеопазването, системи за търговия на дребно, интернет и други
системи. Науката за големите данни и техните анализи се занимава със събирането,
съхранението, обработка и анализ на мащабни данни за компютърни системи, базирани
предимно в облак.
Лекционният курс е въведение в дисциплината „Големи данни“. Разглежда се Hadoop,
една от най-известните рамки за разработване на системи, използващи големи данни. В
лабораторните упражнения се разработва цялостен завършен казус (case study). Насърчава
се работата в екип.

Библиотека

Статистики