Структура за темами
- Загальне
Загальне
- СИЛАБУС ДИСЦИПЛІНИ
СИЛАБУС ДИСЦИПЛІНИ
Метою викладання навчальної дисципліни «Технології обробки великих даних» є ознайомлення з галуззю великих даних , пов’язаних даних та з інструментарієм, що використовується для створення, зберігання, публікації, пошуку, аналізу великих даних. Формування у студентів теоретичних знань і практичних здатностей застосовувати методи і засоби збирання, зберігання, аналізу та обробки великих даних.
Основними завданнями вивчення навчальної дисципліни «Технології обробки великих даних» є: оволодіння основними поняттями в галузі великих даних, ознайомлення з принципами організації сховищ великих даних, із базовими алгоритмами збереження та пошуку у сховищі великих даних, ознайомлення із переліком задач, що відносяться до організації роботи з великими даними, та способами рішення таких задач, формування навичок з реалізації сховища великих даних, організації процесів роботи зі сховищем, типового аналізу великих даних.
У результаті вивчення навчальної дисципліни студент повинен знати:
- сутність понять “великі дані”, “пов’язані дані”;
- властивості, засоби опису, публікації, використання, зберігання пов’язаних даних; - мови запитів до пов’язаних даних;
- властивості, особливості та джерела великих даних;
- принципи класифікації великих даних;
- основні архітектури сховищ великих даних;
- основні алгоритми роботи зі сховищем великих даних (MapReduce);
- основні задачі аналізу у постановці для великих даних;
- основні задачі, в яких застосовується інтелектуальний аналіз даних. вміти:
- розгортати точку доступу до пов’язаних даних та створювати запити до них;
- створювати додатки, що використовують пов’язані дані;
- публікувати пов’язані дані; - розгортати Apache Spark інфраструктуру;
- створювати додатки, що використовують великі дані;
- застосовувати інструменти Spark для аналітичної обробки великих даних.
№ з/п
Назва розділу, модуля, теми програми
Програмні результати навчання
1
2
3
Змістовний модуль 1. Робота з Linked Open Data – відкритими пов’язаними даними.
1
Принципи організації мережі пов’язаних даних.
Знати визначення пов’язаних даних. Модель посилання у мережі пов’язаних даних - RDF, модель посилання у мережі пов’язаних даних із частковим структуруванням ресурсів - RDF Schema. Точки доступу до пов’язаних даних. Принципи організації мережі пов’язаних даних. Принципи «5 star» для пов’язаних даних. Застосування пов’язаних даних.
2
Створення пов’язаних даних та аналіз пов’язаних даних у аналітичних платформах.
Знати принципи створення пов’язаних даних. Структуру IRI/URI. Резолюція IRI/URI. Платформи для конвертації звичайних даних у пов’язані (OpenRefine, RDB2RDF, GraphDB).
Змістовний модуль 2. Методи роботи з Big Data.
4
Принципи організації сховищ великих даних
Знати визначення великих даних. Характеристики великих даних: 5“V” – volume, velocity, variety, value, veracity. Джерела великих даних – внутрішньоорганізаційні та зовнішні: соціальні мережі, дані сотових операторів, журнали подій у мережі комп’ютерів, історії замовлень у онлайн- магазинах, історії переглянутих сторінок, дані про використання пластикових карток, та інші.
5
Інструменти аналітичної обробки даних у сховищі великих даних.
Знати компоненти Spark – MapReduce, HDFS, YARN, Hive, Pig, Zookeeper, Flume та інші. Алгоритм Apache Hive. Мова Pig Latin (Apache Pig). Планування завдань Apache Oozie.
Для якісного засвоєння курсу необхідна систематична та усвідомлена робота студентів в усіх видах навчальної діяльності: лекції та практичні заняття, лабораторні роботи, консультації, самостійна робота як індивідуальна, так і під керівництвом викладача.
Основними методами формування фахових компетентностей при проведенні аудиторних занять є пояснювально-ілюстартивні та наочні, інтерактивні (дискусія, мозковий штурм, інтерактивні презентації, тестування) та практичні (розбір практичних ситуацій, відпрацювання навичок, виконання практичних та лабораторних робіт). Ці методи дають можливість у повному обсязі опанувати навчальний матеріал, закріпити його, сформувати практичні навики та діагностувати якість знань.
Під час проведення лекційних занять необхідна активна участь студентів в обговоренні ключових положень теми, ведення стислого конспекту лекції. Теоретичні знання, отримані студентами під час лекцій, застосовуються на практичних, семінарських заняттях та лабораторних роботах шляхом розв’язування практичних задач, виконання індивідуальних практичних завдань з використанням спеціалізованого програмного забезпечення та представлення результатів роботи перед аудиторією.
Основним завданням самостійної роботи студентів є набуття навичок самостійного опрацювання інструментальних засобів обробки даних, практичного застосування Big data в бізнесі та науці, навчитися роботі з хмарними технологіями, опанувати методи обробки великих даних за допомогою Spark.
Самостійна робота студентів організовується шляхом видачі переліку питань і практичних завдань з кожної теми, які не виносяться на аудиторне опрацювання. Крім того, по деяких темах передбачається написання рефератів, міні-проектів.
Обсяг самостійної роботи визначається кількістю годин, передбачених робочою програмою.
Контроль виконання самостійної роботи проводиться в таких формах:
- опитування на семінарських заняттях;
- контрольні питання до лабораторних робіт;
- практичні завдання підвищеного рівня складності;
- реферативні повідомлення.
Рівень самопідготовки студентів, згідно запропонованої тематики самостійної роботи, відбивається на рівні вивчення навчальної дисципліни в цілому.
Діагностика знань, умінь та навичок студентів полягає в оцінювані рівня сформованих загальних та фахових компетентностей, дає змогу з’ясувати ступінь опанування тем дисципліни та рівень підготовки здобувачів освіти до професійної діяльності.
Оцінювання знань студентів з навчальної дисципліни здійснюється за 4-бальною шкалою, шляхом проведення контрольних заходів, які включають:
- поточний контроль,
- підсумковий контроль.Поточний контроль здійснюється під час проведення лекційних та практичних занять і має на меті перевірку знань студентів з окремих тем та рівня їх підготовленості до виконання завдань.
Ключовими формами та методами демонстрації студентами результатів навчання при поточному контролі є:- захист лабораторних робіт: демонстрація результатів виконання завдань із обгрунтуванням обраних методів та інструментів;
- презентація - виступи перед аудиторією для висвітлення окремих питань, індивідуальних завдань, реферативних досліджень, захист міні-проектів тощо;
- дискусія - обґрунтування власної позиції у вирішенні проблемних питань;
- кейс-метод - аналіз конкретних ситуацій, що дає змогу наблизити процес навчання до реальної практичної діяльності;
- тести - містить питання з варіантами відповідей стосовно певної теми, або декількох тем дисципліни;
- контрольні роботи - включають як перевірку теоретичних положень курсу, так і розв’язування практичних завдань. Контрольна робота може містити тестові завдання та практичні задачі, виконується на основі знань, вмінь і навичок, отриманих у процесі вивчення теми, декількох тем чи дисципліни вцілому.
Підсумковий контроль проводиться у формі диференційованого заліку – форма підсумкового контролю, що полягає в оцінці засвоєння студентом навчального матеріалу з навчальної дисципліни на підставі поточного контролю та формується як седеньоарифметичне значення всіх поточних оцінок студента на останньому занятті за умови відсутності негативних оцінок за лабораторні роботи.
Студенти як відповідальні учасники освітнього процесу дотримуються норм академічної доброчесності, усвідомлюють наслідки її порушення, що визначаються Положенням про академічну доброчесність у Галицькому фаховому коледжі імені В’ячеслава Чорновола. Списування під час контрольних заходів заборонені (в т.ч. із використанням мобільних девайсів). У разі виявлення списування, студенту виставляється незадовільна оцінка за даний контрольний захід.
Відвідування занять є обов’язковим. За об’єктивних причин (наприклад, хвороба, проходження медичних оглядів, участь в змаганнях, олімпіадах тощо) відсутність студентів на занятті повинна мати документальне підтвердження.
Пропущені заняття та незадовільні оцінки (поточний контроль, підсумковий контроль) повинні бути відпрацьовані згідно графіку консультацій викладача.
До початку заліково-екзаменаційної сесії студенти повинні виконати усі підсумкові контрольні заходи і отримати по кожному із змістовних модулів позитивні оцінки.
Студент має право оскаржити оцінку, отриману за результатами підсумкового семестрового контролю (крім незадовільної оцінки). Такі випадки регулюються Положенням про апеляцію результатів підсумкового контролю знань студентів.
Перескладання незадовільних оцінок здійснюється відповідно до Порядку ліквідації академічної заборгованості у Галицькому фаховому коледжі імені В’ячеслава Чорновола.
- Волкова С. Просто Big Data [Текст] / С. Волкова // СПб.: Страта, 2019, 148 с.
- Rajat Mehta. Big Data Analytics with Java. 2017 Packt Publishing. 418 p.
- Business Analytics for Managers: Taking Business Intelligence Beyond. Gert H. N. Laursen Data Smart: Using Data Science to Transform Information into Insight John W. Foreman
- KDNuggets: Data Mining Community Top Resource for Analytics, Data Mining, and Data Science Software, Companies, Data, Jobs, Education, News, and more. URL: http://www.kdnuggets.com
- The Data Mine. URL: http://www.the-data-mine.com
- Секція 2
Секція 2
- Секція 3
Секція 3