Задание заочникам 'Языки анализа и обработки данных'
Только заочникам!! (КубГТУ, ФИТК, ИСП)
Упрощенный вариант задания
1. Выбрать одну из LLM систем (GigaChat, ChatGPT, GoogleGemini, MetaLlama и т.д.) // выбор LLM - на усмотрение студента
2. Попытаться получить базовые знания по програмиированию на Python
3. Решить с помощью выбранной LLM лабораторные работы 3,4,5
4. Оценить качество работы LLM (личное мнение)
Вопросы заданные LLM и ответы - записать в файл формата doc или pdf.
-------------------------------
-------------------------------
Базовый вариант задания
Необходимо выполнить следующие пункты:
1. Лабораторные работы (все)
2. Контрольная работа (список тем ниже). Зарегистрировать на кафедре.
P.S. Т.к. работа с обработкой больших данных, то нужно найти датасет на kaggle.com по интересующей Вас тематике и работать с ним.
P.P.S. Выполнять желательно на Python (основной) или R. Но ограничений на ЯП нет.
*** - кроме kaggle.com можно использовать сайты Департаментов и Министерств со статистическими данными.
Список тем на контрольную:
- 1. Работа с типами данных в языке Python
- 2. Массивы библиотеки NumPy
- 3. Операции над массивами
- 4. Объекты библиотеки Pandas
- 5. Операции над данными в библиотеке Pandas
- 6. Объединение наборов данных
- 7. Агрегация и группировка
- 8. Сводные таблицы
- 9. Импорт Matplotlib и настройка стилей
- 10. Простые линейные графики. Настройка
- 11. Простые диаграммы рассеяния
- 12. Гистограммы, разбиения по интервалам и плотность
- 13. Пользовательские настройки легенд на графиках
- 14. Пользовательские настройки шкал цветов
- 15. Множественные субграфики
Оформление контрольной работы: объем > 12 стр., титульный лист, описание предметной области, поясняющие примеры.
Пояснение к Лабораторным работам num 3 и 4.
1. Найти выборку (статсайты, например, kaggle.com) размер от 1000 строк, колонок > 6.
2. Используя методы NumPy и Pandas научиться сортировать, изменять размерность, делать вывод в консоль (в т.ч. в диапазоне), вести подсчет элементов (в т.ч. по заданным параметрам + нулевых и с пропусками)
-- для изучения использовать официальную документацию по библиотекам (лучше пока не придумали)
|