Главная
Биография
Научные труды
Портфолио
Дисциплины
Лекции (old)
Программное обеспечение
Дипломники
Материалы студентов
Заметки
Сотрудничество
Консультации
Патенты
Услуги
Ссылки
Блог
Контакты


ФОРУМ

Задание заочникам 'Языки анализа и обработки данных'

Только заочникам!! (КубГТУ, ФИТК, ИСП)

Упрощенный вариант задания

1. Выбрать одну из LLM систем (GigaChat, ChatGPT, GoogleGemini, MetaLlama и т.д.) // выбор LLM - на усмотрение студента
2. Попытаться получить базовые знания по програмиированию на Python
3. Решить с помощью выбранной LLM лабораторные работы 3,4,5
4. Оценить качество работы LLM (личное мнение)
Вопросы заданные LLM и ответы - записать в файл формата doc или pdf.

-------------------------------
-------------------------------

Базовый вариант задания

Необходимо выполнить следующие пункты:
1. Лабораторные работы (все)
2. Контрольная работа (список тем ниже). Зарегистрировать на кафедре.

P.S. Т.к. работа с обработкой больших данных, то нужно найти датасет на kaggle.com по интересующей Вас тематике и работать с ним.
P.P.S. Выполнять желательно на Python (основной) или R. Но ограничений на ЯП нет.
*** - кроме kaggle.com можно использовать сайты Департаментов и Министерств со статистическими данными.

Список тем на контрольную:

  • 1. Работа с типами данных в языке Python
  • 2. Массивы библиотеки NumPy
  • 3. Операции над массивами
  • 4. Объекты библиотеки Pandas
  • 5. Операции над данными в библиотеке Pandas
  • 6. Объединение наборов данных
  • 7. Агрегация и группировка
  • 8. Сводные таблицы
  • 9. Импорт Matplotlib и настройка стилей
  • 10. Простые линейные графики. Настройка
  • 11. Простые диаграммы рассеяния
  • 12. Гистограммы, разбиения по интервалам и плотность
  • 13. Пользовательские настройки легенд на графиках
  • 14. Пользовательские настройки шкал цветов
  • 15. Множественные субграфики


Оформление контрольной работы: объем > 12 стр., титульный лист, описание предметной области, поясняющие примеры.

Пояснение к Лабораторным работам num 3 и 4.

1. Найти выборку (статсайты, например, kaggle.com) размер от 1000 строк, колонок > 6.
2. Используя методы NumPy и Pandas научиться сортировать, изменять размерность, делать вывод в консоль (в т.ч. в диапазоне), вести подсчет элементов (в т.ч. по заданным параметрам + нулевых и с пропусками)
-- для изучения использовать официальную документацию по библиотекам (лучше пока не придумали)

Переводы статей

Читаемые курсы лекций

Нейросети Искусственный интеллект Методы оптимизации ПИС Сетевая экономика БД МПИ

АСД
ПО ЭИС
НТИС
ФЛП
МатЛогика
Ч.М.Э.
МиИМППР
Интернет-технологии
Web-технологии
Machine Learning

Технологическая динамика

Курсовые работы и проекты
Каталоги научных журналов

Не использовать материалы сайта для GPT-моделей и генеративного формирования изображений
Best view на нормальном мониторе.
Телеграм канал shumkoff.ru
Связь (по всем вопросам) с администратором сайта E-mail: sneveld@yandex.ru
При использовании материалов сайта просьба указывать ссылку http://www.shumkoff.ru и первоисточники (если указаны)
Обмен ссылками
Карта сайта

При использовании материалов сайта делать соотвествующую ссылку. © Шумков E.A. 2012-2025