Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Вопрос-Ответ Новый топик    Ответить
 Вопрос по предиктивной аналитике  [new]
ferzmikk
Member

Откуда:
Сообщений: 2214
Здравствуйте!

Есть следующие таблицы:

Таблица 1. Справочник Торговые точки
- id
- Торговая точка
- Признак 1
- Признак 2
- Признак 3
и т.д.

Таблица 2. Справочник SKU
- id
- SKU
- Стоимость
- Цена
- Признак 1
- Признак 2
- Признак 3
и т.д.

Таблица 3. Остатки SKU на начало дня по ТТ
- id
- id_ТТ
- id_SKU
- Дата
- Остаток

Таблица 4. Продажи
- id
- id_TТ
- id_SKU
- Дата
- Продажи Количество


Задачи:
Исходя исторических данных об остатках и продажах по SKU и ТТ нужно получить
1. Набор рекомендованных ассортиментных матриц для конкретных ТТ, которые состоят из тех SKU, где в совокупности по факту имели наибольшую прибыль за последний месяц.
2. Набор рекомендованных ассортиментных матриц для конкретных ТТ, которые состоят из тех SKU, где в совокупности прогнозируется наибольшая прибыль за последующий месяц.


Особенности:
1. Для упрощения данной задачи предполагаем, что затраты и цены по времени не меняются.
2. В ассортиментной матрице не должно быть меньше n и больше m позиций.
3. SKU это предмет, покупают редко.
4. Прибыльность ассортиментной матрицы оценивается по месячно или за 2 месяца.
5. Признак SKU, это, к примеру, масса, объем, длина, ширина, высота, вес, состав, цвет и т.д.
6. Признак ТТ, это, к примеру, месячный объем продаж, площадь торгового зала, тип ТТ и т.д.


Следующий пункт как дополнительный. Так как усложняет данную задачу.
7. Важность и/или последовательность признаков:
- Каждый признак (как и для SKU, так и для ТТ) имеет свою степень важности.
- Последовательность признаков (как и для SKU, так и для ТТ). К примеру для определенного SKU, если по наиболее приоритетному признаку (например, признак 1) не находится наиболее близко похожий SKU, то переход к наименее важному признаку (например, признак 2). Это означает, что ищется наиболее похожий SKU одновременно по признаку 1 и 2. И т.д.

Таблица 5. Важность и последовательность признаков для SKU
- Признак
- Важность
- Последовательность - это ранговая мера. Начинается с 1, где 1 - наиболее важная.

Таблица 6. Важность и последовательность признаков для ТТ
- Признак
- Важность
- Последовательность - это ранговая мера. Начинается с 1, где 1 - наиболее важная.


Изначальный вариант решения:
1. Поскольку каждая ТТ индивидуальна, то важно очень похожие ТТ закрепить в соответствующую группу ТТ, иначе будет не подобрать выгодные ассортиментные матрицы. Именно близко похожие ТТ, а не просто отнести к какой-то группе ТТ.
1.1. Если есть категориальные признаки, то переводим их в метрические шкалы - One hot encoding.
1.2. Проводим по ним стандартизация признаков - Минимакс.
1.3. Схожесть определяется с помощью кластерного анализа (к-средние или иерархическим способом).
1.3.1. Учет важности признаков.
1.3.2. А также учет последовательности признаков изначально предполагаю определять с помощью деревья решений и случайного леса. Но пока под вопросом.

1.4. Создаем новый признак в таблице. Возможно, создать новую таблицу как справочник.
1.5. Если необходимо создаем еще признаки.

Аналогично и для SKU. Близко похожие SKU необходимо закрепить в Общее SKU.

2. Составить набор всевозможных ассортиментных матриц.

2.1. Создаем таблицу Ассортиментные матрицы с полями
- id
- Количество SKU

2.2. Создаем таблицу SKU в матрицах:
- id
- id_матрицы
- id_SKU

2.3. Создаем таблицу Фактические матрицы:
- id
- id_ТТ
- id_SKU
- Месяц и год
- Прибыль по SKU
- Прибыль по всей матрице

3. Перебором выбираем наиболее выгодные ассортиментные матрицы. Возможно, достаточно провести ABC-анализ Это для первой задачи.

4. По второй задаче применить классическую полносвязанную нейронную сеть. Данный пункт пока подробно не описываю, так как еще четко не определился какой именно алгоритм применять (возможно лучше деревья решений, случайные леса).


Вопрос:
Хотелось получить экспертную оценку представленного первоначального решения данной задачи, а также рекомендации. Может кто-то решал подобную задачу и поделится опытом своего решения. Какие логические нюансы надо еще учесть? Какие еще алгоритмы использовать для решения? И возможно ли такие задачи решать только в SQL?
9 июн 21, 15:00    [22333340]     Ответить | Цитировать Сообщить модератору
Все форумы / Вопрос-Ответ Ответить