Перед моделированием важно учитывать три момента:
- Выбор между сокращением числа предикторов и числа наблюдений и обоснование этого выбора
- Выбор типа описания связей между предикторами и откликом (корреляция/каузация)
- Выбор вопроса моделирования между “Что влияет на переход дела с одного институционального этапа на другой?” и “Что влияет на НЕпереход дела с одного институционального этапа на другой?”.
Выбор между сокращением числа предикторов и числа наблюдений и обоснование этого выбора
Моделирование с сокращенным количеством предикторов и увеличенным количеством штатов (удаление колонок)
Для общего моделирования пригодны следующие переменные как наиболее заполненные во всех штатах (то есть пропущенных значений либо нет совсем, либо их не более 30%):
- возраст задержанного
- год задержания
- месяц задержания
- тип вменяемых правонарушений на основе их количества (одно правонарушение или несколько) на момент ареста
- код вменяемого правонарушения на момент ареста
- степень тяжести вменяемого правонарушения на момент ареста
- результат полицейского расследования
- год получения результата полицейского расследования
- месяц получения результата полицейского расследования
- результат досудебного рассмотрения дела
- год результата досудебного рассмотрения дела
- месяц результата досудебного рассмотрения дела