Дообучение классификаторов
Классификатор типа строк
Переобучение классификаторов происходит с помощью скриптов dedoc/scripts/train_clf_type_line_classifier.py, где clf_type - тип классификатора (tz, law, diploma).
Классификатор ориентации изображения документа
Переобучение классификатора ориентации происходит с помощью скрипта dedoc/scripts/train_acc_orientation_classifier.py
Использование:
train_acc_orientation_classifier.py [-h] -t TRAIN [-s CHECKPOINT_SAVE][-l CHECKPOINT_LOAD][-f FROM_CHECKPOINT] -d INPUT_DATA_FOLDER
Параметры:
-h, --help информация по аргументам
-t TRAIN, --train TRAIN (--train True) или проверка модели (--train False)
-s CHECKPOINT_SAVE, --checkpoint_save CHECKPOINT_SAVE путь до весов checkpoint.pth для сохранения (используется только для этапа тренировки)
-l CHECKPOINT_LOAD, --checkpoint_load CHECKPOINT_LOAD путь до весов checkpoint.pth, которые будут загружены в модель
-f FROM_CHECKPOINT, --from_checkpoint FROM_CHECKPOINT флаг устанавливается, если обучение нужно продолжить из чекпоинта, указанного в CHECKPOINT_LOAD
-d INPUT_DATA_FOLDER, --input_data_folder INPUT_DATA_FOLDER путь до папки с тренировочными (подпапка train) и тестовыми данными (подпапка test).