Дообучение классификаторов

Классификатор типа строк

Переобучение классификаторов происходит с помощью скриптов dedoc/scripts/train_clf_type_line_classifier.py, где clf_type - тип классификатора (tz, law, diploma).

Классификатор ориентации изображения документа

Переобучение классификатора ориентации происходит с помощью скрипта dedoc/scripts/train_acc_orientation_classifier.py

Использование:

train_acc_orientation_classifier.py [-h] -t TRAIN [-s CHECKPOINT_SAVE][-l CHECKPOINT_LOAD][-f FROM_CHECKPOINT] -d INPUT_DATA_FOLDER

Параметры:

-h, --help информация по аргументам

-t TRAIN, --train TRAIN (--train True) или проверка модели (--train False)

-s CHECKPOINT_SAVE, --checkpoint_save CHECKPOINT_SAVE путь до весов checkpoint.pth для сохранения (используется только для этапа тренировки)

-l CHECKPOINT_LOAD, --checkpoint_load CHECKPOINT_LOAD путь до весов checkpoint.pth, которые будут загружены в модель

-f FROM_CHECKPOINT, --from_checkpoint FROM_CHECKPOINT флаг устанавливается, если обучение нужно продолжить из чекпоинта, указанного в CHECKPOINT_LOAD

-d INPUT_DATA_FOLDER, --input_data_folder INPUT_DATA_FOLDER путь до папки с тренировочными (подпапка train) и тестовыми данными (подпапка test).