Процесс создания датасетов и обучения классификаторов
Шаг 1 - Формирование заданий для системы разметки
- Запустите dedoc в режиме разметки путем включения строки labeling_mode=True в ваш конфиг файл config.py.
- Подготовьте данные для разметки в виде архива документов, которые необходимо обработать.
- Для формирования заданий для внешней системы разметки идем сюда и загружаем подготовленный архив с необходимыми параметрами.
Шаг 2 - Разметка данных
Разметка подготовленных данных осуществляется с помощью внешней системы разметки
Шаг 3 - Обучение классификаторов дедка
Информация по обучению классификаторов строк и классификатора ориентации изображений находится тут.
Шаг 4 - Удаление данных для разметки
Тут можно удалить промежуточные данные, используемые при создании заданий на разметку.