Найти
Результаты поиска
-
АЛГОРИТМ ПОДГОТОВКИ ДАННЫХ ОБУЧЕНИЯ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ БУКВ И СИМВОЛОВ
Д.А. Безуглов , М.С. Мищенко , С.Е. Мищенко134-1442025-07-24Аннотация ▼Точность распознавания текстовых изображений на практике остается ограниченной. Это связано с тем, что в алфавит символов могут входить строчные и прописные буквы со схожим начертанием, а также составные символы, образованные из нескольких более простых символов. Для решения этой проблемы систему распознавания символов дополняют системами семантического или структурного анализа, что существенно усложняет информационную систему для распознавания текста. В настоящее время для распознавания одиночных символов широко применяют сверточные нейронные сети, для обучения которых используют базу данных с изображениями распознаваемых символов. В работе предложен алгоритм, отличающийся тем, что в изображение одиночного символа для обучающей выборки включают фрагменты символов, которые могут быть расположены в строке в непосредственной близости от распознаваемого символа. Формирование изображений для обучающей выборки имитирует процесс сегментации символа по яркости, который обычно используют при выделении символа для дальнейшего распознавания. При этом оценивают размеры символа, дополняют его изображениями соседних символов, а затем оценивают размеры области, изображения, которое будет помещено в обучающую выборку. Полученное изображение масштабируют и обрезают таким образом, чтобы на вход нейронной сети поступали изображения заданного размера. В работе для распознавания алфавита символов, включающего прописные и строчные символы русского и английского алфавитов, цифры, символы и знаки препинания предложено использовать множество сверточных нейронных сетей, каждая из которых обучена распознавать один символ. Выбор символа осуществляется путем сравнения откликов всех нейронных сетей и выбора максимального отклика. Проведено сравнение предложенного алгоритма подготовки данных для обучения с известным алгоритмом, основанным на использовании изображений одиночных символов. Установлено, что предложенный алгоритм подготовки данных для обучения обеспечивает повышение точности распознавания алфавита из 138 символов более, чем в два раза.








