РАСПОЗНАВАНИЕ ТЕКСТОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

№11,

Технические науки

Зарипова Римма Солтановна (Кандидат технических наук)

Кривоногова Анастасия Евгеньевна


Ключевые слова: НЕЙРОННЫЕ СЕТИ; РАСПОЗНАВАНИЕ ТЕКСТА; ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ; NEURAL NETWORKS; CHARACTER RECOGNITION; ARTIFICIAL INTELLIGENCE.


Аннотация: Для качественного распознавания текста применяются многослойные свёрточные нейронные сети. В них закладывается определенный алгоритм, позволяющий добиться поставленной задачи путем использования различных методов, которые, в свою очередь, составляют полную систему распознавания текста. Многие типы неконтролируемых алгоритмов распознавания объектов были применены к различным областям машинного обучения, таким как классификация изображений, анализ настроений и распознавание текста.

Искусственные нейронные сети (ИНС) постепенно начинают находить применение в повседневной жизни, получая при этом широкое распространение во многих сферах деятельности человека. Так как изучение искусственного интеллекта – направление сравнительно молодое, в библиотеках и в интернете недостаточно информации по этой теме. Множество компаний по всему миру готово инвестировать в развитие искусственного интеллекта, несмотря на то, что искусственные нейронные сети только начинают входить в жизнь. К примеру, за последний год количество запросов в поисковой системе Google, касающихся искусственного интеллекта, возрос в два раза.

Распознавание текста для машины представляет собой сложную проблему. Ранее оно было возможно только благодаря очень нагроможденным функциям и моделям. Но сейчас, вследствие развития сферы информационных технологий, становится возможным упростить, а то и улучшить качество распознавания текста. Система распознавания текста имеет огромное применение на практике и не менее большое количество сложностей. Если стандартное распознавание текста подразумевает хорошее отсканированное изображение, то как решить проблему плохого освещения, ракурса, различных вариаций шрифтов? Данная система относится к теме распознавания образов, которая подразделяется на два основных направления:
• изучение способностей к распознаванию, которыми обладают живые существа;
• развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях.

Очевидно, что следует проанализировать направление, касающееся прикладных целей. Для решения этой проблемы применяются искусственные нейронные сети.

Искусственные нейронные сети (ИНС) – одно из направлений искусственного интеллекта, основной задачей которой является моделирование работы человеческого мозга. ИНС состоит из взаимосвязанных между собой нейронов, которые, в свою очередь, являются простыми процессорами, работающими параллельно. Место соединения двух нейронов называют синапсом. Каждый нейрон имеет внутреннее состояние, которое называется сигналом активации. Выходные сигналы могут быть отправлены другим устройствам. Но, в отличие от естественной нейронной сети, ИНС упрощена в тысячи и миллионы раз. Биологические нейроны имеют трёхмерную структуру, когда как ИНС всего лишь двухмерную. Это сделано потому, что компьютеры просто не в силах обработать такой поток информации ввиду нехватки ресурсов. Стоит отметить, что ИНС обладают функцией самообучения. Нейронная сеть имеет два цикла: обучение и функционирование. Этап обучения нейронных сетей, в свою очередь, можно разделить на 2 вида: обучение с учителем и обучение без учителя.

В основе обучения нейронной сети учителем лежит предоставление ей обучающей выборки, которая будет содержать входные правильные данные. Нейронная сеть будет сравнивать полученный результат с правильным и, исходя из этого, изменять веса нейронов так, чтобы ответ минимально отличался от необходимого. Иными словами, происходит обучение нейронной сети выполнять определенную функцию, при этом регулируя значения (коэффициенты весов) между элементами. Сеть корректируется на основе сравнения, необходимого и полученного результатов.

Обучение без учителя, в отличие от предыдущего, заключается в том, что нейронная сеть получает лишь входные данные. Далее сеть наблюдает и постепенно начинает классифицировать подаваемые данные. Внутри создаются собственные группы, благодаря которым нейронная сеть начинает узнавать и относить данные к той или иной собственной выборке.

Именно благодаря самообучению нейронной сети становится возможным распознавать тексты разных сложностей. В случае распознавания текста применяются свёрточные нейронные сети (СНС). На данный момент свёрточные нейронные сети используются для распознавания рукописного ввода, визуальных объектов, символов и так далее. На самом базовом уровне сверточная нейронная сеть представляет собой просто многоуровневую иерархическую нейронную сеть.

Свёрточные нейронные сети пользуются тем, что входные данные состоят из изображений, и они ограничивают построение сети более разумным путем. Слои свёрточных нейронных сетей состоят из нейронов, расположенных в 3-х измерениях (ширина, высота, глубина). В отличие от простых нейронных сетей, граничные веса в сети распределяются между различными нейронами в скрытых слоях. Для того чтобы начать распознавание текста, предварительно необходимо обработать изображение, воспользовавшись соответственным модулем.

Предварительная обработка связана с подготовкой изображения для последующего анализа и использования. В некоторых случаях может потребоваться улучшение качества, устранение различных шумов. Для этого изображения упрощаются, улучшаются, изменяются. Первый шаг в предварительной обработке состоит в том, чтобы преобразовать цветное изображение в черно-белое. На следующем этапе применяется фильтрация. В конечном счете, предварительная обработка изображения сводится к выполнению следующих операций: изображение в черно-белом формате; фильтрация; обнаружение данных; извлечение данных.

Как и было сказано ранее, распознавание текста – это проблема машинного обучения нескольких десятилетий. В общем плане она состоит из двух основных компонентов: поиск текста и распознавание слов. Для начала необходимо обнаружить сам текст (отдельные слова или строки). Задача заключается в том, чтобы выделить необходимый участок прямоугольником, при этом объединяя символы в слова. Таким образом, конечный результат сегментации и распознавания представляет собой набор аннотированных ограничивающих прямоугольников и множество методов сегментации и распознавания. Эти методы включают в себя различные варианты вероятностных графических моделей для совместной сегментации и распознавания. К примеру, к ним относятся геометрические модели, которые понимают, что высота некоторых символов больше, чем высота других (буква «А» по сравнению с буквой «о») или тот факт, что определенные символы одинаковы по смыслу и одновременно различны (например, в верхнем и нижнем регистрах). Аналогичным образом, языковые модели предоставляют информацию о том, как символы обычно располагаются внутри слов.

Следующий модуль распознавания символов – экстракция (извлечение). Это особая форма, при которой алгоритму даются на вход очень большие данные, а на выходе извлекается маленький объем, содержащий проанализированные данные. В результате работы данного модуля получается готовый распознанный текст. До использования нейронных сетей данная система представляла собой нагроможденные вычисления, которые опирались на сложные графические модели. Изложенный выше метод используется для распознавания самых разных символов на основе нейронной сети. Его точность составляет 85%. Проблема распознавания текста остаётся актуальной до сих пор.


Список литературы

  1. Зарипова Р.С. Инновационные аспекты подготовки технических специалистов / Р.С. Зарипова, Р.Р. Галямов // Аллея науки. – 2017. – Т.1. – №15. – С.343-346.
  2. Ситников С.Ю. Компьютерные технологии: применение пакетов прикладных программ при работе студентов естественнонаучных специальностей в учебных лабораториях / С.Ю. Ситников, Ю.К. Ситников // Ученые записки ИСГЗ. – 2013. – №1-2(11). – С.171-174.
  3. Кашипова Л.А. Использование информационных технологий при реализации структурного анализа промышленных теплоэнергетических систем / Л.А. Кашипова, А.А. Звегинцев, Л.В. Плотникова / Роль и место информационных технологий в современной науке: Сборник статей Международной научно-практической конференции. – 2016. – С.15-17.