Главная » Анализ данных » Анализ системы восходящего внимания в задачах интерпретации сцен

Анализ системы восходящего внимания в задачах интерпретации сцен

Нгуен Ба Нгок

Научный руководитель: Аксёнов С. В.

Томский политехнический университет

E-Mail: Nguyen_bn@hotmail. com

Одной из наиболее актуальных проблем в области искусственного интеллекта является проблема распознавания образов. Несмотря на многочисленные исследования в данной сфере вычислительной нейронауки, данная проблема еще очень далека до своего окончательного разрешения [1]. Актуальность исследований работы обусловлена необходимостью разработки и внедрения архитектур, алгоритмов для обеспечения более надежных результатов распознавания сложных объектов, находящихся на произвольном фоне [2].

Сетчатка глаза человека ежесекундно подвергается бомбардировке сигналов от окружающих объектов. Однако мозг производит фильтрацию огромного массива данных для выделения действительно значимых фрагментов. Данный процесс носит название селективного внимания. Подчеркнем, что процесс распознавания следует за вниманием, а не предшествует ему [3].

Модель восходящего внимания [4] анализирует входную сцену и выделяет на ней наиболее контрастные фрагменты, при этом для фрагментов оцениваются яркость, цветовая гамма, контрастность, плотность точек одного цвета, размеры.

На первом этапе обработки, необходимо разделить исходное изображение на множество отдельных каналов. С помощью линейной фильтрации получим несколько карт свойств: карта яркости, карты красного, зеленого, голубого и желтого оттенков, и карты локальных ориентаций.

Активные области, расположенные на одной и той же позиции на картах свойств комбинируются для возбуждения активности на карте особенностей. С помощью WTA сети, локализуется область с наивысшей интенсивностью, и фокус внимания устанавливается на эту позицию, далее при анализе сцены используется выделенный фрагмент. Визуальные характеристики

Рассчитываются с помощью линейной фильтрации в 8 пространственных масштабах, затем по граничной разности вычисляется локальный пространственный контраст в каждой из 42 карт свойств. Взаимодействующее латеральное торможение иллюстрирует конкуренцию для

Выделения особенности в каждой карте свойств. После конкурентной борьбы, карты свойств комбинируются в одной «Карте видимости», для каждого типа свойств. Карта особенности выполняется как двумерная плоскость интегрирующих нейронов. Механизм возвратного торможения блокирует текущий фокус внимания, поэтому фокус внимания автоматически ориентируется в следующем месте на карте особенностей.

Этот домен продается здесь: telderi.ru, и еще много других