WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

На правах рукописи

Питенко Александр Андреевич

НЕЙРОСЕТЕВОЙ АНАЛИЗ В ГЕОИНФОРМАЦИОННЫХ СИСТЕМАХ

Специальность 05.13.16 – применение вычислительной техники, математического

моделирования и математических методов в научных исследованиях (в экологии)

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Красноярск – 2000

Работа выполнена в Институте вычислительного моделирования СО РАН Научные руководители: доктор физико-математических наук, профессор А.Н. Горбань, кандидат физико-математических наук, доцент Е.М. Миркес Официальные доктор биологических наук, оппоненты: профессор Л.А. Левин кандидат технических наук Л.И. Покидышева

Ведущая организация: Сибирский государственный технологический университет

Защита диссертации состоится 30 ноября 2000 года в _ часов на заседании Диссертационного совета К 064.54.01 при Красноярском государственном техническом университете по адресу:

660074, г. Красноярск, ул. Киренского, 26.

С диссертацией можно ознакомиться в научной библиотеке Красноярского государственного технического университета.

Отзывы на автореферат в 2-х экземплярах с подписью составителя, заверенные печатью организации, просим направлять в адрес Диссертационного совета.

Автореферат разослан “ ” 2000 года

Ученый секретарь Диссертационного совета

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы Необходимость проанализировать картографические данные, накопленные в Географических информационных системах (ГИС) возникает у представителей различных профессий. Прежде всего, это актуально для управляющих структур, владеющих большими массивами информации, на основе которых принимаются решения. В этом также нуждаются специалисты, оценивающие и прогнозирующие состояние какой-либо области человеческой деятельности, например, рынков сбыта продукции, загрязнения территории и т.п. Нарастающие информационные потоки в современном обществе, разнообразие информационных технологий, повышение сложности решаемых на компьютере задач увеличивают нагрузку на пользователя этих технологий и ставят задачу переноса проблемы выбора и принятия решений с человека на ЭВМ.





Одним из путей решения этой задачи является применение аналитических систем, которые могут быть составной частью ГИС.

Далеко не все ГИС снабжены возможностями специализированного анализа. Это связано с тем, что четкой схемы проведения таких работ не существует и организации, занимающиеся ими, предпочитают производить анализ по собственным методикам и правилам. Работа со специфическими данными специфическим образом является характерной чертой этого типа анализа. Кроме того, взгляды на приемы его проведения могут меняться с течением времени. Поэтому такие возможности в ГИС представляются средствами создания приложений самими пользователями. Сложность состоит в том, что для каждой специализированной области возникает необходимость создавать отдельное приложение к ГИС и часто даже свою методику обработки. Это не всегда возможно и часто дорого.

Географические комплексы плохо поддаются формализации.

Существующий математический аппарат недостаточно приспособлен для решения географических задач. Формулировки географических задач, описания явлений допускают некоторый произвол или двоякое толкование, по крайней мере, на современном этапе исследований.

Строгие алгоритмы многомерной классификации могут не соответствовать уровню строгости и точности самих задач. Это иногда приводит к результатам, не отвечающим существу и содержательному смыслу. В плане решения данной проблемы внимание исследователей (географов и не географов) привлекает теория искусственного интеллекта и попытки разработки на ее основе методов решения таких задач.

ГИС являются хорошей средой для внедрения методов искусственного интеллекта и экспертных систем. Это вызвано, с одной стороны, разнообразием и сложностью данных в ГИС, с другой — наличием большого числа аналитических задач при использовании ГИС.

Одновременно с этим, большинство проблем и задач в ГИС слабо структурировано и слабо формализовано.

Построение традиционных математических моделей для решения таких проблем затруднено или сопряжено со значительными затратами, невозможностью полного исследования внутренних взаимодействий в системе, большим числом влияющих факторов, неполнотой или неточностью описания объектов, динамикой или малой изученностью неформальном уровне экспертами – специалистами в предметной области.

В современных условиях для решения подобных задач используются искусственные нейронные сети.

Нейросетевые модели претендуют на то, чтобы стать универсальным аппаратом, решающим разные специфические задачи из разных проблемных областей в ГИС. Такая универсальность обуславливается тем, что нейросетевые технологии дают стандартный способ решения многих нестандартных задач.

Интеграция основанных на нейросетевых технологиях средств решения слабо формализованных задач и геоинформационных систем позволит существенно повысить качество и скорость обработки исследовательских, учебных и других задачах.

Целью работы является:

разработка технологии интеграции искусственных нейронных сетей и геоинформационных систем и ее программная реализация;





разработка методов нейросетевого анализа связей между слоями ГИС и соответствующего программного инструментария;

представления в ГИС данных произвольной природы.

Задачи исследования:

анализ возможностей и сложностей применения нейросетевых моделей в составе геоинформационных систем;

создание нейросетевых методов решения аналитических задач в ГИС;

взаимодействия нейросетевых моделей совместно с ГИС;

разработка программной системы, интегрирующей нейросетевые и геоинформационные технологии;

разработка методов картирования, визуализации и интеграции в ГИС данных произвольной природы;

экспериментальное исследование разработанных технологий с использованием модельных и реальных данных.

Научная новизна работы Научная новизна работы определяется тем, что впервые предложена и реализована технология интеграции искусственных нейронных сетей и геоинформационных систем. Разработаны методы нейросетевого анализа связей между слоями ГИС. Реализованы сети Паде-нейронов. Разработана технология упругих карт для картирования и представления в ГИС данных произвольной природы. Реализована программная система для нейросетевого анализа связей между слоями ГИС.

Практическая значимость Разработанная в диссертации технология нейросетевого анализа в ГИС предназначена для решения широкого спектра задач, связанных с анализом и прогнозом явлений и событий окружающего мира, с осмыслением и выделением главных факторов и причин, а также их возможных последствий, с планированием стратегических решений и текущих последствий предпринимаемых действий.

Разработанные в рамках технологии методы ориентированы на следующие применения:

• автоматизированное построение нейросетевых блоков для решения задач оценки, диагностики и прогнозирования на основе эмпирических данных в составе существующих геоинформационных систем;

• построение и исследование нейросетевых моделей решения задач анализа данных в ГИС;

• представление и анализ средствами ГИС многомерных данных произвольной природы.

Основные положения работы докладывались и обсуждались на: V, VI, VII и VIII Всероссийском семинаре "Нейроинформатика и ее приложения" (Красноярск, 1997, 1998, 1999 и 2000 гг.), конференциях молодых ученых Института вычислительного моделирования СО РАН (Красноярск, 1998, 1999 и 2000 гг.), конференциях молодых ученых Красноярского научного центра СО РАН (Красноярск, 1998, 1999 и непрерывнологические сети и модели” (Ульяновск, 1998 г.), 5-й Международной конференции "Математика. Компьютер. Образование" (Дубна, 1998 г.), Третьем сибирском конгрессе по прикладной и индустриальной математике "ИНПРИМ-98" (Новосибирск, 1998 г.), Всероссийских научно-технических конференциях “Нейроинформатика” в рамках научных сессий МИФИ (Москва, 1999 и 2000 гг.), международных конференциях "ИНТЕРКАРТО" (Барнаул 1998г. и Якутск 1999 г.), XXXVII и XXXVIII международных научных студенческих конференциях "Студент и научно-технический прогресс" (Новосибирск, 1999 и 2000 гг.) По теме диссертационной работы опубликовано 16 работ и 9 тезисов докладов.

Структура диссертации Диссертация состоит из введения, четырех глав, заключения и списка цитируемой литературы из №№ наименований, содержит №№ рисунков. Общий объем диссертации (с учетом иллюстраций) составляет №№ страниц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность разработки нейросетевых блоков в составе прикладных геоинформационных систем, формулируются цель и задачи работы, дан обзор содержания работы.

Первая глава диссертации "Проблема анализа данных в ГИС" посвящена аналитическому обзору проблемы анализа данных в ГИС.

Дается обоснование применению систем анализа данных в ГИС.

Задача анализа данных формулируется как задача классификации географических комплексов, и описываются трудности в решении такой задачи.

Во второй главе "ГИС как средство визуализации и анализа данных различной природы" описывается организация данных в ГИС. Дается определение ГИС. Рассказывается об основных понятиях ГИС, в том или ином виде присутствующие во всех современных геоинформационных системах. Описываются модели представления информации: растровая модель; векторная нетопологическая модель; векторная топологическая модель. Рассматриваются преимущества растровой модели как наиболее подходящей для обработки данных предлагаемыми в работе методами.

Описываются основные идеи метода анализа данных в ГИС с помощью искусственных нейронных сетей. Рассматриваются аналитические задачи, которые можно отнести к проблемам восстановления функции по конечному набору значений или построение отношений на множестве объектов. К такой постановке сводятся, например, задачи диагностики или оценки состояния исследуемого объекта или процесса, классификации, прогнозирования временных последовательностей. Подобные задачи сводятся, как правило, к задаче заполнения пробелов в таблице.

Дается формальная постановка задачи анализа данных в ГИС как задачи заполнения пробелов в таблице. В такой постановке преследуемая цель – это восстановление пропущенных данных. Для задач ГИС проблема восстановления пропущенных данных формулируется как построение (дополнение) одного из слоев по информации, имеющейся в других слоях карты. В данной формулировке она является решением большинства классификационных задач в ГИС.

относительно расположения географических явлений в пространстве.

Вводится фундаментальное предположение о фиксированной «вертикальной» связи между слоями.

Пусть существует набор пространственных данных. Предположим что каждую точку сетки с координатами (x,y) характеризует некоторый вектор состояний (z1,…,zn). Для всей сетки получаем набор векторов Z1,…,Zn – параметров в точках сетки мониторинга. Часть параметров – координаты. В общем случае пространственное положение может быть выражено через относительные единицы, например, как обратно пропорциональное квадрату расстояний между объектами.

Данные легко представимы в виде двумерной таблицы, в которой столбцы – это структура параметров Z1,…,Zn, а строки – точки сетки.

Показатели состояния Z1,…,Zn разделяются на входные переменные Ci (i = 1,…,p), полученные тем или иным способом, и выходные Dj (j = 1,…,q), (p + q = n), которые нужно выразить через входные. Т.е.

найти функционал: Dj = F(C1,…,Cp), (j = 1,…,q). Выходные параметры могут быть какими-либо известными классификациями, непрерывными измерениями или другими значениями. Каждый параметр Zk может быть отдельным атрибутивным слоем в ГИС. Предположение о фиксированной "вертикальной" зависимости между слоями состоит в следующем.

Упростим задачу, сведя ее к классификации на два класса с одним выходным параметром. Если такое разделение возможно, то F является решающим правилом отнесения к одному из классов в зависимости от входных данных. Следовательно, отнесение точки сетки к классу зависит только от параметров самой точки и не зависит напрямую от соседних точек. Все связи между соседями, в том числе пространственное положение, можно закодировать в параметрах Z1,…,Zn для каждой точки.

Для большинства классификационных задач, например, поиск полезных ископаемых по косвенным признакам, прямую пространственную привязку можно исключить. Это позволяет знания о уже разведанной территории переносить на исследуемую. Естественно с учетом некоторой похожести.

Основная задача, которую нужно решить – это задача заполнения пробелов (восстановления, предсказания) в выходных параметрах. Иными словами построение (дополнение) одного или нескольких слоев по информации, имеющейся в других слоях карты. Попутно, возникает ряд проблем, связанных с заполнением пропусков данных во входных параметрах, исключением незначимых для решения основной задачи признаков и т.п.

В работе описывается круг задач, требующих решения в ГИС, для которых могут быть использованы нейросетевые технологии.

• классификация процессов и явлений;

• районирование, типология;

• выявление определяющих факторов;

• интерполяция и создание моделей поверхности распределенных данных и т.д.

Для каждой задачи описывается преимущества нейросетевого подхода. Решение описанных задач сводятся к решению основной, которая формулируется как задача построения слоя. Она означает заполнение его недостающих частей (или построение слоя полностью) по информации, функциональной зависимости между параметрами, полученными эмпирическим путем, и скрытыми теоретическими параметрами, определяющими сущностные характеристики каждой конкретной точки.

Дальше в главе описываются основные идеи визуализации и анализа данных произвольной природы. Дается общее и формальное описание задачи визуализации, картографирования и анализа данных. Задача заключается в отображении многомерных данных в представимую человеком размерность (на плоскость) с сохранением топологии пространства, то есть так, чтобы точки данных, близкие на плоскости (на карте), были близки и в исходном пространстве (обратное в общем случае неверно).

Картографирование является прямым следствием визуализации данных. Объекты, с которыми оперирует метод, отображаются в слои, если угодно одной территории данных, с которыми можно проводить аналитические операции, принятые в ГИС.

Описываются сущности, с которыми оперирует метод: данные, многообразия, проекции, развертки, слои.

Третья глава "Нейросетевой анализ связи между слоями" состоит из двух частей "Методы нейросетевого анализа связей между слоями" и "Программные средства и примеры использования". Первая часть посвящена вопросам построения и использования нейросетей в геоинформационных системах. В ней описывается технология построения нейросетевых моделей в составе геоинформационной системы и задачи для нейронных сетей.

предназначенные для решения задач относящихся к классу проблем построения функции по конечному набору значений или построение отношений на множестве объектов. К этому классу относятся распространенные и актуальные в ГИС задачи классификации процессов и явлений, районирования и типологии, временной анализ географических комплексов, интерполяция и создание моделей поверхности, анализ и прогнозное картирование пространственно распределенных данных. Такие задачи формализуются как задачи построения действительной функции по конечному набору значений, классификации, анализа временных рядов, выявления зависимостей в данных.

Общая постановка таких задач может быть представлена в следующем виде. Существует набор переменных, описывающих состояние объекта или явления (входных переменных), необходимо найти значения некоторых целевых параметров (выходных переменных). То есть формально дано: объект или процесс, который является предметом исследования; требуется получить значение некоторого зависимого параметра, который характеризует состояние объекта с точки зрения целей исследования.

Подобный тип задач определяется как задача заполнения пробелов в таблицах данных. Такое определение предполагает, что постановка задачи может быть представлена в виде таблицы с неизвестными значениями некоторых целевых параметров. Обычно поля таблицы соответствуют выделенным признакам, описывающим объект или процесс, а записи – конкретным примерам проявления этих признаков.

Анализ особенностей и свойств нейросетевой технологии решения задач в ГИС позволяет сформулировать основные проблемы при построении нейросетевых компонент в составе геоинформационных систем:

• Проблема программной интеграции искусственных нейронных сетей и геоинформационных систем.

геоинформационной системы.

• Проблема использования нейросетевых моделей в составе геоинформационной системы.

• Проблема технической реализации нейросетевых компонент.

Проблема интеграции ИНС и ГИС может быть решена, по крайней мере, тремя способами: 1) интеграция НС моделей в ГИС; 2) развитие интерфейса между ИНС и ГИС, как самостоятельными системами; 3) создание НС систем с включением интерфейса взаимодействия с ГИС.

В работе используется подход, реализующий создание ГИСприложения на основе библиотеки компонент ГИС. Программная система, созданная по такой технологии, может осуществлять стандартный для ГИС набор операций с картой и не имеет ограничения на расширяемость модулей для решения аналитических задач.

Описывается технология построения нейросетевых моделей в составе геоинформационной системы.

Блок, реализующий нейросетевые модели (нейроимитатор), представлен в виде нескольких модулей, решающих определенные задачи и взаимодействующих через фиксированный набор запросов. В работе выделяются и описываются следующие компоненты нейроимитатора:

исполнитель.

Нейронная сеть представляется как конструкция, состоящая из элементарных блоков – синапсов, сумматоров, умножителей, нелинейных элементов и точек ветвления. Из этих блоков можно построить практически любую нейронную сеть любой архитектуры. В данной работе используются сети слоистой архитектуры.

С такой структурой нейросеть можно представить как сложную вектор-функцию:

где l – номер компоненты выходного вектора, a,b – векторы параметров или весов связей, x – вектор входных данных или переменных, p – число слоев сети, np – число нейронов в p-м слое, fik(a,b,f) – функция поведения Паде-нейрона:

где с0, k = 1...p – номер слоя сети, i – номер нейрона в k-м слое. Пример нейросети вида (1) представлен на рис.1.

слабоструктурированных задач анализа зависимостей:

Рис. 1. Нейросеть с нелинейными Паде-преобразователями 1. Сбор данных, определение входных и целевых параметров, указание их типов (дискретные или непрерывные), диапазонов изменений.

2. Формирование обучающей и тестовой выборки.

3. Выбор вида, структуры, параметров нейросети.

4. Выбор метода оценки, интерпретатора ответов, метода оптимизации и определение их параметров.

5. Формирование нейросети.

6. Определение условий останова работы сети.

7. Обучение нейросети.

8. Определение числа повторений эксперимента с разными начальными условиями (инициализируемой картой синаптических весов нейросети) для сбора статистических данных.

9. Определение критериев выбора лучшей нейросети.

10. Сохранение значений параметров задачника, нейросети и процесса обучения.

11. Исследование модели на оптимальный выбор системы исходных показателей, дублирование исходных признаков, значимость исходных признаков для решения основной задачи. При необходимости – переход к п. 1.

12. Анализ полученных результатов, использование построенной нейросетевой модели.

Проводиться конкретизация некоторых перечисленных пунктов для задач в ГИС. Тривиальные и общие решения в некоторых пунктах не затрагиваются. Описываются только особенности связанные с такими задачами, как:

• классификация процессов и явлений;

• районирование и типология;

• выявление определяющих факторов;

• временной анализ;

• создание моделей поверхности, интерполяция, анализ и прогнозное картирование пространственно распределенных данных.

В части "Программные средства и примеры использования" рассматривается реализация программного комплекса для нейросетевого анализа данных в ГИС. Описываются особенности разработанной программной системы, ее структура и функции.

Программную систему для нейросетевого анализа данных в ГИС функционально можно разделить на три подсистемы.

• Подсистема взаимодействия с ГИС-компонентой.

• Подсистема получения и подготовки данных.

• Подсистема нейросетевой обработки данных.

1. Подсистема взаимодействия с ГИС-компонентой обеспечивает интерфейс между динамически подсоединяемой библиотекой, содержащей программный ГИС-объект, и другими подсистемами. Транслирует запросы системы и вызывает внутренние методы ГИС-объекта, отслеживает события и обеспечивает получение и передачу данных. Позволяет выполнять набор следующих операций:

1) Картографические операции:

• Открытие слоев GeoDraw для DOS и GeoDraw для Windows, косметических слоев ГеоГраф 1.5, растровых слоев. Все сторонние форматы, поддерживаемые ГеоГраф 1.5 (SXF, DX90), могут использоваться только через импорт карт ГеоГраф 1.5.

• Импорт картографических композиций созданных в ГеоГраф 1.1 и • Функции векторного нетопологического редактора для косметических слоев ГеоГраф 1.5.

• Масштабирование карты.

• Варьирование объектным составом карты.

• Создание тематических слоев.

• Оверлейные операции.

• Изменение способа отображения объектов (цвет, тип линии и т.п.), в том числе и определение символогии через значения атрибутов, то есть синхронизация визуализации с изменениями в базах 2) Атрибутивные операции:

• Связь таблиц атрибутов со слоями карты.

• Работа с таблицами атрибутивных данных.

• Получение данных об объектах слоя.

• Возможность опрашивать через карту в режиме реального времени базы данных.

2. Подсистема получения и подготовки данных позволяет получать из карты данные в удобном для нейросетевой обработки виде и производить некоторую предобработку.

3. Подсистема нейросетевой обработки данных (нейроимитатор) предназначена для построения моделей ИНС и решения с помощью ИНС задач ГИС.

предварительная обработка данных, возможность конструирования структуры многослойной сети, выбор метода оптимизации и вида оценки, обучение и тестирование нейросетевых моделей, определения минимального набора входных параметров, чтение и сохранение нейросетей на диске.

Результатом функционирования модуля является файл результатов (таблица), в котором сохраняются значения выходных параметров нейросети, полученные на основе текущих данных. В файле нейросети программа сохраняет полученную нейросетевую модель для дальнейшего использования.

Описанные методы и функции реализованы автором в программной системе GISNNA, предназначенной для решения задач ГИС методами нейроинформатики.

Разработанная программная система может быть использована в информационных системах, работающих под управлением ОС MS Windows 95/98/NT и допускающих реляционное представление данных для решения задач.

Взаимодействие с полнофункциональной геоинформационной системой осуществляется на уровне обмена файлами. В программу может быть загружена карта, созданная в ГИС Географ. Данные для анализа извлекаются из карты и атрибутивных таблиц. Сохранение результатов анализа производиться в этих таблицах. Запись картографических объектов может производиться в файлы обменных форматов.

Для решения задачи восстановления пропусков разработаны технология получения данных из ГИС и технология восстановления пропущенных данных с помощью нейросетевых моделей.

Задачу получения данных из ГИС в приемлемой для обработки форме может быть разбита на несколько подзадач.

• Создание сеточного слоя для растрирования векторного.

• Получение матричной модели слоя по векторным данным в узлах регулярной сетки цифровой поверхности.

• Постобработка. Различного вида фильтрация (сглаживание, выделение контуров, контраст …) • Визуализация матричных моделей, ввод и тематическая доводка слоя в ГИС.

Технология получения данных из ГИС описывается поэтапно, приводятся примеры.

нейросетевые модели. Для формирования и настройки нейросетевых моделей используются технология и методы построения нейросетей, разработанные во второй главе данной работы.

Для моделирования искусственных нейронных сетей использовался разработанный программный комплекс. Программа позволяет выполнять как элементарные операции с картой, так и традиционные операции над нейронными сетями (создание сети, ее обучение, тестирование), а также предобработку (растрирование, фильтрация) и визуализацию результатов.

Вычислительные эксперименты проводились на IBM-совместимых персональных компьютерах.

Целью экспериментального использования разработанных методов была проверка работоспособности и экспериментальное изучение возможностей предложенных методов и программных средств.

В качестве примеров решения практических задач с использованием разработанных средств рассматривается задача в области анализа медикоэкологических данных.

В работе использовалась электронная экологическая карта города Красноярска. Карта содержит данные о морфоструктуре рельефа, плотности и фитопатологическом состоянии растительного покрова в городе, загрязнениях некоторыми, в том числе и канцерогенными, веществами почв и снежного покрова, а также информацию о населении города. Это плотность жилищно-промышленной застройки, динамика показателя заболеваемости злокачественными новообразованиями жителей Красноярска.

Исходя из предположения о пространственной связи повышенных загрязнений атмосферы и почвы с ростом заболеваемости, была поставлена задача заполнения пробелов в данных слоя заболеваемости на основе данных из других слоев.

Обучающее множество создавалось по половине известной информации. Тестирование проводилось для всего слоя. Ошибка обучения была сведена к нулю. Ошибка обобщения составляла 10 – 20 %.

Обученная нейросеть может распространять знания о зависимости между слоями на отсутствующие области карты. При тестировании нейросети по задачнику и примерам, не входящим в задачник, результат записывается в таблицу, после чего, полигональный слой ("сетка") может быть раскрашен в соответствии с полученными при тестировании значениями.

Исследовался также вопрос значимости исходных показателей для решения задачи. Какие из входных сигналов являются доминирующими, (значимыми) при принятии нейросетью решения, а какие нет. Полученные показатели значимости можно использовать при анализе вектора входных сигналов на избыточность, сокращая незначимый вход и дообучая сеть.

Значимость параметра зависит от точки карты, поэтому возможна раскраска "сетки" ("слоя значимости") для каждого параметра и ее анализ.

Получающиеся в результате тематические слои показывают, какие области из слоев участвующих в качестве входов были значимы при построении целевого слоя. Таким образом, получается представление о территориальном распределении значимости. Поля значимости рассчитываются как частные производные нейросетевой функции от интерпретированы как характеристика влияния входных параметров на значение выходного в данной точке. Если в некоторой точке значение производной по параметру меньше нуля, то при его увеличении будет уменьшаться значение целевого параметра и наоборот.

В четвертой главе "Технология картирования произвольных данных" описывается технология визуализации, картографирования и анализа произвольных данных. Рассматривается представление данных и алгоритм построения упругой карты, моделирующей данные. Предложены различные способы проектирования многомерных данных на двумерную сетку. Продемонстрировано применение методов визуализации произвольных данных на примере картографирования экономических таблиц.

Под визуализацией данных можно понимать такой способ описания данных, когда размерность их описания сокращается до двух измерений. В этом случае данные можно изображать, например, в виде точек на экране монитора компьютера. Если в процессе сокращения размерности будет сохранена существенная часть закономерностей, присущих данным (разбиение на классы, отношения соседства), то исследователь получает возможность наглядно представить себе исходный набор многомерных данных, сделать выводы об их распределении и, возможно, решить свои задачи.

заключающийся в построении вложенного в многомерное пространство данных двумерного многообразия, называемого упругой картой, которое определенным способом моделирует или аппроксимирует данные (то есть большая часть точек данных лежит в окрестности карты). После этого точки данных с помощью определенной процедуры переносятся или проецируются на карту (см. рис. 2.). После того, как найдены положения всех образов точек данных на карте, каждому объекту из набора данных можно поставить в соответствие пару координат, характеризующих положение образа на двумерной карте.

Проблема визуализации многомерных данных может быть разбита на несколько задач: построение карты, проектирование данных, раскраска карты и анализ результатов.

Основой для построения упругой карты является двумерная прямоугольная сетка G, вложенная в многомерное пространство, аппроксимирующая данные и обладающая регулируемыми свойствами упругости по отношению к растяжению и изгибу.

вариационной задачи на нахождение минимума следующего функционала:

где X - число точек в X; m – число узлов сетки (в случае прямоугольной сетки m = n1n2);, µ - коэффициенты упругости, отвечающие за растяжение и изогнутость сетки соответственно; D1, D2, D3 – слагаемые, отвечающие за свойства сетки, а именно:

узлов сетки к данным. Здесь Kij –подмножества точек из X, для которых узел сетки rij является ближайшим ( таксоны):

изогнутости (кривизны) сетки.

динамических ядер.

аппроксимацией множества X, она доопределяется до многообразия. На многообразие каким-либо образом проецируются точки данных. В работе описан алгоритм кусочно-линейного проектирования точек данных на построенное многообразие.

Следует заметить, что для описанных выше алгоритмов (как при построении карты, так и при проектировании) не является принципиальным наличие в данных пробелов.

После того, как карта построена, ее можно «развернуть» (см. рис. 2.) и наносить разного рода слои информации. В результате карта приобретает разные раскраски, дающие представление об исходном распределении данных. Такие раскраски могут быть построены с использованием богатого арсенала средств и методов ГИС. Таким образом, открывается новое широкое поле деятельности для использования ГИС-технологий для картирования информации самого разного происхождения.

Во-первых, на карте можно изобразить сами данные. При этом можно отображать различные разбиения на подмножества данных, в соответствии со значением того или иного признака.

Во-вторых, на карте можно изобразить произвольные функции координат, поскольку каждой точке с координатами u, v на двумерной карте соответствует точка в многомерном пространстве данных. Самыми простыми раскрасками являются раскраски, отражающие значение той или иной координаты в точках размещения карты. Кроме этого, на карте можно отображать такие координатные функции, как плотность распределения данных в пространстве или плотность того или иного подмножества данных. Кроме плотностей подмножеств можно представлять раскраски, отвечающие значению относительных плотностей подмножеств на фоне общего распределения.

В-третьих, на карте можно изображать различные свойства самого моделирующего многообразия. Например, можно получить раскраски, отражающие значения метрических коэффициентов карты или ее кривизны, свидетельствующие о мере ее растянутости и изогнутости на разных участках. Также интерес представляет такая раскраска карты, на которой цветом отражены расстояния от точки карты до ближайшей точки данных в многомерном пространстве. Такая раскраска позволяет оценить степень близости моделирующей карты к точкам данных в разных областях пространства.

В качестве примера применения описанной технологии метод визуализации произвольных данных был применен для картографирования таблицы крупнейших российских предприятий, взятой из журнала «Эксперт-200», и таблицы, созданной по результатам измерений экологических показателей за период с 1994 по 1997 гг.

Разработана и опробована на практике технология визуализации или картографирования многомерных данных (в которых могут содержаться пробелы) с помощью вложенных в пространство данных двумерных многообразий, названных упругими картами. И алгоритм построения этих многообразий, и общая идеология визуализации данных с их помощью существенно отличается от общепринятой на сегодняшний день технологии SOM. Особенностью технологии также является возможность непрерывного проектирования данных на карту, что существенно повышает точность представления данных.

Еще раз стоит отметить, что описанная технология открывает перспективы для использования всего арсенала методов и средств, накопленных в ГИС-технологиях для картирования данных самой различной природы, без привязки к географическим координатам. Можно сказать, что вместо географической карты в описанной технологии используется подложка, образованная структурой самих данных.

В заключении суммированы основные результаты работы и сделаны выводы.

В диссертационной работе разработаны и реализованы технология и методы нейросетевого анализа в ГИС, направленные на решение широкого спектра задач, связанных с анализом и прогнозом явлений и событий окружающего мира, с осмыслением и выделением главных факторов и причин, а также их возможных последствий, с планированием стратегических решений и текущих последствий предпринимаемых действий. Основные результаты работы заключаются в следующем:

1. Проведен анализ задач в ГИС и их решений в нейросетевом базисе, возможностей и методов применения нейросетевых моделей в составе прикладных геоинформационных систем.

2. Разработана и реализована технология применения искусственных нейронных сетей в геоинформационных системах, включающая в себя методы интеграции ИНС и ГИС и решение задач с помощью нейронных сетей.

3. Разработана технология решения задач в ГИС, включающая технологию получения данных из ГИС, методы создания и обучения ИНС с нелинейными Паде-преобразователями и технологию решения аналитических задач в ГИС. Впервые реализованы сети Паде-нейронов.

4. Разработана технология визуализации, картографирования и анализа многомерных данных (в которых могут содержаться пробелы) с помощью вложенных в пространство данных двумерных многообразий, названных упругими картами. Особенностью технологии также является возможность непрерывного проектирования данных на карту, что существенно повышает точность представления данных.

5. Разработана и реализована программная система для решения задач ГИС с помощью нейросетевых моделей. Система включает:

подсистему взаимодействия с ГИС-компонентой, подсистему получения и подготовки данных, подсистему нейросетевой обработки данных.

Программа позволяет выполнять как стандартные операции ГИС, так и традиционные операции полнофункционального нейроимитатора общего назначения, а также предобработку и визуализацию результатов.

6. Проведено экспериментальное исследование разработанных технологий с использованием реальных данных, которое подтвердило защищаемые положения. Метод нейросетевого анализа данных в ГИС апробирован на данных электронного экологического атласа города Красноярска.

Основные результаты диссертации опубликованы в следующих работах:

1. Питенко А.А. Нейросетевая аналитическая система для ГИС // Нейронные сети и модели: Труды международной НТК “Нейронные, реляторные и непрерывнологические сети и модели” (19-21 мая 1998 г.), Т.1 / Под ред. Л.И. Волгина. – Ульяновск: УлГТУ. – 1998. – С.6-8.

2. Питенко А.А. Нейросетевая аналитическая обработка и оценка природопользования в целях устойчивого развития территорий:

Материалы международной конференции, 1-4 июля 1998г. – Барнаул:

Издательство Алтайского государственного университета. – 1998. – С.161 – 167.

3. Иванова Ю.Д., Питенко А.А. Нейросетевая аналитическая обработка экологической информации в ГИС (пример) // ГИС для оптимизации природопользования в целях устойчивого развития территорий: Материалы международной конференции, 1-4 июля 1998г. – Барнаул: Издательство Алтайского государственного университета. – 1998.

– С.167–168.

4. Питенко А.А. Использование нейросетевых технологий при решении аналитических задач в ГИС // Методы нейроинформатики:

сборник научных трудов / Под ред. А.Н. Горбаня; Отв. за вып. М.Г.Доррер.

– Красноярск: КГТУ. – 1998. – С.152–163.

5. Питенко А.А. Нейросетевая аналитическая обработка данных в вычислительного моделирования СО РАН, апрель 1998г. – Красноярск:

ИВМ СО РАН. – 1998. – С.36–46.

6. Иванова Ю.Д., Питенко А.А. Электронный экологический атлас города Красноярска. – Препринт – "Информационный материал и руководство пользователя". – Красноярск: ИВМ СО РАН. – 1999. – 16с.

7. Питенко А.А. Нейросети для геоинформационных систем. // Всероссийская научно-техническая конференция “Нейроинформатика-99”.

Сборник научных трудов. Ч.1. – М.: МИФИ.– 1999. – С.65-68.

8. Иванова Ю.Д., Питенко А.А. Электронный экологический атлас Института вычислительного моделирования СО РАН, март 1999г. – Красноярск: ИВМ СО РАН. – 1999. – С. 38–42.

9. Питенко А.А. Новый подход к решению аналитических задач в вычислительного моделирования СО РАН, март 1999г. – Красноярск: ИВМ СО РАН. – 1999. – С.89–90.

10. Питенко А.А. Картографирование всех и всяческих данных. // ИНТЕРКАРТО-5 : доклады международной конференции, часть 1. – Якутск: ЯГУ. – 1999. – С.71–78.

11. Питенко А.А. Нейросетевая парадигма решения аналитических научной студенческой конференции.–Новосибирск: НГУ.– 1999. – С.34-35.

данных. // Нейроинформатика и ее приложения. Тезисы докладов VII Всеросс. семинара. – Красноярск: КГТУ. – 1999. – С.114-115.

произвольных данных. // 2-я Всероссийская научно-техническая конференция “Нейроинформатика-2000”. Сборник научных трудов. Ч.1. – М.: МИФИ. – 2000. – С.75-80.

14. Зиновьев А.Ю., Питенко А.А. Россиев А.А. Проектирование многомерных данных на двумерную сетку. // 2-я Всероссийская научнотехническая конференция “Нейроинформатика-2000”. Сборник научных трудов. Ч.1. – М.: МИФИ. – 2000. – С.80-88.

15. Зиновьев А.Ю., Питенко А.А. Картографирование произвольных данных. // "Студент и научно-технический прогресс": Информационные технологии. Материалы XXXVIII международной научной студенческой конференции. – Новосибирск: НГУ.– 2000. – С.38-39.

16. Зиновьев А.Ю., Питенко А.А. Визуализация произвольных данных методом упругих карт // Материалы конференции молодых ученых Красноярского научного центра СО РАН, апрель 2000. – Красноярск: КНЦ СО РАН. – 2000. – С.18–20.

17. Зиновьев А.Ю., Питенко А.А. Визуализация данных методом упругих карт // Радiоелектронiка. Iнформатика. Управлiння, Запорожье. – 2000. – № 1. – С.76-85.

18. Зиновьев А.Ю., Питенко А.А. Технология визуализации произвольных данных методом упругих карт // Нейроинформатика и ее приложения. Тезисы докладов VIII Всеросс. семинара. – Красноярск:

КГТУ. – 2000. – С.73-76.

19. Зиновьев А.Ю., Питенко А.А. Применение метода упругих карт для визуализации экономических показателей // Нейроинформатика и ее приложения. Тезисы докладов VIII Всеросс. семинара. – Красноярск:

КГТУ. – 2000. – С.77-80.



 
Похожие работы:

«Жегуло Ольга Анатольевна ИССЛЕДОВАНИЕ И РЕАЛИЗАЦИЯ НЕПРОЦЕДУРНЫХ ПРЕОБРАЗОВАНИЙ ПРОГРАММ ДЛЯ ПОСТРОЕНИЯ РАСШИРЯЕМОЙ СИСТЕМЫ РАСПАРАЛЛЕЛИВАНИЯ 05.13.11 — Математическое и программное обеспечение вычислительных машин, комплексов, систем и сетей АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата технических наук Ростов-на-Дону – 2007 3 Работа выполнена на кафедре информатики и вычислительного эксперимента факультета математики, механики и компьютерных наук Южного...»

«Макарова Мария Александровна ВЕРИФИКАЦИЯ МЕЗОСКОПИЧЕСКОЙ МОДЕЛИ В РЕОЛОГИИ ПОЛИДИСПЕРСНЫХ ВЯЗКОУПРУГИХ ПОЛИМЕРНЫХ СРЕД 05.13.18 – Математическое моделирование, численные методы и комплексы программ Автореферат диссертации на соискание ученой степени кандидата физико-математических наук Барнаул 2007 Работа выполнена на кафедре высшей математики в ГОУ ВПО Алтайский государственный технический университет им. И.И. Ползунова Научный руководитель : доктор физико-математических...»

«Сачкова Елена Федоровна Методы, алгоритмы и программы приближенного решения задачи управления 05.13.11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей 05.13.01 Системный анализ, управление и обработка информации (технические наук и) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Переславль-Залесский 2009 г....»

«ПРОХОРОВ Евгений Игоревич Адаптивная двухфазная схема решения задачи структура – свойство Специальность 05.13.17 – теоретические основы информатики АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Москва – 2014 Работа выполнена на кафедре вычислительной математики механикоматематического факультета ФГБОУ ВПО Московский государственный университет имени М.В....»

«Круглов Игорь Александрович Нейросетевая обработка данных для плохо обусловленных задач идентификации моделей объектов 05.13.01 – Системный анализ, управление и обработка информации (в информационных системах) АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата технических наук Москва – 2013 Работа выполнена в Национальном исследовательском ядерном университете МИФИ. Научный руководитель : кандидат технических наук, доцент Мишулина Ольга Александровна Официальные...»

«Еременко Александр Сергеевич АВТОМАТИЧЕСКИЙ МОНИТОРИНГ ТРОПИЧЕСКИХ ЦИКЛОНОВ ПО ДАННЫМ МЕТЕОРОЛОГИЧЕСКИХ СПУТНИКОВ ЗЕМЛИ 05.13.18 – Математическое моделирование, численные методы и комплексы программ Автореферат диссертации на соискание ученой степени кандидата технических наук Владивосток — 2014 Работа выполнена в лаборатории спутникового мониторинга Института автоматики и процессов управления ДВО РАН. Научный руководитель : Алексанин Анатолий Иванович, доктор технических...»

«Портнов Игорь Сергеевич РАЗРАБОТКА ИНФОРМАЦИОННОЙ СИСТЕМЫ УПРАВЛЕНИЯ ПОТРЕБЛЕНИЕМ ТОПЛИВНОЭНЕРГЕТИЧЕСКИХ РЕСУРСОВ Специальность: 05.13.01– Системный анализ, управление и обработка информации (промышленность) АВТОРЕФЕРАТ Диссертация на соискание ученой степени кандидата технических наук Владикавказ 2009 Работа выполнена в ГОУ ВПО Северо-Кавказский горнометаллургический институт (государственный технологический университет) Научный руководитель : доктор технических наук, доцент...»

«Иванов Александр Сергеевич РАЗРАБОТКА АЛГОРИТМОВ И ПРОГРАММНО-АППАРАТНЫХ СРЕДСТВ ЦЕНТРАЛИЗОВАННОГО УЧЕТА ЭНЕРГОЗАТРАТ ЛОКАЛЬНОЙ ИНФРАСТРУКТУРЫ (05.13.01 – Системный анализ, управление и обработка информации) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Москва 2006 Работа выполнена в Московском государственном институте электронной техники (техническом университете) на кафедре радиоэлектроники Научный руководитель : Лауреат Государственной...»

«Захаров Андрей Павлович МОДЕЛИРОВАНИЕ ДИНАМИКИ РАСПРЕДЕЛЕННЫХ СИСТЕМ С ЗАПАЗДЫВАЮЩЕЙ ОБРАТНОЙ СВЯЗЬЮ 05.13.18 – Математическое моделирование, численные методы и комплексы программ АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Пермь – 2014 Работа выполнена в ФГБОУ ВПО Пермский государственный гуманитарнопедагогический университет Научный руководитель : доктор физико-математических наук, доцент, зав. кафедрой теоретической физики и...»

«УСОВ СЕРГЕЙ ВЛАДИМИРОВИЧ МЕТОДИКА ПРОВЕРКИ НАЛИЧИЯ ВОЗМОЖНОСТИ НЕСАНКЦИОНИРОВАННОГО ДОСТУПА В ОБЪЕКТНООРИЕНТИРОВАННЫХ СИСТЕМАХ Специальность: 05.13.19 – Методы и системы защиты информации, информационная безопасность АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Омск-2012 Работа выполнена в ФГБОУ ВПО ОмГУ им. Ф.М.Достоевского. Научный руководитель : доктор физико-математических наук, доцент Белим Сергей Викторович Официальные оппоненты :...»

«ЛИБМАН МИХАИЛ СЕРГЕЕВИЧ АЛГОРИТМИЧЕСКОЕ И МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПОВЫШЕНИЯ ОПЕРАТИВНОСТИ ПОИСКА ДАННЫХ В КОРПОРАТИВНЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ Специальность: 05.13.01 – Системный анализ, управление и обработка информации (в наук е и промышленности) Автореферат диссертации на соискание ученой степени кандидата технических наук Калуга - 2013 Работа выполнена в Калужском филиале Московского государственного технического университета им. Н.Э. Баумана. кандидат технических наук,...»

«Мазанова Валентина Ивановна МОДЕЛИ И АЛГОРИТМ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМ ПРОЦЕССОМ ЗАКАЛКИ СТЕКЛА ДЛЯ АВТОМОБИЛЬНОГО ТРАНСПОРТА Специальность 05.13.06 – Автоматизация и управление технологическими процессами и производствами (промышленность) Автореферат диссертации на соискание ученой степени кандидата технических наук Владимир - 2014 2 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования (ФГБОУ ВПО)...»

«Капустин Дмитрий Сергеевич МОДЕЛИ И АЛГОРИТМЫ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛЕНИЙ НА ГРАФИЧЕСКИХ ПРОЦЕССОРАХ И ИХ ПРИМЕНЕНИЕ В ПРОГРАММНЫХ СРЕДСТВАХ АВТОМАТИЧЕСКОГО ТЕСТИРОВАНИЯ ГРАФИЧЕСКИХ ПРИЛОЖЕНИЙ Специальность 05.13.11 – Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Санкт-Петербург 2013 2 Работа выполнена на кафедре Автоматика и вычислительная техника в...»

«ОЛЕНЦЕВИЧ Виктория Александровна МЕТОДИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ АНАЛИЗА И ПРОГНОЗИРОВАНИЯ БЕЗОПАСНОСТИ ФУНКЦИОНИРОВАНИЯ ПОДСИСТЕМ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА Специальность 05.13.01 – Системный анализ, управление и обработка информации (промышленность) АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата технических наук Иркутск – 2014 Работа выполнена в ФГБОУ ВПО Иркутский государственный университет путей сообщения Научный руководитель : доктор технических...»

«РАДЧЕНКО СЕРГЕЙ АЛЕКСЕЕВИЧ ФОРМИРОВАНИЕ И ПОЗИЦИОНИРОВАНИЕ СИСТЕМЫ ОРГАНИЗАЦИОННО-УПРАВЛЕНЧЕСКОГО ПОВЕДЕНИЯ В МНОГОПРОФИЛЬНОЙ КОМПАНИИ Специальность: 05.13.10 – Управление в социальных и экономических системах (экономические наук и) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук Ростов-на-Дону – 2007 Диссертация выполнена в ГОУ ВПО Ростовский государственный университет путей сообщения Научный руководитель : доктор технических наук, профессор...»

«Нигматулин Равиль Михайлович УСТОЙЧИВОСТЬ СТАЦИОНАРНОГО УРОВНЯ ЧИСЛЕННОСТИ ПОПУЛЯЦИИ В ДИСКРЕТНОЙ МОДЕЛИ ПИЕЛОУ С ДВУМЯ ЗАПАЗДЫВАНИЯМИ 05.13.18 математическое моделирование, численные методы и комплексы программ АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук ЧЕЛЯБИНСК – 2008 Работа выполнена на кафедре математического анализа ГОУ ВПО Челябинский государственный педагогический университет. Научный руководитель : доктор...»

«КОЧЕРГИН ГЛЕБ АЛЕКСАНДРОВИЧ МОДЕЛИРОВАНИЕ ОДНОРОДНЫХ ТЕРРИТОРИАЛЬНЫХ ЗОН НА ОСНОВЕ МНОГОМЕРНОЙ КЛАСТЕРИЗАЦИИ И ГИС-АНАЛИЗА В УСЛОВИЯХ МАЛОГО ОБЪЕМА ДАННЫХ Специальность 05.13.18 – Математическое моделирование, численные методы и комплексы программ АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Ханты-Мансийск – 2011 Работа выполнена в Автономном учреждении Ханты-Мансийского автономного округа – Югры “Югорский научно-исследовательский институт...»

«Шопырин Данил Геннадьевич Методы объектно-ориентированного проектирования и реализации программного обеспечения реактивных систем Специальность 05.13.13 – Телекоммуникационные системы и компьютерные сети АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Санкт-Петербург 2005 2 Работа выполнена в Санкт-Петербургском государственном университете информационных технологий, механики и оптики доктор технических наук, профессор Научный руководитель :...»

«Вавилов Вячеслав Анатольевич ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ СЕТЕЙ МНОЖЕСТВЕННОГО ДОСТУПА, ФУНКЦИОНИРУЮЩИХ В СЛУЧАЙНОЙ СРЕДЕ 05.13.18 – Математическое моделирование, численные методы и комплексы программ АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Томск – 2006 Работа выполнена на кафедре теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государственного университета Научный...»

«БУБНОВ ДМИТРИЙ ВЛАДИМИРОВИЧ РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ ПРИНЯТИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ В АВТОМАТИЗИРОВАННЫХ МАШИНОСТРОИТЕЛЬНЫХ СИСТЕМАХ 05.13.06 – Автоматизация и управление технологическими процессами и производствами (технические системы) АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Москва 2012 г. Работа выполнена в ФГБОУ ВПО Московском государственном технологическом университете СТАНКИН. Научный руководитель : доктор технических...»






 
© 2013 www.diss.seluk.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Методички, учебные программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.