Geostatistical Analyst Руководство пользователя Copyright © 2001 ESRI All Rights Reserved. Russian Translation by DATA+, Ltd. The information contained in this document is the exclusive property of ESRI. This work is protected under United States copyright law and the copyright laws of the given countries of origin and applicable international laws, treaties, and/or conventions. No part of this work may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying or recording, or by any information storage or retrieval system, except as expressly permitted in writing by ESRI. All requests should be sent to Attention: Contracts Manager, ESRI, 380 New York Street, Redlands, CA 92373-8100, USA. The information contained in this document is subject to change without notice. DATA CREDITS Carpathian Mountains data supplied by USDA Forest Service, Riverside, California, and is used here with permission. Radioceasium data supplied by International Sakharov Environmental University, Minsk, Belarus, and is used here with permission. Copyright © 1996. Air quality data for California supplied by California Environmental Protection Agency, Air Resource Board, and is used here with permission. Copyright © 1997. Radioceasium contamination in forest berries data supplied by the Institute of Radiation Safety “BELRAD”, Minsk, Belarus, and is used here with permission. Copyright © 1996. DATA DISCLAIMER THE DATA VENDOR(S) INCLUDED IN THIS WORK IS AN INDEPENDENT COMPANY AND, AS SUCH, ESRI MAKES NO GUARANTEES AS TO THE QUALITY, COMPLETENESS, AND/OR ACCURACY OF THE DATA. EVERY EFFORT HAS BEEN MADE TO ENSURE THE ACCURACY OF THE DATA INCLUDED IN THIS WORK, BUT THE INFORMATION IS DYNAMIC IN NATURE AND IS SUBJECT TO CHANGE WITHOUT NOTICE. ESRI AND THE DATA VENDOR(S) ARE NOT INVITING RELIANCE ON THE DATA, AND ONE SHOULD ALWAYS VERIFY ACTUAL DATA AND INFORMATION. ESRI DISCLAIMS ALL OTHER WARRANTIES OR REPRESENTATIONS, EITHER EXPRESSED OR IMPLIED, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. ESRI AND THE DATA VENDOR(S) SHALL ASSUME NO LIABILITY FOR INDIRECT, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES, EVEN IF ADVISED OF THE POSSIBILITY THEREOF. U. S. GOVERNMENT RESTRICTED/LIMITED RIGHTS Any software, documentation, and/or data delivered hereunder is subject to the terms of the License Agreement. In no event shall the U.S. Government acquire greater than RESTRICTED/LIMITED RIGHTS. At a minimum, use, duplication, or disclosure by the U.S. Government is subject to restrictions as set forth in FAR §52.227 14 Alternates I, II, and III (JUN 1987); FAR §52.227 19 (JUN 1987) and/or FAR §12.211/12.212 (Commercial Technical Data/ Computer Software); and DFARS §252.227 7015 (NOV 1995) (Technical Data) and/or DFARS §227.7202 (Computer Software), as applicable. Contractor/ Manufacturer is ESRI, 380 New York Street, Redlands, CA 92373 8100, USA. ESRI and the ESRI globe logo are trademarks of ESRI, registered in the United States and certain other countries; registration is pending in the European Community. ArcGIS, ArcInfo, ArcCatalog, ArcMap, 3D Analyst, and GIS by ESRI are trademarks and www.esri.com is a service mark of ESRI. Other companies and products mentioned herein are trademarks or registered trademarks of their respective trademark owners. s Ñîäåðæàíèå 1 Добро пожаловать в модуль ArcGIS Geostatistical Analyst Исследовательский анализ пространственных данных 2 Моделирование вариограммы 3 Интерполирование поверхности и моделирование ошибки 4 Картографирование критических значений 5 Проверка модели и диагностика 6 Интерполирование поверхности с использованием кокригинга 7 Как изучать модуль Geostatistical Analyst 8 2 Уроки быстрого обучения Введение 12 Упражнение 1: Построение поверхности с использованием параметров, предложенных по умолчанию 14 Упражнение 2: Исследование данных 19 Упражнение 3: Картографирование концентрации озона 26 Упражнение 4: Сравнение моделей 38 Упражнение 5: Картографирование вероятности превышения критического значения концентрации озона 39 Упражнение 6: Создание окончательного варианта карты 42 3 Принципы геостатистического анализа Что такое детерминистские методы 50 Что такое геостатистические методы 53 Проработка проблемы 54 Основные принципы, лежащие в основе методов геостатистики 59 Моделирование вариограммы 61 Кригинг 74 Модуль Geostatistical Analyst 78 iii 4 12 Исследовательский анализ пространственных данных (ESDA) Что такое Исследовательский анализ пространственных данных (ESDA)? 82 Исследовательский анализ пространственных данных (ESDA) 83 Инструменты Исследовательского анализа пространственных данных (ESDA) 84 Изучение распределения данных 95 Изучение распределения ваших данных 98 Поиск глобальных и локальных выпадающих значений в наборе данных 99 Определение глобальных и локальных выпадающих значений 101 Определение глобальных трендов 103 Определение глобальных трендов 105 Изучение пространственной автокорреляции и вариации по направлениям 106 Изучение пространственной структуры и вариации по направлениям 108 Изучение ковариации между несколькими наборами данных 109 Изучение пространственной ковариации между несколькими наборами данных 111 5 Детерминистские методы интерполяции пространственных данных Как работает интерполяция по методу взвешенных расстояний 114 Как работает интерполяция по методу глобального полинома 120 Создание карты с использованием метода глобального полинома 122 Как работает интерполяция по методу локальных полиномов 123 Создание карты с использованием интерполяции по методу локальных полиномов 125 Как работает интерполяция с использованием радиальных базисных функций 126 Создание карты с использованием интерполяции на основе радиальных базисных функций 129 6 Построение поверхности с использованием методов геостатистики Что такое геостатистические методы интерполяции? 132 Изучение различных моделей кригинга 133 Изучение типов результирующих поверхностей 135 iv ARCGIS GEOSTATISTICAL ANALYST Создание карты по методу кригинга с использованием параметров, предложенных по умолчанию 136 Изучение преобразований и трендов 137 Что такое ординарный кригинг? 138 Создание карты с использованием ординарного кригинга 139 Что такое простой кригинг? 143 Создание карты с использова нием простого кригинга 144 Что такое универсальный кригинг? 150 Создание карты с использованием универсального кригинга 151 Что такое пороговые значения? 153 Что такое индикаторный кригинг? 154 Создание карты с использованием индикаторного кригинга 155 Что такое вероятностный кригинг? 156 Создание карты с использованием вероятностного кригинга 157 Что такое дизъюнктивный кригинг? 159 Создание карты с использованием дизъюнктивного кригинга 160 Что такое кокригинг? 165 Создание карты с использованием кокригинга 166 7 Использование аналитических инструментов при построении поверхностей Исследование пространственной структуры: вариография 168 Моделирование вариограмм и функций ковариации 175 Определение размера области поиска соседства 181 Определение размера области поиска соседства 185 Выполнение проверки и перекрестной проверки 189 Выполнение перекрестной проверки для оценки выбранных параметров 193 Оценка протокола решений с использованием проверки 195 Сравнение моделей 197 Сравнение моделей 199 Моделирование распределений и определение методов преобразований 200 Использование преобразований (логарифмического, по методу Box–Cox и арксинуса) 204 СОДЕРЖАНИЕ v Использование преобразований по методу нормальных меток 205 Проверка на двумерное нормальное распределение 206 Проверка двумерного распределения 209 Применение декластеризации для данных, отобранных с различной густотой 211 Декластеризация данных, отобранных с различной густотой 214 Вычитание трендов из данных 216 Удаление глобальных и локальных трендов из данных: вычитание тренда 218 8 Отображение геостатистических слоев и управление ими Что такое геостатистический слой? 220 Добавление слоев 222 Работа со слоями на карте 223 Управление слоями 224 Просмотр геостатистических слоев в ArcCatalog 225 Отображение геостатистического слоя 227 Изменение символогии геостатистического слоя 229 Классификация данных 230 Классификация данных 233 Определение масштабов, при которых будет отображаться геостатистический слой 235 Сохранение и экспорт геостатистических слоев 237 9 Дополнительные инструменты геостатистического анализа Изменение параметров геостатистического слоя: свойства метода 240 Интерполирование значений для заданных точек 241 Выполнение проверки для геостатистического слоя, созданного на основе поднабора данных 243 Приложение А 247 Приложение B 275 vi ARCGIS GEOSTATISTICAL ANALYST Добро пожаловать в модуль ArcGIS Geostatistical Analyst 1  ÝÒÎÉ ÃËÀÂÅ • Исследовательский анализ пространственных данных • Моделирование вариограммы • Интерполирование поверхности и моделирование ошибок • Картографирование критических значений • Проверка модели и диагностика • Интерполирование поверхности с использованием кокригинга • Как изучать модуль Geostatistical Analyst Вы приступаете к изучению расширения к ArcGIS компании ESRI® модуля Geostatistical Analyst, предназначенного для усовершенствованного моделирова ния поверхности с использованием детерминистских и геостатистических мето дов. Модуль Geostatistical Analyst расширяет возможности ArcMap за счет появ ления дополнительных инструментов, предназначенных для исследовательского анализа пространственных данных, а также Мастера операций геостатистики, который поможет вам в процессе построения статистически достоверной поверх ности. Поверхности, создаваемые с помощью модуля Geostatistical Analyst, могут быть впоследствии использованы в моделях ГИС и для визуализации, в том чис ле с использованием таких расширений ArcGIS, как ArcGIS Spatial Analyst и 3D Analyst. Модуль Geostatistical Analyst революционное средство, поскольку он помогает навести мост между геостатистикой и ГИС. В течение долгого времени вы могли пользоваться инструментами геостатистики, но никогда прежде эти инструменты не были интегрированы в среду ГИС. Такая интеграция важна, поскольку впер вые профессионалы ГИС смогут количественно описать качество своих моделей путем измерения статистической ошибки интерполированных поверхностей. Построение поверхности с использованием модуля Geostatistical Analyst включа ет три ключевых этапа (проиллюстрированных на следующих страницах): • Исследовательский анализ пространственных данных • Структурный анализ (вычисление и моделирование свойств поверхности в со седних точках) • Интерполирование поверхности и оценка результатов Программное обеспечение включает серию легких в использовании инструментов и мастеров операций, которые проведут вас по каждому из этих этапов. Оно также включает целый ряд уникальных инструментов для статистического анализа про странственных данных. 1 Исследовательский анализ пространственных данных Используя измеренные значения в опорных точках, с помощью модуля Geostatistical Analyst можно интерполировать значения в других точках в пределах данной территории, для которых измерения не проводились. Инструменты исследовательского анализа пространственных данных, включенные в модуль Geostatistical Analyst, применяются для оценки статистических свойств данных, таких как изменчивость пространственных данных, их зависимость и глобальные тренды. Для изучения свойств значений концентраций озона, измеренных на станциях мониторинга в Карпатах, использован ряд инструментов исследовательского анализа пространственных данных. 2 ARCGIS GEOSTATISTICAL ANALYST Моделирование вариограммы Геостатистический анализ данных происходит в два этапа: 1) моделирование вариограммы или ковариации для анализа свойств поверхности, и 2) кригинг. В модуле Geostatistical Analyst возможно использование целого ряда методов, основанных на кригинге, включая методы ординарного, простого, универсального, индикаторного, вероятностного и дизъюнктивного кригинга. На рисунке проиллюстрированы две стадии геостатистического анализа данных. На первом этапе для построения модели распределения зимних температур по территории США был использован Мастер построения вариограммы/ковариации. Затем эта модель была использована для составления карты распределения температур. ДОБРО ПОЖАЛОВАТЬ В МОДУЛЬ ARCGIS GEOSTATISTICAL ANALYST 3 Интерполирование поверхности и моделирование ошибки С использованием модуля Geostatistical Analyst могут быть созданы различные картографические слои, включая карты проинтерпо лированных значений, карты квантилей, карты вероятностей, и карты стандартной ошибки интерполяции. В данном примере модуль Geostatistical Analyst был использован для создания карты предполагаемых значений уровня загрязнения почв радиоактивным цезием в Белоруссии после аварии на Чернобыльской атомной электростанции. 4 ARCGIS GEOSTATISTICAL ANALYST Картографирование критических значений Карты вероятностей могут быть использованы для определения участков, где значения могут превысить критические пороговые величины. Для участков, показанных темно оранжевым и красным цветом, вероятность того, что содержание радиоактивного цезия в лесных ягодах превышает верхний допустимый уровень (пороговую величину), составляет 62.5%. ДОБРО ПОЖАЛОВАТЬ В МОДУЛЬ ARCGIS GEOSTATISTICAL ANALYST 5 Проверка модели и диагностика Исходные данные могут быть разбиты на два поднабора. Первый поднабор данных может быть использован для создания модели интерполяции. Вычисленные значения могут быть затем сопоставлены с известными значениями в оставшихся точках с использова нием инструмента проверки достоверности модели. Мастер операций проверки позволяет оценить модель, использованную для интерполяции содержания органического вещества в почве на ферме в штате Иллинойс. 6 ARCGIS GEOSTATISTICAL ANALYST Интерполирование поверхности с использованием кокригинга Кокригинг, усовершенствованный метод моделирования поверхности, включенный в модуль Geostatistical Analyst, может быть ис пользован для улучшения качества интерполяции поверхности для одной переменной путем учета значений других переменных, при условии наличия пространственной корреляции между этими переменными. В данном примере, инструменты исследовательского анализа пространственных данных использованы для изучения пространственной корреляции между концентрациями озона (первая переменная) и двуокиси азота (вторая переменная) в Калифорнии. Поскольку переменные пространственно коррелированы, кокригинг может использовать данные по концентрации двуокиси азота для совершенствования модели интерполяции при картографировании содержания озона в атмосфере. Кроме того, модуль Geostatistical Analyst содержит целый ряд уникальных инструментов для совершенствования методов интерполя ции, включая инструменты: преобразования данных; вычитания трендов из данных с использованием интерполяции по методу локальных полиномов; выявления параметра смещения в модели взаимной ковариации; моделирования ошибки для определения соотношения вариации на микроуровне и ошибок измерений; исследования данных на соответствие двумерному нормальному рас пределению; оптимального выбора области поиска соседства; составления карт квантилей. ДОБРО ПОЖАЛОВАТЬ В МОДУЛЬ ARCGIS GEOSTATISTICAL ANALYST 7 Как изучать модуль Geostatistical Analyst Если вы впервые сталкиваетесь с понятием геостатистики, по мните, что для того чтобы получить немедленный результат, вам необязательно знать все о модуле Geostatistical Analyst. Начните изучение модуля Geostatistical Analyst с чтения Главы 2, ‘Уроки быстрого обучения’. В этой главе приведены примеры задач, которые вы можете решать с использованием модуля Geostatistical Analyst. Она может служить прекрасной исходной точкой, если вы задумываетесь над тем, как подойти к решению ваших задач, связанных с пространственным анализом. Модуль Geostatistical Analyst поставляется с данными, используемыми в уроках быст рого обучения, поэтому шаг за шагом вы сможете выполнить эти упражнения на вашем компьютере. Если вы предпочитаете перейти сразу к эксперименту со своими данными, воспользуйтесь Главой 5, ‘Детерминистские методы интерполяции пространственных данных’, и Главой 6, ‘Постро ение поверхности с использованием методов геостатистики’, для изучения соответствующих понятий и описания шагов, которые следует предпринять при решении конкретной задачи. Поиск ответов на вопросы Как и для большинства людей, ваша цель состоит в том, чтобы выполнить поставленную задачу при минимальных затратах времени и усилий на изучение программного обеспечения. Вы бы хотели иметь интуитивный, легкий в использовании про граммный продукт, с помощью которого можно получить не медленный результат без чтения документации. В то же время, если у вас возникнут вопросы, вы захотите получить на них бы стрый ответ, чтобы иметь возможность выполнить поставлен ную задачу до конца. Эта книга и предназначена для того, чтобы вы могли при необходимости получить ответы на возникающие вопросы. В этой книге дано описание задач геостатистического анализа от базовых до сложных которые вы можете решать с помощью модуля Geostatistical Analyst. Хотя вы можете и прочесть эту книгу от начала до конца, вы все же будете использовать ее больше как справочную литературу. Если вы хотите знать, как выполнить определенную задачу, например, определить выпадающие (экс тремальные) значения в ваших данных, вы можете просто за глянуть в содержание или предметный указатель. В этой книге вы найдете краткое описание того, как шаг за шагом выполнить вашу задачу. Некоторые главы содержат также подробную ин формацию, которую вы можете изучить, если хотите получить представление о тех концепциях, которые стоят за решением тех или иных задач. Вы также можете обратиться к словарю терминов, помещенному в этой книге, если вы встречаете не знакомые термины по геостатистике или хотите освежить па мять. Об этой книге Эта книга составлена таким образом, чтобы помочь вам выпол нить геостатистический анализ, предоставив вам информацию об основных понятиях и научив вас тому, как выполнять опера ции, необходимые для решения ваших геостатистических про блем. Темы, затрагиваемые в Главе 2, предполагают, что вы зна комы с основами геоинформационных систем (ГИС) и обладае те базовыми знаниями по ArcGIS. Если вы новичок в ГИС или в ArcMap, желательно, чтобы вы потратили некоторое время на изучение книг “Начало работы с ArcGIS. Руководство поль зователя” и “ArcMap. Руководство пользователя”, кото рые вы получили в пакете документации к ArcGIS. Нет необхо димости в прочтении этих книг до того, как вы продолжите изу чение данного учебного пособия; просто используйте их как спра вочную литературу. В Главе 3 приводятся основные принципы геостатистики, поз воляющие вам понять различные методы интерполяции и то, как они работают. В Главе 4 приводится описание различных инструментов ESDA (Исследовательского анализа пространст 8 ARCGIS GEOSTATISTICAL ANALYST венных данных), которые помогут вам в изучении и понимании ваших данных. В Главе 5 рассказывается о детерминистских методах интерполяции. В Главе 6 обсуждаются различные ме тоды геостатистики, а в Главе 7 перечислены инструменты, ко торыми вы можете пользоваться при выполнении интерполя ции. В Главе 8 дано описание различных инструментов отобра жения и управления, которые могут быть использованы в рабо те с геостатистическими слоями. Глава 9 затрагивает целый ряд других понятий и задач, связанных с геостатистическим анали зом. В Приложении A приведены подробные математические формулы, относящиеся к функциям и методам, включенным в модуль Geostatistical Analyst. И, наконец, словарь содержит оп ределения различных терминов геостатистики, использованных в этой книге. Как получить помощь на компьютере. В дополнение к этой книге, вы можете использовать онлайно вую систему справки ArcMap для изучения модуля Geostatistical Analyst и ArcMap. Чтобы научиться пользоваться системой справ ки, обратитесь к книге “ArcMap. Руководство пользовате ля”. Контакты с ESRI Если для технической поддержки вам необходим контакт с ESRI, воспользуйтесь картой регистрации и поддержки продукта, ко торую вы получили вместе с модулем ArcGIS Geostatistical Analyst, или обратитесь к пункту ‘Получение технической поддержки’ в разделе ‘Дополнительная помощь’ в десктоп системе помощи ArcGIS. Чтобы узнать больше о модуле Geostatistical Analyst и продукте ArcGIS, вы можете посетить сайты ESRI www.esri.com и www.arconline.esri.com. Решения ESRI в области образования ESRI предоставляет возможность получения образования в об ласти геоинформатики, применения ГИС и использования ГИС технологий. Вы можете выбирать между курсами, проводимы ми инструкторами, Web курсами и самостоятельным изучени ем учебников, чтобы найти образовательные решения, которые наилучшим образом отвечают вашим возможностям. Для полу чения подробной информации, посетите сайт www.esri.com/ education. ДОБРО ПОЖАЛОВАТЬ В МОДУЛЬ ARCGIS GEOSTATISTICAL ANALYST 9 s Уроки быстрого обучения 2 В ЭТОЙ ГЛАВЕ • Упражнение 1: Построение поверхности с использованием параметров, предложенных по умолчанию • Упражнение 2: Исследование данных • Упражнение 3: Картографирование концентрации озона • Упражнение 4: Сравнение моделей • Упражнение 5: Картографирование вероятности превышения критического значения концентрации озона • Упражнение 6: Создание окончательного варианта карты С помощью модуля Geostatistical Analyst вы можете легко построить непрерывную поверхность или карту по опорным точкам, хранящимся в точечном слое, по дан ным растрового слоя, или воспользовавшись центроидами полигонов. В опорных точках могут быть измерены значения высоты, глубины водоема и уровни загрязне ния, как, например, в учебных примерах данного пособия. Модуль Geostatistical Analyst используется совместно с ArcMap и предоставляет обширный набор инст рументов для построения поверхностей, которыми вы можете воспользоваться для визуализации, анализа и понимания пространственных явлений. Сценарий обучения Агентство США по защите окружающей среды осуществляет мониторинг концент рации озона в атмосфере над территорией Калифорнии. По всей территории штата на станциях мониторинга выполняются замеры концентраций озона. Расположе ние станций показано на рисунке. Уровни концентра ций озона известны для всех станций, но мы заинте ресованы также в том, чтобы знать значения концент рации в любой точке Калифорнии. Однако, из прак тических соображений и значительных затрат, стан ции мониторинга не могут быть размещены повсеме стно. Модуль Geostatistical Analyst предоставляет инструменты, которые позволяют выполнить наи лучшее из возможных интерполирование значений путем изучения взаимосвязей между всеми опорными точками, а также строить непрерывную поверхность концентрации озона, вычислять стандартные ошибки (неопределенность) интерполяции и определять веро ятность того, что в некоторых точках превышены критические значения. 11 Введение Данные, которые понадобятся вам для упражнений, находятся на инсталляционном диске модуля Geostatistical Analyst. Наборы данных были любезно предоставлены Департаментом воздуш ных ресурсов Калифорнии. Использованы следующие наборы данных: Набор данных Описание ca_outline Картографическая основа штата Калифорния ca_ozone_pts Контрольные точки измерения концентраций озона (в промилле ppm) ca_cities Местоположение основных городов Калифорнии ca_hillshade Карта рельефа Калифорнии с отмывкой Набор данных по озону (ca_ozone_pts) содержит данные за 1996 г., отражающие максимальное значение концентрации озона в промилле (ppm), выбранное из средних значений наблюдений за восьмичасовой период. (Измерения проводились в суточном режиме и группировались в блоки по восемь часов.) Исходные данные были изменены для целей приведенных в пособии уп ражнений и не могут рассматриваться как точные данные. Воспользовавшись значениями содержания озона в опорных точ ках (данными измерений), вы построите две непрерывные по верхности (карты), интерполирующие значения концентрации озона для каждой точки штата Калифорния. Для составления первой карты вы используете опции, предложенные по умолча нию, и увидите, как просто можно построить поверхность по опорным точкам. При составлении второй карты вы сможете учесть пространственные отношения, существующие между точ ками. При составлении этой второй карты вы будете использо вать инструменты исследовательского анализа ESDA, что позво лит вам изучить ваши данные. Вы также познакомитесь с неко торыми опциями геостатистики, которыми вы можете восполь зоваться при построении поверхности, например, вычитанием трендов и моделированием пространственной автокорреляции. Применение инструментов ESDA и работа с геостатистически ми параметрами позволит вам построить более точную поверх ность. Во многих случаях учитываются не фактические значения по казателей, а только те, которые представляют риск для здоро вья, то есть те значения, которые превышают некий уровень токсичности. В таких случаях должны приниматься немедлен ные меры. Третья поверхность, которую вы построите, будет отражать вероятность превышения критического значения кон центрации озона. Для данных упражнений принято, что критическое значение составляет 0.12 ppm. Если максимальная средняя концентра ция озона за любой восьмичасовой отрезок времени в году пре вышает данное значение, то данная точка должна находиться под тщательным наблюдением. Вы будете использовать модуль Geostatistical Analyst, чтобы спрогнозировать вероятность появ лений значений, превышающих этот показатель. Это учебное пособие разделено на отдельные темы, которые раз работаны с учетом того, что возможности модуля Geostatistical Analyst будут изучаться вами постепенно, с удобной для вас ско ростью. Для получения дополнительной помощи, обратитесь к онлайновой системе помощи ArcMap или к книге Using ArcMap (Использование ArcMap). • Упражнение 1 поможет вам начать работу с модулем Geostatistical Analyst и выполнить построение поверхности концентрации озона с использованием параметров, предло женных по умолчанию, что позволит продемонстрировать воз можности данного модуля. • Упражнение 2 познакомит вас с процессом изучения данных перед построением поверхности с целью определения экс тремальных значений в данных и трендов. 12 ARCGIS GEOSTATISTICAL ANALYST • В Упражнении 3 вы построите вторую поверхность, которая учитывает пространственные взаимосвязи, выявленные в Упражнении 2, и вносит поправки в поверхность, построен ную в первом упражнении. В этом упражнении также при ведены основные понятия геостатистики. • В Упражнении 4 показано, как сравнить две поверхности, построенные в первом и третьем упражнениях с тем, чтобы решить, какая из них лучше интерполирует неизвестные зна чения. • Упражнение 5 познакомит вас с процессом картографирова ния вероятности того, что концентрация озона превысит критическое значение, и вы построите третью поверхность. • В Упражнении 6 показано, как окончательно оформить по верхности, созданные в упражнениях 3 и 5, в виде карты с использованием функций ArcMap. Для того чтобы выполнить все упражнения из уроков быстрого обучения, вам понадобится несколько часов. Однако, при жела нии вы можете выполнять упражнения по одному, сохраняя результаты после каждого упражнения. УРОКИ БЫСТРОГО ОБУчЕНИЯ 13 Упражнение 1: Построение поверхности с использованием параметров, предложенных по умолчанию Перед началом работы вы должны запустить ArcMap и подклю 1 5 чить модуль Geostatistical Analyst. 7 Как запустить ArcMap и подключить модуль Geostatistical Analyst 4 Нажмите кнопку Пуск на панели задач Windows, выберите Про граммы, затем ArcGIS, и щелкните по строке ArcMap. В ArcMap, выберите опцию Инструменты, затем строку Дополнительные модули, и в открывшем окне отметьте галочкой опцию Geostatistical Analyst. Нажмите Закрыть. Как добавить панель инструментов модуля Geostatistical Analyst в ArcMap Откройте меню Вид, перейдите на строку Панели инструмен тов, и нажмите Geostatistical Analyst. Как добавить слои данных в ArcMap После того, как вы добавили данные, вы можете использовать ArcMap для отображения данных и, при необходимости, изме нения свойств каждого слоя (символов и т.д.). 1. Нажмите кнопку Добавить данные на стандартной панели инструментов. 2. Перейдите к папке, в которую вы записали учебные данные (путь, предлагаемый по умолчанию, C:\ArcGIS\ArcTutor\Geostatistics), удерживая клавишу Ctrl, выберите наборы данных ca_ozone_pts и ca_outline. 3. Нажмите Добавить. 4. Щелкните по легенде слоя ca_outline в таблице содержания, чтобы открыть диалог Символ. 5. Откройте палетку Цвет заполнения и выберите опцию Нет цвета. 6 6. Нажмите OK в диалоге Выбор символа. Теперь при отображении слоя ca_outline виден только кон тур штата. Это позволит вам наложить контур на слои, кото рые вы будете создавать в ходе выполнения упражнений. Сохранение карты Рекомендуется сохранять вашу карту после каждого упражне ния. 7. Нажмите кнопку Сохранить на стандартной панели инстру ментов. Вам понадобится задать название карты, поскольку вы со храняете ее первый раз (мы предлагаем название Ozone Prediction Map.mxd). В будущем для сохранения просто на жмите кнопку Сохранить. 14 ARCGIS GEOSTATISTICAL ANALYST Построение поверхности с использованием параметров, предложенных по умолчанию Далее вы построите (проинтерполируете) поверхность концен трации озона, используя параметры, предложенные в модуле Geostatistical Analyst по умолчанию. В качестве исходного набора данных вы возьмете набор точек с концентрациями озона (ca_ozone_pts) и интерполируете значения этих концентраций в тех точках, где их значения неизвестны, используя метод ор динарного кригинга. Во многих диалогах вы будете нажимать кнопку Далее, таким образом принимая параметры, предло женные по умолчанию. Не обращайте внимание на элементы диалогов в этом упражнении. Каждый из этих диалогов вы буде те открывать снова и снова при выполнении следующих упраж нений. Цель этого упражнения построить поверхность, вос пользовавшись параметрами, предложенными по умолчанию. 1. На панели инструментов Geostatistical Analyst выберите оп цию Мастер операций геостатистики. 1 2 3 4 5 по 10 позволят вам познакомиться с некоторыми другими диа логами. 6. Нажмите Далее в диалоге Выбор геостатистического мето да. 2. В строке Входные данные выберите ca_ozone_pts. 3. В строке Атрибуты выберите атрибут OZONE. 4. В диалоге Методы выберите Кригинг. 5. Нажмите Далее. По умолчанию в диалоге Выбор геостатистического метода будут выбраны опции Ординарный Кригинг и Карта проин терполированных значений. Обратите внимание, что выбрав метод моделирования поверх ности концентрации озона, вы можете нажать кнопку Готово на этом шаге, что позволит построить поверхность с использовани ем параметров, предложенных по умолчанию. Однако, шаги с 6 УРОКИ БЫСТРОГО ОБУчЕНИЯ 6 15 7 8 Диалог Моделирование вариограммы/ковариации дает возмож ность изучить пространственные взаимоотношения между опор ными точками. Вы предполагаете, что близко расположенные объекты в наибольшей степени подобны. Вариограмма позволя ет вам исследовать это предположение. Процесс подбора модели вариограммы при выявлении пространственных взаимоотноше ний известен как вариография. 7. Нажмите Далее. Перекрестье показывает место, в котором нет измеренных зна чений. Чтобы проинтерполировать значение в этой точке, вы можете использовать значения в опорных точках. Вам извест но, что значения ближайших опорных точек могут быть в боль шей степени схожи со значениями точек, в которых измерения не проводились и значения в которых вы хотите интерполиро вать. Красным точкам на верхнем рисунке должен быть при своен весовой коэффициент (учитывающий влияние этих точек на неизвестное значение) больший, чем зеленым точкам, так как они расположены ближе к той точке, значение которой вы интерполируете. Воспользовавшись значениями окружающих точек и подобрав модель в диалоге Моделирование вариограм мы, вы можете более точно проинтерполировать значение в точке, в которой измерения не проводились. 8. Нажмите Далее. 16 ARCGIS GEOSTATISTICAL ANALYST 10 11 9 Диалог Перекрестная проверка дает вам некое представление о том, “насколько хорошо” модель интерполирует значения в ис комых точках. В Упражнении 4 вы узнаете, как использовать график перекрестной проверки и научитесь понимать статисти ку. 9. Нажмите Готово. Диалог Информация о результирующем слое резюмирует информацию об использованном при построении результи рующей поверхности методе (и связанных с ним парамет рах). 10. Нажмите OK. Карта проинтерполированных значений концентраций озо на отобразится как верхний слой в таблице содержания. 11. Выберите этот слой в таблице содержания, затем щелкни те на его названии и измените название слоя на “По умол чанию”. Изменение названия поможет вам отличить этот слой от того, который вы создадите в Упражнении 4. 12. Сохраните карту, воспользовавшись кнопкой стандартной панели инструментов ArcMap. Обратите внимание, что проинтерполированная поверхность простирается и над океаном. В Упражнении 6 вы научитесь ог раничивать поверхность проинтерполированных значений пре делами штата Калифорния. УРОКИ БЫСТРОГО ОБУчЕНИЯ 17 Методология подбора поверхности Вы построили карту концентрации озона и выполнили Упражнение 1 данного учебника. Несмотря на то, что задача создания карты (поверхности) с использованием модуля Geostatistical Analyst достаточно проста, важно структурировать процесс в соответствии с диаграммой, приведенной ниже. Представление данных Упражнение 1 Добавление слоев и отображение их в ArcMap. Исследование данных Упражнение 2 Изучение статистики наборов данных. Эти инструменты могут быть использованы для ис следования данных независимо от того, будете вы строить поверхность или нет. Подгонка модели Упражнение 3 Выбор модели для построения поверхности. Стадия исследования данных поможет в выборе соответствующей модели. Âыполнение диагностики Упражнение 3 Оценка результирующей поверхности. Поможет вам понять, “на сколько хорошо” модель интерполирует неизвестные значения. Сравнение моделей Упражнение 4 Если построено несколько поверхностей, могут быть сопостав лены результаты и принято решение, какая из них наилучшим образом интерполирует неизвестные значения. В следующих упражнениях учебника вы будете следовать данной структуре. Кроме того, в Упражнении 5 вы построите поверхность для тех точек, значения которых превышают заданное пороговое значение, а в Упражнении 6 создадите окончательно оформленный вариант карты с результатами выполненного в ходе упражнений анализа. Обратите внимание, что вы уже выполнили первый шаг этого процесса отображение данных в Упражнении 1. В Упражнении 2, вы будете исследовать данные. 18 ARCGIS GEOSTATISTICAL ANALYST Упражнение 2: Исследование данных В этом упражнении вы будете исследовать ваши данные. В соот ветствии со структурой процесса, предложенной на предыду щей странице, для принятия оптимальных решений при пост роении поверхности вы сначала должны изучить свой набор дан ных, чтобы лучше понимать его. При изучении данных вы долж ны обратить особое внимание на очевидные ошибки в исходной выборке, которые могут сильно повлиять на результирующую поверхность с проинтерполированными значениями, а также исследовать распределение данных, выявить глобальные трен ды и т.д. Модуль Geostatistical Analyst предлагает множество инструмен тов для изучения данных. В этом учебнике вы будете изучать данные тремя способами: • Исследовать распределение данных. • Выявлять тренды в ваших данных, если они есть. • Изучать пространственную автокорреляцию и влияние по направлениям. Если вы закрыли карту после выполнения Упражнения 1, в меню Файл выберите Открыть. В диалоге в окне Искать в: перейдите к папке, в которой вы сохранили документ карты (Ozone Prediction Map.mxd). Нажмите Открыть. Изучение распределения данных Гистограмма Методы интерполяции, используемые для построения поверх ности, дают лучшие результаты при нормальном распределении данных (кривая в форме колокола). Если ваши данные распре делены асимметрично (неравномерно), вы можете воспользо ваться возможностью преобразования данных, чтобы привести их к нормальному распределению. Таким образом, важно пони мать распределение ваших данных перед тем, как вы приступи те к построению поверхности. Инструмент Гистограмма создает гистограммы частот для атрибутов в наборе данных, позволяя вам изучать одномерное (для одной переменной) распределе ние данных по каждому атрибуту. Далее, вы изучите распреде ление озона для слоя ca_ozone_pts. 1. Выделите слой ca_ozone_pts, переместите его в верхнюю часть таблицы содержания, затем за ним поместите слой ca_outline. 1 2. Выберите панель инструментов Geostatistical Analyst, перей дите к опции Исследовать данные и затем выберите строку Гистограмма. 2 Вы можете изменить размер окна диалога Гистограмма таким образом, чтобы видеть одновременно и карту, как это показано на рисунке на стр. 20. УРОКИ БЫСТРОГО ОБУчЕНИЯ 19 3. В окне Слой выберите ca_ozone_pts. 4. В окне Атрибут выберите OZONE. 5 6 3 4 кое к нормальному. Правый хвост распределения указывает на присутствие относительно небольшого количества элементов выборки с большими значениями концентрации озона. 5. Выберите столбик гистограммы со значениями концентра ции озона от 0.162 до 0.175 ppm. Элементы выборки, имеющие такие значения, будут выде лены на карте. Обратите внимание, что эти точки располо жены в районе Лос Анджелеса. 6. Закройте диалоговое окно. Нормальный график КК (Квантиль квантиль) График КК позволяет вам сравнить распределение ваших дан ных со стандартным нормальным, предлагая другие параметры измерения нормальности данных. Чем более точно по точкам можно построить прямую линию, тем ближе распределение к нормальному. 1. На панели инструментов Geostatistical Analyst, выберите оп цию Исследовать данные, а затем строку Нормальный гра фик КК. Распределение концентрации озона показано на гистограмме, на которой все значения объединены в 10 классов. Высота столб 1 цов пропорциональна количеству данных с определенными зна чениями, попадающих в каждый класс. В целом, важными характеристиками распределения являются центральное значение, его размах и симметрия. Для быстрой проверки характера распределения: если среднее и медиана имеют приблизительно одно и то же значение, это является од ним из подтверждений того, что данные подчиняются закону нормального распределения. Гистограмма, приведенная выше, показывает, что данные яв ляются унимодальными (одновершинными) и достаточно сим метричными. Похоже, что данные имеют распределение, близ 20 ARCGIS GEOSTATISTICAL ANALYST 2. В окне Слой выберите ca_ozone_pts. 3. В окне Атрибут выберите OZONE. 4 2 3 В целом график КК представляет собой график, на котором кван тили из двух распределений расположены по двум осям коорди нат (даны относительно друг друга). Для двух идентичных рас пределений график КК будет представлять собой прямую ли нию. Таким образом, нормальность распределения данных по концентрации озона можно проверить, использовав на графике квантили этих данных и квантили стандартного нормального распределения. На графике КК, приведенном выше, вы може те видеть, что график очень близок к прямой линии. Главное отклонение от этой линии приходится на высокие значения кон центрации озона (которые были выделены цветом на гистограм ме, поэтому выделены и на этом графике). Если данные не отражают нормального распределения ни на гистограмме, ни на графике КК, перед тем как использовать кригинг в качестве метода интерполяции, может возникнуть необходимость преобразовать данные, чтобы привести их к нор мальному распределению. 4. Закройте диалоговое окно. Определение глобальных трендов в ваших данных Если в ваших данных существует тренд, он представляет собой неслучайную (детерминистскую) составляющую поверхности, которая может быть описана какой либо математической фор мулой. Например, пологий склон может быть представлен как плоскость. Долина может быть описана более сложной форму лой (полиномом второго порядка), которая строит U образную форму. Эта формула может дать описание требуемой поверхно сти. Однако во многих случаях формула слишком сглажена, что бы она могла точно описать поверхность, поскольку ни склон не является правильной плоскостью, ни долина не имеет правиль ной “U” образной формы. Если вы считаете, что поверхность тренда неадекватно отражает поверхность, с которой вы рабо таете, вы можете вычесть его и продолжить анализ, моделируя остатки или значения в опорных точках после вычитания трен да. При моделировании остатков, вы будете анализировать из менения на поверхности в узком интервале. Это та часть, кото рая не может быть точно описана плоской или U образной по верхностью. Инструмент Анализ тренда позволяет вам определить отсутст вие/наличие трендов в исходном наборе данных. 1. На панели инструментов Geostatistical Analyst выберите Ис следовать данные, а затем опцию Анализ тренда. 2. Из списка Слой выберите ca_ozone_pts. УРОКИ БЫСТРОГО ОБУчЕНИЯ 21 Тренд в направлении восток запад Тренд в направлении север юг Ось восток запад Ось север юг 4. На шкале прокрутки Перспектва доведите угол поворота до 30o, перемещая указатель влево. Такое вращение позволит вам лучше рассмотреть форму тренда в направлении восток запад. Вы можете видеть, что проекция показывает перевернутую U образную кривую. Поскольку тренд имеет U образную форму, для описания глобального тренда хо рошо подойдет полином второго порядка. Хотя, тренд и показан на плоскости проекции, соответствующей направлению восток запад, поскольку мы повернули точки на 30o, действительный тренд имеет направление с северо востока на юго запад. Выяв ленный тренд возможно вызван тем фактом, что загрязнение является низким на побережье, а при движении внутрь мате рика появляются крупные населенные пункты, количество ко торых снова уменьшается в горах. Вы будете вычитать эти трен ды в Упражнении 4. 5. Закройте диалоговое окно. 2 3 3. В окне Атрибут выберите OZONE. Каждый вертикальный столбец (отрезок) на диаграмме анали за тренда представляет местоположение, а его высота пропор циональна значению каждой точки из набора данных. Точки проецируются на перпендикулярные плоскости, соответствую щие направлениям восток запад и север юг. Через спроециро ванные точки проведена линия (полином), наилучшим образом описывающая их расположение, которая моделирует тренды в определенных направлениях. Если линия близка к прямой, это означает, что в данных нет тренда. Однако, если вы посмотрите на светло зеленую линию на верхнем рисунке, вы можете уви деть, что она начинается с низких значений и увеличивается по мере продвижения на восток, пока не начнет снижаться. Это указывает на то, что данные, возможно, имеют сильный тренд в направлении восток запад и более слабый в направлении север юг. 22 U образный тренд 5 4 ARCGIS GEOSTATISTICAL ANALYST Понимание пространственной автокорреляции и влияний по направлениям 1. На панели инструментов Geostatistical Analyst выберите Ис следовать данные, а затем опцию Облако вариограммы/ко вариации. 1 2. В окне Слой выберите ca_ozone_pts. 3. В окне Атрибут выберите OZONE. Опция Облако вариограммы/ковариации позволяет вам изучить пространственную автокорреляцию между опорными точками. Пространственная автокорреляция опирается на предположе ние, что объекты, которые расположены ближе всего друг к дру гу, в наибольшей степени похожи. Опция Облако вариограм мы/ковариации позволяет вам изучить эту взаимосвязь. Для это го по оси y откладывается значение вариограммы, равное квад рату разности значений для каждой пары точек, а по оси x расстояние, на которое пары точек отстоят друг от друга. Каждая красная точка на графике Облако вариограммы/кова риации представляет пару значений. Поскольку близкие по рас положению точки должны быть больше всего похожи, на варио грамме близкие местоположения (крайние левые значения по оси x) должны иметь низкие значения на вариограмме (нахо диться в нижней части оси y). По мере того, как расстояние между парами точек увеличивается (величины смещаются вправо по оси x), значения вариограммы должны также увеличиваться (расти по оси y). Однако, при определенном расстоянии облако выравнивается, что указывает на то, что между парами точек за пределами этого расстояния нет корреляции. При рассмотрении вариограммы, если вы обнаружите, что для некоторых точек, расположенных близко друг к другу (около нуля по оси x) значение вариограммы выше, чем вы ожидали (большое значение по оси y), вы должны исследовать эти пары точек, чтобы определить, не являются ли данные в этих точках неточными. 4. Инструментом выбора укажите область, в которую попада ют эти точки, чтобы выделить их цветом. (Используйте при веденную диаграмму как пример. Вам необязательно выде лять те же точки, что показаны на диаграмме.) 2 3 УРОКИ БЫСТРОГО ОБУчЕНИЯ 23 4 Пары точек, выбранные на вариограмме, выделены цветом на карте; отрезками показаны связи, указывающие на то, что точ ки образуют пару. Существует множество причин, по которым значения отлича ются в большей степени между точками в районе Лос Анджеле са и другими территориями. Одна из них то, что в районе Лос Анджелеса больше, чем в других районах, машин, что несомненно приводит к большему загрязнению и способствует появлению более высоких концентраций озона в районе Лос Анджелеса. Помимо глобальных трендов, обсуждавшихся в предыдущем разделе, на данные могут также оказывать влияние направлен ные воздействия. Причины этого могут быть неизвестны, но они могут быть описаны статистически. Эти направленные воздей ствия могут влиять на точность поверхности, которую вы будете строить в следующем упражнении. Однако, если вы знаете, что такие воздействия существуют, модуль Geostatistical Analyst пре доставляет инструменты, позволяющие учитывать их в процес се построения поверхности. Для изучения влияний по направ лениям по облаку вариограммы, воспользуйтесь инструментом Направление поиска. 5. Отметьте галочкой опцию Показывать направление поиска. 6. Выберите и перемещайте указатель направления на любой угол. Направление указателя определяет, какие пары опорных точек будут отображаться на вариограмме. Например, если стрелка указывает в направлении восток запад, только те пары опор ных точек, которые расположены к востоку или к западу друг от друга, будут отображаться на вариограмме. Это позволяет ис ключить те пары точек, которые вас не интересуют, и изучить влияние, которые данные испытывают в различных направле ниях. 7. Инструментом выбора выделите область с точками, имею щими наибольшие значения на вариограмме, чтобы выде лить их цветом на графике и на карте. (Используйте приве денную диаграмму как пример. Вам необязательно выделять те же точки, что показаны на диаграмме, или использовать то же направление поиска.) 7 8 6 5 24 ARCGIS GEOSTATISTICAL ANALYST Обратите внимание, что большинство связанных местоположе ний (представляющих пары точек на карте), независимо от рас стояния, соответствуют одной из опорных точек, расположен ных в районе Лос Анджелеса. Если учитывать другие пары то чек, удаленных на любое расстояние, то можно увидеть, что высокие значения на вариограмме имеют не только пары точек, одна из которых расположена в районе Лос Анджелеса, а другая ближе к побережью. Многие из пар, в которых одна из точек расположена в районе Лос Анджелеса, а другая во внутренних районах штата, также имеют высокие значения на вариограм ме. Это происходит из за того, что значения концентрации озо на в районе Лос Анджелеса намного превышают любые значе ния в других регионах Калифорнии. 8. Закройте диалоговое окно. 9. В меню Выборка выберите опцию Очистить выбранные объ екты, чтобы снять выделение с точек на карте. 9 В этом упражнении мы узнали, что: 1. Данные по концентрациям озона имеют распределение, близкое к нормальному. Они являются унимодальными (одновершинными) и практически симметричными от носительно линии среднего/медианы, что видно на гисто грамме. 2. Нормальный график КК (Квантиль квантиль) еще раз подтвердил, что данные имеют нормальное распределе ние, поскольку точки на графике образуют почти прямую линию; следовательно, нет необходимости в преобразова нии данных. 3. Воспользовавшись инструментом Анализ тренда, вы уви дели, что данные характеризуются наличием тренда, и что тренд наилучшим образом может быть описан поли номом второго порядка в направлении с юго востока на северо запад (угол 330 градусов). 4. Из диаграммы Облако вариограммы/ковариации мы уз нали, что высокие значения концентрации озона в Лос Анджелесе дают высокие значения вариации как для близ лежащих точек, так и для удаленных от данного района точек. 5. Поверхность вариограммы показывает, что в данных су ществует пространственная автокорреляция. Зная, что в наборе данных нет экстремальных (или ошибоч ных) значений опорных точек и что распределение является близким к нормальному, вы с уверенностью можете перехо дить к интерполяции поверхности. Кроме того, вы сможете построить более точную поверхность, поскольку знаете, что в ваших данных существует тренд, который вы сможете учесть в вычислениях. УРОКИ БЫСТРОГО ОБУчЕНИЯ 25 Упражнение 3: Картографирование концентрации озона Для картографирования концентрации озона в Упражнении 1 вы использовали параметры, предложенные по умолчанию. Од нако, вы не учитывали статистические свойства выборки. На пример, при изучении данных в Упражнении 2, выяснилось, что в данных существует тренд. Этот факт может быть использован в процессе интерполяции. В этом упражнении вы: • Усовершенствуете карту концентрации озона, созданную в Упражнении 1. • Познакомитесь с некоторыми основными концепциями гео статистики. Вы снова воспользуетесь для интерполяции методом ординар ного кригинга. Кроме того, для получения более точных проин терполированных значений, в вашу модель вы включите тренд. 1. На панели инструментов Geostatistical Analyst выберите оп цию Мастер операций геостатистики... 2. В окне Слой выберите ca_ozone_pts. 3. В окне Атрибут выберите OZONE. 4. В окне Методы выберите Кригинг. 5. Нажмите Далее. По умолчанию будут выбраны Ординарный кригинг и Карта проинтерполированных значений). 2 3 4 5 При исследовании данных в Упражнении 2 вы узнали, что в ва ших данных есть глобальный тренд. После обработки инстру ментом анализа тренда, вы определили, что тренд наилучшим образом может быть описан полиномом второго порядка и что тренд имеет направление с юго востока на северо запад. Этот тренд может быть представлен математической формулой и вычтен из данных. После вычитания тренда статистический ана лиз будет выполнен для остатков или той составляющей поверх ности, которая соответствует вариации на микроуровне. Тренд будет автоматически добавлен обратно перед построением окон чательной поверхности, и, таким образом, результат интерпо ляции будет более значимым. После вычитания тренда, он пе рестанет оказывать влияние на выполнение анализа данных, а после того, как он будет снова добавлен в данные, поверхность будет более точно представлять интерполируемые значения. 26 ARCGIS GEOSTATISTICAL ANALYST Northwest to southeast global trend 6 Southwest to northeast global trend 7 6. В диалоговом окне Выбор геостатистического метода, в окне Порядок вычитаемого тренда выберите Второй. Для описания тренда будет использован полином второго по рядка, поскольку в диалоге Анализ тренда в Упражнении 2 была получена U образная кривая, расположенная в направ лении с юго запада на северо восток. 7. В диалоге Выбор геостатистического метода нажмите Далее. По умолчанию, модуль Geostatistical Analyst картографирует глобальный тренд для набора данных. Поверхность показы вает наиболее быстрое изменение в направлении с юго запа да на северо восток и более плавное изменение в направле нии с северо запада на юго восток (что приводит к образова нию эллипса). 8 Тренд следует вычитать только в том случае, если для этого есть основание. Тренд в направлении с юго запада на северо восток, характеризующий качество воздуха, может быть отнесен за счет сосредоточения озона между горами и побережьем. Высоты и преобладающее направление ветра также являются фактора ми относительно низких значений концентрации в горах и на побережье. Высокая концентрация населения приводит к вы соким уровням загрязнения между горами и побережьем. Тренд в направлении с северо запада на юго восток меняется значи тельно медленнее благодаря высокой концентрации населения вокруг Лос Анджелеса и уменьшению его плотности в районе Сан Франциско. Следовательно, мы можем обосновано вычесть (удалить) эти тренды. 8. В диалоге Вычитание тренда нажмите Далее. УРОКИ БЫСТРОГО ОБУчЕНИЯ 27 Моделирование вариограммы/ковариации По облаку вариограммы/ковариации в Упражнении 2 вы исследо вали общую пространственную автокорреляцию опорных точек. Для этого вы изучили вариограмму, которая показывает квадрат разностей значений в каждой паре точек в зависимости от расстоя ния между точками. Цель моделирования с помощью вариограм мы/ковариации подобрать лучшую модель, которая пройдет че рез точки на вариограмме (желтая линия на графике). Вариограмма это функция, которая связывает дисперсию (или различие) опорных точек и расстояние, на которое они отстоят друг от друга. Ее графическое представление может быть исполь зовано для получения картины пространственной корреляции опор ных точек и их соседей. Диалоговое окно Моделирование вариограммы/ковариации позво ляет вам моделировать пространственные взаимосвязи в наборе данных. По умолчанию рассчитаны оптимальные параметры для сферической модели вариограммы. Модуль Geostatistical Analyst сначала определяет оптимальный размер лага для группировки зна чений вариограммы. Размер лага это размер класса расстояний между точками, в который сгруппированы пары точек, с тем чтобы сократить большое количество возможных комбинаций. Эта опе рация носит название бининга (binning) группирования по клас сам. Обратите внимание, что в результате бининга на этой варио грамме отображается меньшее количество точек, чем на той, что приведена в Упражнении 2. Правильно определенный размер лага может также помочь в выявлении пространственной корреляции. Диалоговое окно отображает значения вариограммы как поверх ность и как точечный график, по одной из осей которого отклады вается расстояние. Затем по умолчанию строится сферическая модель вариограммы (наиболее подходящая для всех направле ний) и определяются связанные с ней параметры, которые обычно носят название самородка, радиуса влияния и частичного порога . Попробуйте подобрать вариограмму для небольших значений ла гов. Можно использовать различные размеры бинов (классов) и изменить сферическую модель, предложенную по умолчанию, по меняв размер лага и количество лагов. 9. Наберите новое значение размера лага, равное 12000. 10. В окне Количество лагов введите 10. Сокращение размера лага означает, что вы увеличиваете деталь ность модели, что позволяет изучать локальные различия между соседними опорными точками. Обратите внимание, что с умень шением размера лага, подобранная вариограмма (желтая ли ния) быстро поднимается, а затем выравнивается. Радиус влия ния (range) это расстояние, при котором линия выравнивает ся. Такое выравнивание вариограммы указывает на то, что за пределами значения радиуса влияния автокорреляция неболь шая. 10 9 После того, как вы вычтете тренд из данных, вариограмма будет моделировать пространственную автокорреляцию для опорных точек без учета тренда. Тренд будет автоматически добавлен в вычисления перед окончательным построением поверхности. 28 ARCGIS GEOSTATISTICAL ANALYST Цветовая шкала Эмпирические значения вариограммы Значение вариограммы Подобранная модель вариограммы Поверхность вариограммы Возможные модели вариограммы Значения связанных с моделью параметров Цветовая шкала, которая представляет вычисленное значение вариограммы, обеспечивает прямую связь между эмпирически ми значениями вариограммы на графике и теми же значениями на поверхности вариограммы. Значение каждой “ячейки” на поверхности вариограммы обозначено цветом, при этом мень шие значения показаны голубым и зеленым цветом, а более вы сокие значения оранжевым и красным цветом. Среднее значе ние каждой ячейки поверхности вариограммы нанесено на гра фике вариограммы. По оси x графика вариограммы откладыва ется расстояние от центра ячейки до центра поверхности вари ограммы. Значения вариограммы отражают различия точек. В нашем примере, вариограмма начинается с маленьких значе ний (объекты, расположенные поблизости, в наибольшей сте пени похожи) и увеличивается по мере удаления точек друг от друга (чем дальше отстоят объекты друг от друга, тем больше они непохожи друг на друга). Обратите внимание, что в соот ветствии с поверхностью вариограммы различия между объек тами быстрее нарастают в направлении с юго запада на северо восток, чем в направлении с юго востока на северо запад. Ранее вы вычли тренд, присутствующий в данных для всей террито рии. Теперь видно, что существуют составляющие автокорреля ции и на более детальном уровне, которые мы и будем моделиро вать далее. УРОКИ БЫСТРОГО ОБУчЕНИЯ 29 Вариограммы по направлениям Влияние по направлениям будет затрагивать как значение то чек на вариограмме, так и подбираемую модель. В определен ных направлениях близко расположенные друг к другу объекты могут быть более похожи, чем в других направлениях. Направ ленные влияния носят название анизотропии и могут учиты ваться модулем Geostatistical Analyst. Анизотропия может быть вызвана ветром, переносом, геологической структурой и многи ми другими процессами. Направленное влияние может быть описано статистически и учтено при составлении карты. Вы можете исследовать различия в данных для определенного направления с помощью инструмента Направление поиска. Это позволит вам изучить направленное влияние по графику варио граммы. Эта операция не влияет на результирующую поверх ность. Далее приведены шаги, которые помогут вам получить требуемый результат. 11. Отметьте галочкой опцию Показать направление поиска. Обратите внимание на сокращение числа значений варио граммы. Отображаются только те точки, которые соответ ствуют направлению поиска. 12. Удерживайте курсор на центральной линии инструмента Направление поиска. Меняйте направление инструмента поиска. Обратите внимание, как по мере изменения на правления поиска, меняется вариограмма. Только значе ния поверхности вариограммы, расположенные в направ лении поиска, отображаются на верхнем графике варио граммы. Чтобы действительно учесть направленные влияния для модели вариограммы при интерполяции поверхности, вы должны вы числить анизотропную модель вариограммы или ковариации. 13 11 12 13. Включите опцию Анизотропия. Голубой эллипс на поверхности вариограммы указывает на ра диус влияния вариограммы в различных направлениях. В на шем случае большая ось эллипса направлена приблизительно с северо северо запада на юго юго восток. Теперь анизотропия будет включена в модель с тем, чтобы учесть в результирующей поверхности различия в автокорреляции по направлениям. 30 ARCGIS GEOSTATISTICAL ANALYST Радиус влияния 14 14.Введите следующие параметры для инструмента Направ ление поиска с тем, чтобы указатель направления совпал с малой осью анизотропного эллипса: Угол направления: 236.0 Угол захвата: 45.0 Ширина полосы (лаги): 3.0 Обратите внимание, что форма кривой вариограммы измени лась и теперь быстрее достигает значения порога. Координаты x и y даны в метрах, следовательно, радиус влияния в данном на правлении составляет приблизительно 74 км. 15 15.Введите следующие параметры для инструмента Направ ление поиска с тем, чтобы указатель направления совпал с большой осью анизотропного эллипса: Угол направления: 340.0 Угол захвата: 45.0 Ширина полосы (лаги): 3.0 Кривая модели вариограммы растет более постепенно, а затем выравнивается. Радиус влияния в этом направлении составляет 114 км. Плоская часть кривой, которую достигает модель вариограммы в шагах 14 и 15, соответствует одному и тому же значению, известному как порог. Радиус влияния это расстояние, при котором модель вариограммы достигает предельного значения (порога). За пределами этого радиуса влияния различия между точками при увеличении размера лага остаются постоянными. Лаг определяется расстоянием между парами точек. Точки, уда УРОКИ БЫСТРОГО ОБУчЕНИЯ 31 Ðàäèóñ âëèÿíèÿ Порог Самородок Размер лага (расстояние) Анизотропный эллипс ленные на расстояние лага, большее, чем радиус влияния, про странственно не коррелируют. Самородок представляет ошиб ку измерений и/или вариацию на микроуровне (отклонения на очень маленьком пространстве, слишком трудные для опреде ления). Можно оценить ошибку измерений, если для каждой точки у вас есть множественные измерения, или вы можете раз ложить самородок на ошибку измерений и вариацию на микро уровне, выбрав опцию Моделирование ошибки (самородка). 32 10 16. Нажмите Далее. Теперь у вас есть модель, которая описывает пространствен ную автокорреляцию и учитывает возможность вычитания тренда и направленное влияние в данных. Эта информация, наряду с информацией о расположении опорных точек во круг искомой и их измеренных значениях, будет использова на при выполнении интерполяции. Но как следует использо вать в расчетах измеренные человеком значения в опорных точках? ARCGIS GEOSTATISTICAL ANALYST Поиск соседства Обычно, чтобы ограничить данные, применяемые в интерполя ции, задают область в форме окружности (или эллипса). Попа дающие в заданную окрестность точки и используются при ин терполяции значений в точках, в которых измерения не прово дились. Кроме того, чтобы избежать смещения в определенном направ лении, окружность (или эллипс) делят на сектора, в каждом из которых выбирается одинаковое количество точек. Воспользо вавшись диалогом Поиск соседства, вы можете определить ко личество точек (максимум 200), радиус (или малую и большую оси эллипса), и количество секторов круга (или эллипса), кото рые будут использованы при выполнении интерполяции. Цвет выделенных точек в окне просмотра данных указывает на то, какие веса будут присвоены каждой точке при вычислении неизвестных значений. В нашем примере, четыре точки (крас ные) имеют веса более 10 процентов. Чем больше вес, тем боль шее влияние данная точка будет оказывать в процессе выполне ния интерполяции. 17. Щелкните мышью на графическом изображении, чтобы выбрать точку, для которой будет выполняться интерполя ция (эта точка будет находиться на перекрестье). Обрати те внимание на то, что изменилась выборка опорных точек (наряду с присвоенными им весами). Именно эти точки бу дут использованы при вычислении значения в искомой точ ке. 18. Для целей данного учебного пособия, наберите следующие координаты в диалоге Искомая точка: X = 2044968 и Y = 208630.37. 19. Отметьте галочкой опцию Форма и в окне Угол наберите 90. Обратите внимание, как меняется форма. Однако, что бы учесть направленные влияния, измените значение угла обратно на 338.1. Использованные точки и присвоенные веса Сектор поиска соседства Перекрестье определяет положение искомой точки Периметр области поиска соседства Предварительный просмотр поверхности или соседних точек Количество точек, используемых в расчетах, для каждого сектора поиска Минимальное количество точек, которое будет учитываться в каждом секторе поиска Геометрия и количество секторов, используемых в поиске 18 17 21 УРОКИ БЫСТРОГО ОБУчЕНИЯ 33 20. Отключите опцию Форма — модуль Geostatistical Analyst будет использовать параметры, предложенные по умолча нию (ранее вычисленные в диалоге Вариограмма/Ковари ация). 21. Нажмите Далее в диалоге Поиск соседства. Перед тем, как перейти к построению поверхности, вы восполь зуетесь диалогом Перекрестная проверка, чтобы выполнить диагностику параметров и определить, “насколько хорошей” будет ваша модель. 34 ARCGIS GEOSTATISTICAL ANALYST Перекрестная проверка Перекрестная проверка дает вам представление о том, “насколь ко хорошо” модель интерполирует неизвестные значения. Для всех точек в ходе выполнения перекрестной проверки вы полняется следующая операция: точки последовательно исклю чаются из выборки, затем вычисляется значение в этой точке с использованием оставшихся данных, а затем измеренное и вы численное значение сравниваются. По суммарной статистике перекрестной проверки можно определить, подходит ли модель для составления карты. Линия, наилучшим Точечный график образом перекрестной описывающая модель проверки Линия 1:1 Помимо визуализации отстояния точек от линии 1:1, для оцен ки поведения модели могут быть использованы статистические показатели. Цель перекрестной проверки помочь вам принять обоснованное решение о том, какая из моделей наиболее точно интерполирует значения. Для модели, которая точно интерпо лирует значения, средняя ошибка должна быть близка к 0, сред неквадратичная ошибка и среднее из стандартных ошибок ин терполяции должно иметь наименьшее из возможных значение (это полезно при сравнении моделей), а среднеквадратичная нормированная ошибка должна быть близка к 1. В данном случае термин “ошибка интерполяции” используется для обозначения разницы между интерполированным и факти ческим значением. Для модели, выполняющей точную интерпо ляцию, средняя ошибка интерполяции должна быть близка к 0, если интерполированные значения являются несмещенными; среднеквадратичная нормированная ошибка интерполяции должна быть близка к 1, если стандартные ошибки небольшие; и среднеквадратичная ошибка вычислений должна иметь малень кие значения, если проинтерполированные значения близки к измеренным. Диалог Перекрестная проверка также позволяет вам просмот реть графики рассеяния, на которых будут показаны: Ошибка, Нормированная ошибка, а также график КК (Квантиль кван тиль) для каждой точки выборки. Суммарная статистика Результат выполнения упражнения по перекрестной проверке данных УРОКИ БЫСТРОГО ОБУчЕНИЯ 35 22. Выберите закладку График КК, чтобы просмотреть гра фик Квантиль квантиль. Из данного графика (КК) видно, что некоторые значения рас положены немного выше линии, а некоторые немного ниже линии, но большинство точек расположены очень близко к пря мой пунктирной линии, что указывает на то, что ошибки интер поляции близки к нормальному распределению. 23. Чтобы выделить цветом местоположение определенной точки, выберите строку в таблице, соответствующую инте ресующей вас точке. Выбранная точка на диаграмме будет выделена зеленым цветом. 24. Кроме того, нажмите кнопку Сохранить результаты пере крестной проверки... с тем, чтобы использовать таблицу для дальнейшего анализа. Выбранная точка Диалог Информация о результирующем слое содержит краткую информацию о модели, которая будет использова на для построения поверхности. 22 26 26. Нажмите OK. Карта проинтерполированных значений концентраций озона появится как верхний слой в таблице содержания ArcMap. 24 25. Нажмите Готово. 36 23 25 ARCGIS GEOSTATISTICAL ANALYST По умолчанию, слою присваивается название метода кригинга, использованного для построения поверхности (например, Ор динарный кригинг). 27. Щелкните по названию слоя, чтобы выделить его цветом, затем еще раз щелкните по нему и измените название на “Вычтенный тренд”. 29 27 28 Вы можете также построить поверхность стандартной ошибки интерполяции, чтобы оценить качество полученных после вы полнения вычислений значений. 28. Нажмите правую клавишу мыши на созданном вами слое “Вычтенный тренд” и выберите в открывающемся меню опцию Построить карту значений стандартной ошибки ин терполяции . 29. На стандартной панели инструментов нажмите Сохранить. Стандартные ошибки количественно характеризуют неопре деленность интерполяции для каждой точки построенной вами поверхности. Простое правило большого пальца гласит, что в 95 процентах случаев, истинное значение поверхности будет равно проинтерполированному значению ± 2 двукратная стандарт ная ошибка интерполяции, если данные подчиняются закону нормального распределения. Обратите внимание, что на поверх ности стандартной ошибки интерполяции точки, расположен ные ближе к точкам выборки, как правило, имеют более низкую ошибку. Поверхность, построенная вами в Упражнении 1, просто ис пользовала значения, предлагаемые в модуле Geostatistical Analyst по умолчанию, без учета трендов поверхности, возможности при менения лагов меньших размеров или анизотропной модели ва риограммы. Поверхность проинтерполированных значений, построенная вами в этом упражнении, учитывает глобальные тренды в данных, возможность изменения размера лага и на правленное влияние (анизотропию) на вариограмме. В Упражнении 4, вы сравните две модели, чтобы определить, какая из них наилучшим образом интерполирует неизвестные значения. Примечание: Как вы снова можете видеть, интерполяция рас пространяется и на океан. В Упражнении 6 вы узнаете, как ограничить поверхность проинтерполированных значений тер риторией штата Калифорния. УРОКИ БЫСТРОГО ОБУчЕНИЯ 37 Упражнение 4: Сравнение моделей Используя возможности модуля Geostatistical Analyst, вы можете сравнить результаты двух построенных и отображенных на кар тах поверхностей. Это позволит вам, на основе изучения стати стики перекрестной проверки, принять взвешенное решение о том, какая из них более точно интерполирует значения концен трации озона. 1. Правой клавишей мыши щелкните на слое “Вычтенный тренд”, выберите опцию Сравнить... Вы будете сравнивать этот слой со слоем, созданным вами в упражнении 2 на основе параметров, предложенных по умолчанию. 2 3. Нажмите правую клавишу мыши на слое “По умолчанию” и выберите Удалить. 1 3 Поскольку для слоя с вычтенным трендом среднеквадратичная ошибка интерполяции меньше, среднеквадратичная нормиро ванная ошибка интерполяции ближе к единице, и средняя ошиб ка интерполяции ближе к нулю, чем для слоя, построенного с параметрами, предложенными по умолчанию, вы можете с оп ределенной уверенностью утверждать, что модель с вычтенным трендом лучше и является более достоверной. Таким образом, вы можете удалить слой, созданный с использованием парамет ров, предложенных по умолчанию, поскольку он вам больше не нужен. 2. Закройте диалог Сравнение результатов перекрестной про верки. 4. Выберите слой “Вычтенный тренд” и переместите его в ниж нюю часть таблицы содержания с тем, чтобы вы могли ви деть точки выборки и контурную карту штата Калифорния. 5. Нажмите Сохранить на стандартной панели инструментов. Итак, вы определили лучшую поверхность интерполяции. Но существуют и другие типы поверхностей, которые вы, возмож но, захотите построить. 38 ARCGIS GEOSTATISTICAL ANALYST Упражнение 5: Картографирование вероятности превышения критического значения концентрации озона В Упражнениях 1 и 3 для картографирования концентраций озона в Калифорнии вы воспользовались методом ординарного кригинга с применением различных параметров. В процессе принятия решений вы должны также подумать о том, как сле дует использовать карту проинтерполированных значений кон центраций озона для выявления территорий, подверженных опасности, поскольку существует неопределенность в вычисле нии значений для всей поверхности. Например, предположим, что критическое значение концентрации озона составляет 0.12 ppm для восьмичасового периода, и вы хотите узнать, есть ли точки, в которых это значение превышено. Чтобы помочь в про цессе принятия решений, вы можете воспользоваться модулем Geostatistical Analyst для картографирования вероятности того, что значения концентрации озона превышают критические. 5. В диалоге Выберите входные данные и метод нажмите Да лее . 6. Выберите Индикаторный кригинг; обратите внимание, что выбрана опция Карта вероятности. 7. Установите первичное пороговое значение равным 0.12. 8. Отметьте опцию Превышает. 6 Хотя модуль Geostatistical Analyst предоставляет целый ряд ме тодов, с помощью которых можно решить эту задачу, в данном упражнении мы воспользуемся методом индикаторного кригин га. Для этого метода не существует ограничений на нормаль ность распределения данных. Значения данных преобразуются в серии нулей и единиц, в соответствии с тем, находятся ли значения данных ниже или выше критического (порогового) значения. Если в качестве порогового используется значение равное 0.12, любому значению ниже этого будет присвоено зна чение 0, а значениям, превышающим данную величину, будет присвоено значение 1. Затем индикаторный кригинг использу ет модель вариограммы, рассчитанную на основе преобразован ного в нули единицы набора данных. 1. На панели Geostatistical Analyst выберите Мастер операций геостатистики.... 2. В окне Входные данные (слой) выберите ca_ozone_pts. 3. В окне Атрибут выберите OZONE. 8 7 9 9. В диалоге Выбор геостатистического метода нажмите Далее. 10.В диалоге Выбор дополнительных отсекателей нажмите Далее. 11. Выберите опцию Анизотропия, чтобы учесть направлен ность данных. 12. Задайте размер лага равным 25000 и количество лагов, равным 10. 4. В окне Метод выберите Кригинг. УРОКИ БЫСТРОГО ОБУчЕНИЯ 39 13. Нажмите Далее в диалоге Моделирование вариограммы/ ковариации. 14. Нажмите Далее в диалоге Поиск соседства. Голубая линия на диаграмме в следующем диалоге показы вает пороговое значение 0.12 ppm. Точкам слева от этой линии присвоен индикатор 0, а точкам справа от линии индикатор 1. 15. Прокрутите таблицу вправо, пока не будут отображаться столбцы Измеренное, Индикатор и Интерполяция значе ний индикатора. 16. Выделите цветом строку в таблице, со значением индика тора, равным 0. Эта точка будет выделена зеленым цветом на графике, слева от голубой линии, соответствующей по роговому значению. 16 15 Столбцы с измеренными значениями и значениями индикатора показывают действительное и преобразованное значение каж дой точки выборки. Проинтерполированные значения индика тора могут быть интерпретированы как вероятность превыше ния пороговых значений. Предполагаемые значения индикато ра вычисляются с использованием модели вариограммы на осно ве бинарных (0, 1) данных, полученных индикаторным преоб разованием ваших исходных данных. Перекрестная проверка последовательно исключает точку, а затем для каждой рассчи тывает предполагаемое значение индикатора. Например, наибольшее измеренное значение равно 0.1736. Если бы измерения в этой точке в действительности не проводились, на основе метода индикаторного кригинга с вероятностью 85 процентов было бы определено, что значение концентрации в данной точке превышает пороговое значение. 17. Нажмите кнопку Готово в диалоге Перекрестная провер ка. 18. Нажмите OK в диалоге Информация о результирующем слое. В виде данных ArcMap верхним слоем отобразится карта вероятности. На карте показаны предполагаемые значения индикатора, которые могут быть интерпретированы как вероятность того, что в 1996 году в течение одного или нескольких дней было превышено пороговое значение концентрации в 0.12 ppm. 17 40 ARCGIS GEOSTATISTICAL ANALYST 19 По нашей карте видно, что вероятность того, что значения кон центрации в районе Лос Анджелеса (в среднем, составляющие менее 0.12 ppm для каждого восьмичасового интервала в году) превысят установленное нами пороговое значение, довольно высока. 19. Выделите слой Индикаторный кригинг и, удерживая, пе ретащите его вниз, расположив между слоями “ca_outline” (картографическая основа штата Калифорния) и “вычтен ный тренд”. Нажмите Сохранить на стандартной панели инструментов, что бы сохранить карту. В Упражнении 6 вы узнаете, как с исполь зованием возможностей ArcMap картографически правильно оформить карту поверхности проинтерполированных значений, построенной вами в Упражнении 3, и поверхности вероятности, построенной в данном упражнении. УРОКИ БЫСТРОГО ОБУчЕНИЯ 41 Упражнение 6: Создание окончательного варианта карты Вы приступаете к созданию окончательного варианта карты, который вы будете использовать в презентации. Для создания 2 такой результирующей карты, на которой будут показаны по 4 верхность проинтерполированных значений и поверхность со 3 значениями вероятности, вы воспользуетесь возможностями ArcMap. Отображение обеих поверхностей Вы можете изменить отображение карты вероятности таким образом, чтобы вы могли видеть обе карты проинтерполиро ванных значений и вероятности одновременно. Уровни значе ний вероятности будут показаны изолиниями. 5 1. Нажмите правую клавишу мыши на слое Индикаторный кри гинг. Выберите опцию Свойства... 2. Выберите закладку Символы. 3. Снимите выделение с опции Контура с заливкой, затем от метьте галочкой строку Изолинии. 4. В окне Цветовая шкала выберите другую цветовую палитру. 5. Нажмите OK. Теперь, как показано на рисунке справа, вы видите одновре менно и карту значений вероятности (изолинии), и карту проинтерполированных значений. 42 ARCGIS GEOSTATISTICAL ANALYST Экстраполяция значений концентраций озона По умолчанию, модуль Geostatistical Analyst интерполирует зна чение выбранной переменной в любой точке, которая лежит в пределах территории, ограниченной расположением опорных точек в направлениях север юг и запад восток. Однако, карта проинтерполированных значений концентраций озона не по крывает географически всю территорию штата Калифорния (слой ca_outline). Чтобы преодолеть эту проблему, вы экстрапо лируете значения (т. е., вычислите значения за пределами огра ничивающей рамки) для обеих поверхностей. 1. Нажмите правую клавишу мыши на слое Индикаторный кри гинг в таблице содержания и выберите Свойства... Выбери те закладку Экстент (Область простирания). В окне Устано вить экстент равным: выберите опцию “пользовательский экстент, определенный ниже”, и наберите следующие зна чения для опции Видимый экстент, затем нажмите OK: Левая: 2400000 Правая: 1600000 Верхняя: 860000 Нижняя: 400000 Повторите этот шаг для слоя Вычтенный тренд. Вырезание слоев по контуру штата Калифорния Теперь вы вырежете слои по лекалу контура слоя ca_outline, поскольку вас интересует только картографирование уровней концентрации озона в пределах штата Калифорния. Это сдела ет вашу карту визуально более привлекательной. 1. Нажмите правую клавишу мыши на строке Слои и выберите Свойства. 1 2. Выберите закладку Фрейм данных. 3. Отметьте галочкой Включить в разделе Вырезать по форме. 4. Нажмите кнопку Задать форму. 5. Выберите опцию Контур объектов. 6. В списке Слой выберите ca_outline. 7. Нажмите OK. 8. Нажмите OK, чтобы закрыть диалог Вырезание фрейма дан ных. УРОКИ БЫСТРОГО ОБУчЕНИЯ 43 2 3 4 8 6 5 7 44 Вырезанная карта должна выглядеть, как показано на рисунке. Размещение на карте Лос Анджелеса 1. На стандартной панели инструментов нажмите кнопку До бавить данные. 2. Перейдите к папке, в которую вы сохранили учебные дан ные (путь, предлагаемый по умолчанию C:\ArcGIS\ArcTutor\Geostatistics), затем выберите ca_cities. 3. Нажмите Добавить. На экране отобразится карта городов Калифорнии. ARCGIS GEOSTATISTICAL ANALYST 4. Выбрав слой ca_cities, нажмите правую клавишу мыши и 7 выберите опцию Открыть таблицу атрибутов. 5. Прокрутите таблицу и найдите в столбце AreaName название Лос Анджелес (Los Angeles). Выберите эту строку. Город Лос Анджелес будет выделен на карте цветом. 6. Закройте таблицу атрибутов. 6 5 Создание компоновки 1. В Главном меню выберите Вид, а затем Вид компоновки. 2. Щелкните по карте, чтобы выбрать ее. 3. За нижний левый угол растяните рамку данных, чтобы из менить размер карты. 7. На панели инструментов выберите инструмент Фиксирован ное увеличение и увеличьте изображение в районе Лос Анд желеса. Обратите внимание, что область с наиболее высокими значения 3 ми концентрации озона расположена в действительности немного к востоку от Лос Анджелеса. УРОКИ БЫСТРОГО ОБУчЕНИЯ 45 4. В Главном меню выберите Вставка и выберите опцию Фрейм данных. На карту помещена новая рамка данных. Теперь вы можете скопировать все слои из первой рамки в эту рамку с тем, чтобы отобразить карту значений концентраций озона для всей Калифорнии наряду с картой, показывающей в более крупном масштабе район Лос Анджелеса. 6 5 Повторите шаги 5 и 6 для всех остальных слоев. 7. Растяните Новый фрейм данных на всю страницу. 5. Нажав правую клавишу мыши на слое “Вычтенный тренд”, выберите опцию Копировать. 6. Нажав правую клавишу мыши на строке Новый фрейм дан ных в таблице содержания, выберите опцию Вставить слой. 46 7 ARCGIS GEOSTATISTICAL ANALYST 8. Чтобы отобразить карту целиком в Новом фрейме данных, на панели инструментов выберите кнопку Полный экстент. 9. Нажав правую клавишу мыши на Новом фрейме данных, выберите Свойства. 10. Выберите закладку Фрейм данных и аналогично тому, как вы проделали это для первой рамки, включите опцию Включить в разделе Вырезать по форме и нажмите кнопку Задать форму... Выберите в качестве лекала, по которому вы будете вырезать, слой ca_outline, затем нажмите OK. Добавление отмывки и прозрачности 1. Нажав правую клавишу мыши на строке Новый фрейм дан ных, выберите опцию Добавить данные. На экране отобразится карта рельефа Калифорнии. 4. Перетащите слой ca_hillshade в нижнюю часть таблицы со держания. 5. Нажав правую клавишу мыши на слое “Вычтенный тренд” в таблице содержания Нового фрейма данных, выберите Свой ства. 6 7 8 2. Перейдите к папке, в которой вы установили учебные дан ные (путь, предлагаемый по умолчанию C:\ArcGIS\ArcTutor\Geostatistics), затем выберите файл ca_hillshade. 3. Нажмите Добавить. 6. Выберите закладку Отображение. 7. В разделе Прозрачность наберите значение 30 (процентов). 8. Нажмите OK. Рельеф с отмывкой будет теперь частично отображаться как подстилающий слой для слоя “Вычтенный тренд”. Добавление элементов карты 1. В Главном меню выберите Вставка, а затем Легенда. 2. Поместите легенду в левый нижний угол макета. 3. Дополнительно, выбрав опцию Вставка, вы можете добавить стрелку севера, масштабную линейку или текст масштаба. УРОКИ БЫСТРОГО ОБУчЕНИЯ 47 На следующем рисунке приведен пример окончательной кар ты, которую вы можете создать, воспользовавшись возмож ностями ArcMap. Если вам необходимо узнать больше о том, как добавлять элементы на карту, обратитесь к книге Ис пользование ArcMap. На карте видно, что для территории к востоку от Лос Андже леса характерны наиболее высокие проинтерполированные значения концентрации озона и наиболее высокая вероят ность того, что эти значения превысят критическое порого вое значение (0.12 ppm) в хотя бы один восьмичасовой пери од в течение 1996 года. Поскольку таковы результаты анали за (но помните, что исходные данные были изменены), воз можно, вы захотите сфокусировать внимание на этих райо нах и проанализировать временные серии измерений кон центраций озона с тем, чтобы точно определить районы по тенциального риска. 48 ARCGIS GEOSTATISTICAL ANALYST Принципы геостатистического анализа 3 В ЭТОЙ ГЛАВЕ • Что такое детерминистские методы • Что такое геостатистические методы • Проработка проблемы • Основные принципы, лежащие в основе методов геостатистики • Моделирование вариограммы • Интерполирование неизвестных значений с использованием кригинга • Модуль Geostatistical Analyst Модуль Geostatistical Analyst использует значения в опорных точках, рас положенных в различных частях ландшафта, и строит (интерполирует) не прерывную поверхность. Опорные точки это точки, в которых измерены значения какого либо явления, например, размеры утечки радиации с атомной электростанции, или объемы пролива нефти, или значения высот. Модуль Geostatistical Analyst восстанавливает поверхность, используя значения в измеренных точках для интерполирования значений в каждой точке ландшафта. В модуле Geostatistical Analyst возможно применение двух групп методов интерполяции: детерминистских и геостатистических. Все методы постро ения поверхности основаны на сходстве точек, которые расположены близ ко к опорным. Детерминистские методы используют для интерполяции математические функции. Геостатистика опирается как на статистические, так и на математические методы, которые могут быть использованы для построения поверхности и для оценки ошибки интерполяции. Модуль Geostatistical Analyst, помимо различных способов интерполяции, предлагает также множество сопутствующих инструментов анализа. Эти инструменты позволяют изучить данные и глубже понять их с тем, чтобы на основе имеющейся информации, вы могли построить более достовер ные поверхности. В этой главе дан обзор теоретических положений, которые лежат в основе детерминистских и геостатистических методов интерполяции. Первая часть главы познакомит вас с детерминистскими методами интерполяции. Затем на примере вы узнаете, что такое геостатистические методы и позна комитесь с принципами, концепциями и предположениями, которые обра зуют основу геостатистики. 49 Что такое детерминистские методы Построение непрерывной поверхности для представления опре деленных измерений одно из ключевых требований, предъявля емых к большинству ГИС приложений. Возможно, наиболее час то используемый тип поверхности это цифровая модель релье фа. Такие наборы данных в мелком масштабе есть в готовом виде для различных территорий мира. Однако, как уже говорилось, любое измеренное значение в точке ландшафта, земной коры или атмосферы может быть использовано для построения непрерыв ной поверхности. Главная проблема, с которой сталкиваются спе циалисты, занимающиеся моделированием в ГИС, построение наиболее точной из возможных поверхностей на основе существу ющих опорных точек, наряду с оценкой ошибки интерполяции и отклонений в значениях проинтерполированной поверхности. Вновь построенные поверхности впоследствии используются в ГИС моделировании и анализе, наряду с их трехмерной визуали зацией. Понимание качества этих данных может значительно улуч шить эффективность и направленность ГИС моделирования. Эта роль и отводится модулю Geostatistical Analyst. Анализ свойств поверхности в окрестностях опорной точки В целом, объекты, расположенные ближе друг к другу, как пра вило, более похожи между собой, чем удаленные друг от друга объекты. Это один из основных принципов географии (Tobler, 1970). Представьте себе, что вы занимаетесь планированием в городе, и перед вами стоит задача разбить в своем городе живо писный парк. У вас есть несколько предполагаемых мест, и вам необходимо смоделировать обзор для каждой проектируемой точ ки. Для этого вам необходим подробный набор данных с высотами поверхности на изучаемую территорию. Предположим, что у вас уже есть данные о высотах для 1000 точек, расположенных по всему городу. Эти данные вы можете использовать для построе ния новой поверхности высот. При построении поверхности высот, вы можете предположить, что значения высот в точках, для которых выполняется интерпо ляция, и значения в опорных точках, расположенных к ним бли же всего, будут похожи. Но возникает вопрос: сколько опорных точек следует рассматривать? И следует ли значения во всех опор ных точках учитывать одинаково? По мере того, как вы удаляетесь от искомой точки, влияние опор ных точек будет уменьшаться. Учет в вычислениях точки, уда ленной на значительное расстояние от опорной, может быть оши бочным, поскольку точка может находиться на участке местнос ти, кардинальным образом отличающимся от того, на котором расположена искомая точка. Одно из решений учитывать достаточное количество точек, об разующих небольшую, но репрезентативную выборку. Число то чек будет варьировать в зависимости от общего количества опор ных точек и их расположения в пространстве, а также от харак тера поверхности. Если выборки с высотами относительно равно 50 ARCGIS GEOSTATISTICAL ANALYST мерно распределены, и характеристики поверхности не меняют ся в различных частях ландшафта, вы можете с достаточной точ ностью интерполировать значения поверхности на основе значе ний в близлежащих точках. Чтобы учесть различную удаленность точек от искомой точки, значениям опорных точек, расположен ных ближе к ней, присваивается больший вес. Это основа метода интерполяции, известного как Метод (обрат ных) взвешенных расстояний Inverse Distance Weighting (IDW). Как следует из названия, вес значения уменьшается по мере уве личения расстояния от искомой точки. Визуализация интерполяции по методу глобального полинома Есть и другие решения для интерполяции значений в точках, в которых не проводились измерения. Одно из предполагаемых мест для парка пологий склон горы. Поверхность горы наклонная плоскость. Однако, опорные точки расположены в небольших понижениях или на небольших возвышенностях (локальная ва риация). Использование ближайших соседних опорных точек для интерполирования значений может исказить искомое значение в сторону занижения или завышения значений из за влияния та ких понижений и возвышений. В дальнейшем, вы научитесь учи тывать локальную вариацию, вычитая из поверхности тренд (для данной территории трендом является наклонная плоскость). Спо собность определить и смоделировать локальные структуры и трен ды может увеличить точность создаваемой поверхности. Чтобы взять за основу вашей интерполяции поверхность тренда для всей территории, вы можете подобрать плоскость, которая будет проходить через опорные точки. Плоскость может быть определена математической формулой, которая является част ным случаем семейства математических формул, известных как полиномы (многочлены). Затем вы сможете определить неизве стное значение высоты в интерполируемой точке по значению соответствующей точки на плоскости. Плоскость может прохо дить выше или ниже определенных точек. Цель интерполяции минимизировать ошибку. Вы можете измерить ошибку путем вычитания значения каждой опорной точки из ее проинтерполи рованного значения на плоскости, нахождения квадрата этой ве личины, и последующего суммирования результатов. Такой метод носит название подбора по методу наименьших квадратов. Этот процесс составляет теоретическую основу для интерполяции по методу глобального полинома первого порядка. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 51 Но что если вы захотите описать плоскость, которая соответство вала бы долине? Получить достоверную поверхность, использовав для ее описания плоскость, было бы довольно сложно. Однако, если у вас только один перегиб плоскости (см. нижний рисунок), вы сможете подобрать более точную поверхность, чем плоскость (то есть, получить более близкие значения для большего количе ства значений). Возможность описания одного перегиба поверх ности основа интерполяции по методу глобального полинома вто рого порядка. Два перегиба плоскости могут быть описаны поли номом третьего порядка, и так далее. Перегибы могут быть рас положены в двух направлениях, и тогда можно будет описать по верхность “в форме чаши”. Визуализация интерполяции по методу локальных полиномов Теперь рассмотрим, что происходит, когда поверхность сначала является наклонной, затем выравнивается, а затем снова образу ет склон. Попытка описать этот участок плоскостью даст плохие результаты. Однако, если вы сможете использовать несколько меньших перекрывающих плоскостей, а затем использовать центр каждой плоскости как интерполируемое значение для каждой точки на этой плоскости, результирующая поверхность будет бо лее гибкой и возможно более точной. Это концептуальная основа для интерполяции по методу локальных полиномов. Визуализация радиальных базисных функций Радиальные базисные функции позволяют строить поверхности, учитывающие глобальный тренд наряду с локальными вариация ми. Это помогает в тех случаях, когда подбор плоскости для значе ний в опорных точках не дает точного описания поверхности. Чтобы построить поверхность, допустим, что у вас есть возмож ность изогнуть и растянуть интерполируемую поверхность таким образом, чтобы она прошла через все опорные точки. Существует много способов для определения формы поверхности в проме жутках между опорными точками. Например, вы можете заста вить поверхность образовывать изящные изгибы (плоский сплайн), или вы можете контролировать, насколько крепко вы тяните за края поверхности (сплайн с натяжением). Это концеп туальная основа интерполяции, основанная на радиальных ба зисных функциях. 52 ARCGIS GEOSTATISTICAL ANALYST Что такое геостатистические методы Геостатистические решения Итак, способы, рассмотренные нами, относятся к детерминист ским методам интерполяции, поскольку они напрямую основа ны на измеренных значениях опорных точек в окрестностях искомой или на заданных математических формулах, которые определяют сглаживание результирующей поверхности. Вто рое семейство методов интерполяции состоит из геостатистиче ских методов, которые основаны на статистических моделях, учитывающих автокорреляцию (статистические взаимоотноше ния между опорными точками). С помощью этих методов мож но не только построить искомую поверхность, но и получить некую количественную оценку точности интерполяции. Далее вы рассмотрите основные шаги применения методов гео статистики на примере ординарного кригинга. Кригинг аналогичен методу взвешенных расстояний (IDW) в том, что опорным точкам из окрестности искомой точки, для получения ее значений, присваиваются веса. Однако веса осно ваны не только на расстоянии между измеренными точками и искомой точкой, но и на распределении опорных точек в прост ранстве в целом. Чтобы учесть расположение в пространстве, придав точкам весовые коэффициенты, необходимо количест венно определить пространственную автокорреляцию. Чтобы решить задачу геостатистического анализа, необходимо пройти несколько этапов. Расчет эмпирической вариограммы—кригинг, как и большин ство способов интерполяции, построен на предположении, что объекты, расположенные поблизости, более похожи друг на дру га, чем удаленные друг от друга объекты (это предположение в данном примере количественно определенно как пространст венная автокорреляция). Эмпирическая вариограмма это сред ство для исследования связей между точками. Пары, располо женные на близком расстоянии, должны иметь меньшую разни цу в измеренных значениях, чем те опорные точки, которые удалены друг от друга. То, насколько это предположение верно, может быть изучено по эмпирической вариограмме. Подбор модели—осуществляется путем подбора линии, кото рая наилучшим образом проходит через точки на графике эмпи рической вариограммы. То есть, вы должны определить линию таким образом, чтобы (взвешенный) квадрат разницы между каждой точкой и линией был как можно меньше. Такой способ носит название подбора по методу (взвешенных) наименьших квадратов. Эта линия и будет моделью, количественно опреде ляющей пространственную автокорреляцию в ваших данных. Создание матриц—уравнения для ординарного кригинга содер жатся в матрицах и векторах, которые зависят от пространст венной автокорреляции между опорными и искомыми точками. Значения автокорреляции могут быть получены из модели ва риограммы, описанной выше. Матрицы и векторы определяют веса кригинга, присваиваемые каждому измеренному значению. Выполнение интерполяции—на основе весов кригинга, вы мо жете вычислить предполагаемое значение в искомой точке с не известным значением. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 53 Проработка проблемы Представьте, что вы на местности измерили значения высоты в пяти точках исследуемого вами ландшафта. Эти опорные точки показаны на нижнем рисунке оранжевым цветом. Рядом с каж дой точкой даны ее координаты (X,Y). Y 5 (1,5) (4,5) 4 (3,4) 3 2 (1,3) Значения высот: в точке (1,5) высота = 100 в точке (3,4) высота = 105 в точке (1,3) высота = 1 (5,1) 105 в точке (4,5) высота = 1 2 3 4 5 X 100 в точке (5,1) высота = 115 Уравнения кригинга Для интерполяции значения в точке с координатами (1,4) (X = 1 и Y = 4), называемой искомая точка (желтая точка на рисун ке), вы воспользуетесь методом ординарного кригинга. Модель ординарного кригинга определяется формулой Z(s) = m + e(s) где s = (X,Y) положение точки; например, координаты одной из опорных точек s = (1,5), и Z(s) значение измеренной вели чины для данной точки; например, для данной точки Z(1,5) = 100. Модель основана на постоянном среднем m для данных (нет тренда) и случайных ошибках e(s) с пространст венной зависимостью. Предположим, что случайный процесс e(s) является внутренне стационарным. Эти допущения обсужда ются в следующих разделах. Интерполятор может быть получен как взвешенная сумма данных, N ∑ Z€(s0) = λiZ (si ) i =1 где Z(s ) измеренное значение в i ой точке, например, i Z(1,5) = 100; li неизвестный вес для измеренного значения в i ой точке; s0 координаты искомой точки, например, (1,4); и N = 5 число опорных точек. Формула аналогична формуле интерполяции по методу взве шенных расстояний (IDW). Однако, в методе IDW, вес l , зави i сит исключительно от расстояния до искомой точки. В ординар ном кригинге, вес l , зависит от вариограммы, то есть от рассто i яния до искомой точки, и от пространственных взаимосвязей между опорными точками, расположенными вокруг искомой точки. При выполнении интерполяции для нескольких точек, некото рые из искомых значений окажутся выше или ниже фактичес ких значений величин. В среднем, разность между проинтерпо лированными значениями и фактическими значениями должна быть равна нулю. Такое условие называется “условием несме щенности интерполятора”. Для гарантии того, что интерполя тор является несмещенным для неизвестного измерения, сумма весов l должна быть равна единице. Воспользовавшись этим ог i раничением, убедитесь, что разница между истинным значени ем, Z(s0), и интерполятором, Sl Z(s ), ii имеет наименьшее из воз можных значений. Это минимизирует статистическое ожида ние следующей формулы, на основе которой получаются урав ∑ ⎜⎛ ⎝ Z€(s0 ) − N i =1 λi Z (si ) ⎟⎞2 ⎠ 54 ARCGIS GEOSTATISTICAL ANALYST нения кригинга. Путем минимизации ожидания, в среднем, ин терполятор кригинга близок насколько это возможно, к неизве стному значению. Решение для минимизации, ограниченное ус ловием несмещенности, дает уравнения кригинга, Г ∗ л= g or ⎜⎛γ11 Λ γ1N 1⎟⎞ ⎜⎛ λ1 ⎟⎞ ⎜⎛ γ10 ⎟⎞ ⎜Μ Ο ⎜⎜⎜⎝γ1N1 Λ Λ Μ Μ⎟ γ NN 1 10⎟⎟⎟⎠ * ⎜ Μ⎟ ⎜⎜⎜⎝λmN ⎟ ⎟⎟⎠ = ⎜ Μ⎟ ⎜⎜⎜⎝γ1N0 ⎟ ⎟⎟⎠ Эти уравнения станут более понятными, когда в следующем раз деле вы подставите значения в матрицы. Помните, что цель со стоит в решении уравнений для всех l (весов), поэтому интер i полятор может быть образован с использованием SiliZ(si). Большинство элементов могут быть подставлены, если вам изве стна вариограмма. В нескольких последующих разделах вы уз наете, как рассчитать значения вариограммы. Гамма матрица G содержит смоделированные значения вариограммы для всех пар опорных точек, где g означает смоделированные значения ij вариограммы, основанные на расстоянии между двумя опорны ми точками, определенными как точки i ая и j ая. Вектор g со держит смоделированные значения вариограммы для каждой пары из опорной точки и искомой точкой, где gi0 обозначает смо делированные значения вариограммы, основанные на расстоя нии между i ой точкой и искомой точкой. Также оценивается неизвестное значение m в векторе l; оно растет из за условия несмещенности. Расчет эмпирической вариограммы Для расчета значений матрицы G мы должны изучить структуру данных путем создания эмпирической вариограммы. На варио грамме показаны значения половины квадрата разности для пар точек (откладывается по оси y) в зависимости от расстояния между ними (откладывается по оси x). Первый шаг в создании эмпирической вариограммы вычисле ние расстояния и квадрата разности между значениями для каж дой пары точек. Расстояние между двумя точками рассчитыва ется с использованием Эвклидова расстояния: dij = (xi − x j )2 + ( yi − y j )2 Эмпирическая дисперсия это половина квадрата разности 0.5 * среднее[(значение в точке i значение в точке j)2 ]. Locations Distance Cal. (1,5), (3, 4) sqrt[(1-3)2 + (5-4)2] (1,5),(1,3) sqrtp2 + 22] (1,5), (4, 5) (1,5),(5,1) sqrt[32 + O2] sqrt[42 + 42] (3, 4), (1,3) (3, 4), (4, sqrt[22 + 12] sqrt[12 + 12] (3, 4), (5,1) (1,3), (4, 5) sqrt[22 + 32] sqrt[32 + 22] (1,3),(5,1) sqrt[42 + 22] (4, 5), (5,1) sqrt[12 + 42] Distances Difference2 2.236 25 2 25 3 0 5.657 225 2.236 0 1.414 25 3.606 100 3.606 25 4.472 100 4.123 225 Semivariance 12.5 12.5 0 112.5 0 12.5 50 12.5 50 112.5 Как видите, для больших наборов данных (с большим количест вом измеренных опорных точек) число пар точек будет быстро расти и станет неуправляемым. Следовательно, вы можете сгруп пировать пары точек; такой процесс известен как бининг. В дан ном примере, бин это заданный диапазон расстояний. Это озна чает, что все точки, находящие на расстоянии от 0 до 1 сгруппи ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 55 рованы в первый бин, те точки, которые находятся на расстоя нии от 1 до 2 метров друг от друга сгруппированы во второй бин, и т.д. Берется средняя эмпирическая дисперсия для всех пар то чек. В нашем примере, данные распределены в пять бинов. Бининг эмпирической вариограммы Размер лага Расстояние межСр.расстояние1/2 дисперсии Среднее 1+-2 1.414, 2 1,707 12.5, 12.5 12,5 2+-3 2.236, 2.236, 3 2,491 12.5, 0, 0 4,167 3+-4 3.606, 3.606 3,606 50, 12.5 31,25 4+-5 4.472, 4.123 4,298 50, 112.5 81,25 5+ 5,657 5,657 112,5 112,5 Подбор модели Теперь вы можете отобразить на графике эмпирической вари ограмме среднюю дисперсию в зависимости от среднего рассто яния для бина. Но значения эмпирической вариограммы не мо гут быть использованы непосредственно в матрице G, поскольку вы можете получить отрицательные стандартные ошибки вы числений; вместо этого вы должны подобрать модель для эмпи рической вариограммы. После подбора модели, вы будете ис пользовать полученную модель для определения значений вари ограммы для различных расстояний. Для простоты, подобранная вами модель линия регрессии, по строения с использованием метода наименьших квадратов, име ющая положительный угловой коэффициент и проходящая че рез ноль. В модуль Geostatistical Analyst включено большее коли чество моделей, которые можно использовать для подбора. Формула для определения дисперсии для любого заданного рас стояния в нашем примере выглядит следующим образом: Дисперсия = Угловой коэффициент * Расстояние Угловой коэффициент определяет наклон подобранной прямой. Расстояние это расстояние между парами точек, оно обознача ется как h. В нашем примере, дисперсия для любого расстояния может быть определена по формуле: Дисперсия = 13.5*h Теперь создадим матрицу значений G. Например, значение g i2 для точек (1,5) и (3,4) в уравнении равно: Дисперсия = 13.5 * 2.236 = 30.19 (1, 5) (3, 4) (1, 3) (4, 5) (5, 1) Γ Матрица (Гамма) (1, 5) 0 30.19 27.0 40.5 76.37 1 (3, 4) 30.19 0 30.19 19.09 48.67 1 (1, 3) 27.0 30.19 0 48.67 60.37 1 (4, 5) 40.5 19.09 48.67 0 55.66 1 (5, 1) 76.37 48.67 60.37 55.66 0 1 1 1 1 1 1 0 В приведенном выше примере, для пары точек (1,5) и (3,4), величина лага была вычислена с использованием расстояния меж ду двумя точками (см. предыдущую таблицу). Значение варио граммы определяется путем умножения углового коэффициен та, равного 13.5, на расстояние. Единицы и нули в нижней стро ке и крайнем правом столбце определены в соответствии с усло вием несмещенности. 56 ARCGIS GEOSTATISTICAL ANALYST Формула значений матрицы для ординарного кригинга следую щая: G*l = g Теперь, когда построена матрица G, необходимо найти значе ния вектора l, содержащего значения весов, которые будут при своены измеренным значениям, находящимся вокруг искомой точки. Поэтому, выполним простую операцию из матричной ал гебры и получим следующую формулу: l =G1*g где G 1 обратная матрица G. Обратную матрицу G получаем, выполнив операцию линейной алгебры. Инверсия Γ Матрицы (Гамма) -0.02575 0.00704 0.0151 0.00704 -0.04584 0.01085 0.0151 0.01085 -0.02646 0.00664 0.02275 -0.00471 -0.00303 0.0052 0.00522 0.3424 -0.22768 0.17869 0.00664 0.02275 -0.00471 -0.02902 0.00433 0.28471 -0.00303 0.0052 0.00522 0.00433 -0.01173 0.42189 0.3424 -0.22768 0.17869 0.28471 0.42189 -41.701 Далее, для искомой точки строится вектор g. Например, рас смотрим точку (1,4). Вычисляем расстояние от точки (1,4) до каждой из точек с измеренными значениями (1,5), (3,4), (1,3), (4,5), и (5,1). Исходя из этих расстояний, определяем подоб ранную дисперсию по формуле Дисперсия = 13.5* h, выведен ной ранее. Вектор g для точки (1,4) приведен в следующей таб лице. Точка Расстояние g Вектор для (1,4) (1,5) 1 13.5 (3,4) 2 27.0 (1,3) 1 13.5 (4,5) 3.162 42.69 (5,1) 5 67.5 1 Y 5 (1,5) (4,5) 4 (1,4) (3,4) 3 (1,3) 2 1 (5,1) 1 2 3 4 5X Теперь, после того, как были созданы матрица G и вектор g, вычислим вектор весов кригинга: l = G 1 * g. Для этого, восполь зуемся линейной алгеброй. Веса приведены ниже в таблице. Выполнение интерполяции Теперь, когда у вас есть значения весов, умножьте вес каждого измеренного значения на это значение. Сложите результаты и получите искомое значение для точки (1,4). Веса 0.46757 0.09834 0.46982 -0.02113 -0.0146 -0.18281 Значения 100 105 105 100 115 Результат 46.757 10.3257 49.3311 -2.113 -1.679 102.6218 Кригинг Далее, изучите полученный результат. На следующем рисунке показаны веса (в скобках) точек с измеренными значениями, использованными для нахождения значений в искомой точке (1,4). ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 57 5 (0.46757) Значения: (-0.02113) 4 (1,5) = 102.50 (0.09834) 100 3 (0.46982) 2 (3,4) = 105 1 (-0.0146) (1,3) = 105 1 23 4 5 (4,5) = 100 (5,1) = 115 Как и ожидалось, веса уменьшаются с расстоянием, но такое уменьшение определено более точно, поскольку при присвое нии весов учитывалось не только расстояние между точками, но и пространственное распределение данных. Выполненная ин терполяция представляется достаточно достоверной. Дисперсия кригинга Одна из сильных сторон использования статистического подхода это возможность вычисления статистической меры ошибки интерполяции. Для этого необходимо умножить каждое значе ние вектора l на каждое значение вектора g и сложить их все вместе, чтобы получить значение, известное как дисперсия зна чений, полученных с использованием кригинга. Корень квад ратный из дисперсии кригинга носит название стандартной ошибки кригинга. В данном случае, стандартная ошибка кригинга равна 3.6386. Если принять, что ошибки подчиняются закону нормального распределения, 95 процентов интерполированных значений бу дут равны: Интерполятор Кригинга + 1.96*корень квадратный (из дис персии кригинга) Значение 1.96 получено на основе законов стандартного нор мального распределения, где 95 процентов вероятности попада ет в интервал от 1.96 до 1.96. Интервал проинтерполирован ного значения может быть интерпретирован следующим обра зом. Если интерполяция выполняется снова и снова по одной и той же модели, для длительного периода, в 95 процентах случа ев проинтерполированное значение будет равно значению в ис комой точке в пределах заданного интервала. В нашем приме ре, интервал интерполированного значения колеблется от 95.49 до 109.75 (102.62 + 1.96 * 3.64 ). G Вектор Веса (λ) 13.5 27.0 13.5 42.69 67.5 0.46757 0.09834 0.46982 -0.02113 -0.0146 1 -0.18281 Дисперсия Кригинга Стандартная ошибка кригинга g Вектор, Весовые коэффициенты 6.312195 2.65518 6.34257 -0.90204 -0.9855 -0.18281 13.2396 3.6386 58 ARCGIS GEOSTATISTICAL ANALYST Основные принципы, лежащие в основе методов геостатистики Случайные (вероятностные) процессы с зависимостью В отличие от детерминистских подходов к интерполяции, гео статистика предполагает, что все значения, полученные на изу чаемой территории, являются результатом случайного (стохас тического) процесса. Случайный процесс не означает, что собы тия независимы, как при каждом подбрасывании монеты. Гео статистика базируется на случайных процессах с зависимостью. Для примера, подбросьте три монеты и посмотрите, что выпало орел или решка. Не подбрасывайте четвертую монету. Прави ло, определяющее, как положить четвертую монету, заключа ется в том, что если вторая и третья монеты выпали решкой, положите четвертую монету так же, как выпала первая; в про тивном случае положите четвертую монету противоположно тому, как выпала первая монета. В пространственном или временном контексте, такая зависи мость носит название автокорреляции. Интерполяция для случайных процессов с зависимостью Какое все это имеет отношение к геостатистике и интерполиро ванию неизвестных значений? В примере с монеткой, мы опре делили правила зависимости. В действительности они неизвест ны. В геостатистике существует две ключевых задачи: (1) оты скать правила зависимости и (2) выполнить интерполяцию. Как видно из примера, интерполяция основана на том, что вначале должны быть выявлены правила зависимости. Кригинг базируется на тех же двух задачах: (1) определении функции вариограммы и ковариации (пространственной авто корреляция) и (2) интерполяции неизвестных значений. По скольку существуют две отдельные задачи, в геостатистике дан ные используются дважды: сначала для оценки пространствен ной автокорреляции, а затем для выполнения интерполяции. Понятие стационарности Снова рассмотрим пример с монетой. Для монет существует един ственное правило зависимости. Если у вас есть только один на бор измеренных значений, вы не сможете узнать правила зави симости, если не найдете их описание. Однако, при продолжаю щихся наблюдениях нескольких опорных точек, зависимости становятся более понятными. В целом, статистика полагается на некое понятие о репликации, которое предполагает, что на основе повторяющихся наблюдений может быть получена оцен ка, а также понята изменчивость и неопределенность оценки. В пространственных задачах, идея стационарности использует ся для получения необходимой репликации. Стационарность это предполагаемое свойство пространственных данных, исполь зование которого часто оправдано. Существует два типа стацио нарности. Один носит название средней стационарности. Пред полагается, что при этом типе стационарности среднее является постоянным для опорных точек и не зависит от их расположе ния. Второй тип стационарности носит название стационарности вто рого порядка для ковариации и внутренней стационарности для вариограмм. Стационарность второго порядка это предполо жение, что ковариация имеет одно и то же значение между дву мя точками, которые расположены на одном и том же расстоя нии и в одном и том же направлении, независимо от того, какие две точки вы выбираете. Ковариация зависит от расстояния между любыми двумя точками, а не от их взаимного расположе ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 59 ния. Для вариограмм, внутренняя стационарность это предпо ложение, что дисперсия разности имеет одно и то же значение для двух точек, расположенных на одном и том же расстоянии и в одном и том же направлении, независимо от того, какие две точки вы выбираете. Стационарность второго порядка и внутренняя стационарность предположения, используемые для получения необходимой репликации, позволяющей определить правила зависимости, на основе которых выполняется интерполяция и оценивается неопределенность полученных результатов. Обратите внимание, что репликация обеспечивается за счет использования прост ранственной информации (аналогичного расстояния между лю быми двумя точками). Пример с монетой является зависимым (первая и вторая монеты независимы, но первая и четвертая зависимы), таким образом этот случайный процесс не обладает стационарностью второго порядка. 60 ARCGIS GEOSTATISTICAL ANALYST Моделирование вариограммы В следующих разделах мы обсудим подробнее, как построить вариограмму. Предположив, что данные обладают свойством стационарности, можно изучить и количественно оценить авто корреляцию. В геостатистике этот процесс носит название про странственного моделирования, или структурного анализа (ва риографии). При пространственном моделировании вариограм мы, начните с графика эмпирической вариограммы, вычисляе мого по формуле, Вариограмма(расстояние h) = 0.5 * среднее [ (значение в точ ке i значение в точке j)2] для всех пар точек, удаленных на расстояние h. В формулу вхо дит вычисление половины квадрата разности между значения ми пар точек. Нанести быстро на график все пары точек стано вится нереальным. Вместо того, чтобы наносить на график каж дую пару точек, пары группируются в бины (классы) для опре деленных лагов (расстояний). Например, вычислите среднюю дисперсию для всех пар точек, расположенных далее, чем в 40 метрах, и ближе, чем 50 метрах, друг от друга. Эмпирическая вариограмма это график, на котором по оси y отложены ус редненные значения вариограммы, а по оси x расстояние (или лаг) (см. диаграмму). Снова обратите внимание на предположение о внутренней ста ционарности, которое позволит вам выполнить репликацию. Таким образом, возможно использовать “среднее” в формуле вариограммы, приведенной выше. После того, как вы создали эмпирическую вариограмму, вы мо жете провести через точки линию, описывающую модель эмпи рической вариограммы. Моделирование вариограммы аналогич но подбору линии по методу наименьших квадратов в регресси онном анализе. Выбирается некая функция, которая служит моделью, например, куполообразная кривая, поднимающаяся вначале и опускающаяся при увеличении расстояний между точ ками , если они превышают определенное значение. Основная цель вычисление параметров кривой, минимизиру ющей отклонение от точек в соответствии с определенным кри терием. Вы можете выбирать из большого количества моделей вариограммы. Для получения более подробной информации и рекомендаций по выбору моделей, обратитесь к Главе 7. А сей час мы детально рассмотрим каждый из этапов моделирования вариограммы. Построение эмпирической вариограммы Для создания эмпирической вариограммы необходимо вычис лить квадрат разности между значениями для всех пар опорных точек. Если вы нанесете эти значения на график, отложив по оси y половину квадрата разности, а по оси x расстояние, на кото рое отстоят опорные точки, вы получите диаграмму, которая носит название облака вариограммы. На нижнем рисунке пока заны пары одной из опорных точек (которая показана красным цветом) с 11 другими опорными точками. Одна из основных целей вариографии изучение и количествен ная оценка пространственной зависимости, которая также но сит название пространственной автокорреляции. Пространст венная автокорреляция количественно оценивает предположе ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 61 ние, что объекты, расположенные ближе друг к другу, более похожи чем удаленные друг от друга. Таким образом, пары опор ных точек, которые расположены ближе (на облаке вариограм мы это точки, расположенные в начале оси x) будут иметь сход ные значения (низкие значения на оси y облака вариограммы). Поскольку пары опорных точек становятся удаленными на все большее расстояние (движение вправо по оси x облака варио граммы), точки должны становиться более непохожими и иметь более высокое значение квадрата разности (увеличение значе ний по оси y облака вариограммы). Бининг (группировка значений) эмпирической вариограммы Как вы видите из рисунка на предыдущей странице, на котором показано расположение точек в ландшафте, и из облака варио граммы на верхнем рисунке, задача нанесения на график каждой пары опорных точек трудновыполнима из за большого объема данных. Большое количество точек на графике делает его пере груженным, и вы не можете адекватно интерпретировать его. Чтобы сократить количество точек на эмпирической вариограм ме, пары опорных точек должны быть сгруппированы на основе их удаленности друг от друга. Этот процесс группировки значе ний известен, как бининг. Бининг это двухстадийный процесс. Во первых, формируются пары точек, а во вторых, эти пары группируются таким образом, чтобы точки были удалены на одинаковое расстояние и распола гались в одинаковом направлении. На изображении ландшафта с 12 опорными точками, вы видите, как подобраны пары для одной опорной точки, показанной красным цветом. Одинаковым цве том соединяющих отрезков показаны пары со сходными бинами. Этот процесс продолжается для всех возможных пар точек. Как вы можете заметить, в процессе образования пар, число пар 62 ARCGIS GEOSTATISTICAL ANALYST На втором этапе процесса бининга, пары группируются на осно ве аналогичных расстояний и направлений. Представьте такой график, на котором каждая точка имела бы одно и то же начало координат. Это свойство делает эмпирическую вариограмму сим метричной. Всегда откладывайте связующие отрезки справа от вертикальной оси. 1 2 быстро увеличивается с добавлением каждой новой опорной точ ки. Поэтому для каждого бина на графике облака вариограммы среднее значение расстояния и дисперсии для всех пар этого бина отображается одной точкой . На рисунке внизу показаны все возможные парные связи между всеми 12 опорными точками. Точки развернуты таким образом, чтобы север был вверху. 3 4 1 2 4 3 Вы видите, что связующие отрезки 1 и 2 имеют приблизительно одно и то же расстояние и направление. Каждая ячейка грида образует бин. Связующие отрезки 1 и 2 попадают в один и тот же бин, показанный желтым цветом. Для связующего отрезка 1 найдите квадрат разности значений двух связанных опорных точек, и то же самое проделайте для связующего отрезка 2. За тем найдите их среднее и умножьте его на 0.5, чтобы получить одно значение эмпирической вариограммы для бина. Выполните эту операцию для другого бина, показанного зеле ным цветом, со связующими отрезками 3 и 4. Чтобы упростить понимание, показаны только четыре связи, но конечно же, их гораздо больше. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 63 Для каждого бина определяется квадрат разности значений для всех пар связываемых опорных точек, затем вычисляется сред нее значение, оно умножается на 0.5, и мы получаем одно значе ние вариограммы для бина. В модуле Geostatistical Analyst вы можете контролировать размер лага и число бинов. Значение эмпирической вариограммы для каждого бина обозначается цве том, полученное изображение носит название поверхности ва риограммы. Бин Центр поверхности вариограммы На верхнем рисунке показаны семь бинов по горизонтали и по вертикали от центра поверхности вариограммы. Для бинов “хо лодные” цвета (синие и зеленые) обозначают низкие значения, а “теплые” цвета (красный и оранжевый) обозначают высокие значения. Как видите, в целом, значения эмпирической варио граммы увеличиваются по мере удаления бинов от центра. Это означает, что значения сильнее различаются с увеличением рас стояния. Также обратите внимание на симметрию, описанную ранее. В модуле Geostatistical Analyst можно также построить график эмпирической вариограммы. На графике, приведенном выше, значение эмпирической вари ограммы для каждого бина для каждого направления показано красной точкой (по оси y отложены значения эмпирической ва риограммы, а по оси x расстояние от центра бина до начала координат (центра поверхности вариограммы)). Цветовая шка ла справа от графика соответствует цветам на поверхности ва риограммы. После выполнения бининга и усреднения значений облака вариограммы, становится более очевидным, что разли чия увеличиваются с расстоянием. Желтая линия на верхнем рисунке это подобранная модель вариограммы, которую мы будем обсуждать далее. 64 ARCGIS GEOSTATISTICAL ANALYST Альтернативный метод, часто используемый для группировки пар в бины, основан на использовании радиальных секторов (см. рисунок). В модуле Geostatistical Analyst этот метод не использу ется. 1 2 Точки в бинах это пары опорных точек, отстоящих друг от друга на определенное расстояние и в определенном направле нии. Вы можете изучать бининг по направлениям, либо ограни чив пары точек, которые будут нанесены на график в процессе группировки значений, либо исследуя только ту часть диаграм мы для всех пар точек, которая относится к одному направле нию. На рисунке внизу показан бининг по направлению 90 гра дусов, с шириной полосы пять метров, угловым допуском в 45 градусов, и величиной лага в пять метров от опорной точки, показанной голубым цветом. Ширина полосы 4 3 Эмпирические вариограммы для различных направлений Иногда значения измеренных опорных точек будут содержать составляющую, отражающую влияние по направлениям, кото рое может быть статистически определено, но не всегда это влияние можно объяснить каким либо определенным процес сом. Такое направленное влияние известно как анизотропия. Угловой допуск задает угол, определяющий ширину полосы за хвата, в которую попадут или не попадут близлежащие точки. Ширина полосы устанавливает диапазон поиска соседних точек и то, какие пары точек будут нанесены на график вариограммы. Величина лага Поиск по направлению продолжается для каждой опорной точ ки и для каждого направления на поверхности. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 65 На рисунке на этой странице показан бининг по направлению для трех точек. Обратите внимание, что в процесс группировки будет включено меньшее количество пар опорных точек, чем для вариограммы для всех направлений, приведенной в преды дущем примере. Пары затем формируются в бины в соответствии с одинаковой удаленностью и отстоянием в одинаковом направлении, бины усредняются, и среднее значение для пар каждого бина нано сится на вариограмму. Или же, выполнив бининг по методу грида, описанному ранее, вы можете сформировать в бины все пары, а затем создавать поднаборы по направлениям, как показано на следующем ри сунке. Бин будет нанесен на график облака вариограммы, если центр ячейки на поверхности вариограммы включен в направ ление поиска. Выбор размера лага Выбор размера лага оказывает важное влияние на вид эмпири ческой вариограммы. К примеру, если размер лага слишком ве лик, автокорреляция на микроуровне может не проявиться на графике. Если размер лага слишком мал, может быть сформи ровано много пустых бинов, и количество включенных в бин опорных точек может быть слишком мало для получения репре зентативных “средних значений” для бина. Когда опорные точки расположены по регулярной сетке, раз мер ячейки грида обычно служит хорошим индикатором разме ра лага. Однако, если данные получены с использованием нере гулярной или случайной схемы опорных точек, выбор подходя щего размера лага является не столь очевидным. Правило боль шого пальца состоит в том, что произведение размера лага на количество лагов должно равняться примерно половине макси мального расстояния между парами точек. Кроме того, если ра диус влияния подобранной модели вариограммы очень мал от носительно области отображения эмпирической вариограммы, вы можете уменьшить размер лага. Напротив, если радиус вли яния подобранной модели вариограммы большой (по сравне нию с областью отображения эмпирической вариограммы), вы можете увеличить размер лага. Далее будут рассмотрены моде ли вариограммы . 66 ARCGIS GEOSTATISTICAL ANALYST Подбор модели для эмпирической вариограммы Моделирование вариограммы/ковариации ключевой шаг между пространственным описанием и пространственным интерполиро ванием. В предыдущих разделах было рассказано, как подобрать модель вариограммы и как она используется в уравнениях кригин га (гамма матрица, G и вектор g). Главное применение геостатис тики интерполирование значений атрибутов в искомых точках (кригинг). Итак, вы узнали, как эмпирическая вариограмма и ковариация предоставляют информацию о пространственной автокорреляции наборов данных. Однако, такая информация может быть получена не для всех возможных направлений и расстояний. По этой причи не и для того, чтобы убедиться, что интерполяция по методу кри гинга имеет положительные дисперсии, необходимо подобрать мо дель (т.е. непрерывную функцию или кривую) для эмпирической вариограммы/ковариации. Теоретически, эта операция аналогична регрессионному анализу, при котором подбирается непрерывная линия или кривая. Различные типы моделей вариограммы В модуле Geostatistical Analyst предусмотрены следующие функции для моделирования эмпирической вариограммы: Круговая, Сфе рическая, Тетрасферическая, Пентасферическая, Экспоненциаль ная, Гауссова, Рациональная квадратическая, Эффекта дыры, K Бесселя, J Бесселя и Устойчивая. Выбираемая вами модель влияет на получаемые результаты, особенно в том случае, если сильно раз личается форма кривой около начала координат. Чем круче кривая у начала координат, тем большее влияние на искомый результат оказывают ближайшие соседи (опорные точки). В итоге результирующая поверхность будет менее гладкой. Каж дая модель разработана с учетом возможности наиболее точного подбора в зависимости от типа изучаемого явления. На диаграмме на этой странице показаны две часто используе мые модели и то, как различаются эти две функции: • Сферическая модель Эта модель показывает постепенное уменьшение пространст венной автокорреляции (соответственно, увеличение диспер сии) до некоторого расстояния, за пределами которого автокор реляция равна нулю. Сферическая модель одна из наиболее часто используемых моделей. • Экспоненциальная модель Эта модель применима, когда пространственная автокорреля ция уменьшается по экспоненте с уменьшением расстояния между точками, исчезая полностью только при удалении точек друг от друга на бесконечное расстояние. Экспоненциальная модель также используется довольно часто. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 67 Понимание вариограммы — радиус влияния, порог и самородок Как уже упоминалось, вариограмма отражает пространствен ную автокорреляцию опорных точек. После того, как каждая пара точек (после бининга) нанесена на график, необходимо подобрать модель вариограммы. Для описания таких моделей часто используются определенные параметры. Радиус влияния и порог Если вы посмотрите на модель вариограммы, вы заметите, что при определенном расстоянии кривая, описывающая модель, выравнивается. Расстояние, при котором модель начинает вы равниваться, называется радиусом влияния. Опорные точки, отстоящие друг от друга на расстояние, меньшее, чем радиус влияния, пространственно коррелируют, в то время как точки, отстоящие друг от друга на расстояние, большее, чем радиус влияния, нет. Значение, которое модель вариограммы, принимает в точке ра диуса влияния (значение по оси y) носит название “порога”. Частичный порог это значение порога, из которого вычтено значение самородка. Самородок Теоретически, если расстояние между точками равно нулю (т.е., лаг = 0), значение вариограммы также должно быть равно нулю. Однако, при бесконечно малых расстояниях, разница между из мерениями зачастую не стремится к нулю. Этот факт носит на звание эффекта самородка. Например, если модель вариограммы пересекает ось y в точке 2, самородок равен 2. Эффект самородка может быть отнесен за счет ошибок измере ний или пространственных составляющих дисперсии на рассто яниях меньших, чем интервал выборки (или за счет обоих явле ний). Ошибка измерений возникает вследствие ошибок, прису щих измерительным приборам. Природные явления могут про странственно варьировать в зависимости от масштаба наблюде ний. Вариация на микроуровне меньше, чем те значения рас стояний между опорными точками, которые появятся при вы числении значения самородка. Перед сбором данных важно по лучить некое представление о том, как пространственная вари ация будет проявляться на разных масштабных уровнях. Порог Самородок 68 Радиус влияния ARCGIS GEOSTATISTICAL ANALYST Учет влияний по направлениям—тренд и анизотропия Существует два типа направленных составляющих, которые могут оказывать влияние на интерполирование результирующей поверх ности: глобальные тренды и влияния по направлениям, проявляю щиеся на вариограмме/ковариации (и известные как анизотро пия). Глобальный тренд это доминирующий процесс, который оказывает детерминистское влияние на все измерения. Глобаль ный тренд может быть представлен математической формулой (на пример, полиномом) и вычтен из анализа значений в опорных точ ках, а затем вновь добавлен перед выполнением интерполяции. Этот процесс носит название “вычитание (или удаление) тренда” (см. Главу 7, ‘Использование аналитических инструментов при по строении поверхностей’). Глобальный тренд может быть рассмотрен на примере влияния преобладающих ветров на шлейф от дымовой трубы фабрики (ри сунок справа). На рисунке самые высокие концентрации загряз няющих веществ показаны теплыми цветами (красными и желты ми), а более низкие концентрации холодными цветами (зелены ми и синими). Обратите внимание, что значения загрязнения в направлении восток запад меняются медленнее, чем в направле нии север юг. Это происходит из за того, что преобладающий ве тер дует в направлении с запада на восток, в то время, как направ ление юг север перпендикулярно направлению ветра. Форма кривой модели вариограммы/ковариации может также меняться в зависимости от направления (анизотропия), если вы вычли глобальный тренд из данных, или если тренда в данных нет. Анизотропия отличается от глобального тренда, рассмотренного выше, поскольку глобальный тренд может быть соотнесен с каким либо физическим процессом (в предыдущем примере, преобладаю щим ветром) и описан математической формулой. Причина анизо тропии (влияния по направлениям) на вариограмме, как правило, не известна, поэтому моделируется как случайная погрешность. Но даже без знания причины анизотропии, ее можно оценить количе ственно и учесть при выполнении интерполяции. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 69 Анизотропия, это, как правило, не детерминистский процесс, который может быть описан единой математической формулой. У нее нет единого источника, и она не имеет предсказуемого влияния на все измеренные значения. Анизотропия это харак теристика случайного процесса, который показывает, что про странственная автокорреляция сильнее проявляется в одном направлении, чем во всех остальных. На следующем рисунке проиллюстрировано, как процесс должен выглядеть теоретиче ски. Снова более высокие концентрации загрязнения показаны теплыми цветами (красными и желтыми оттенками), а более низкие значения концентрации холодными цветами (зеленым и синим). Случайный процесс показывает колебания, которые в одном направлении короче, чем в другом. Эти колебания могут быть результатом некоего неизвестного или неизмеренного фи зического процесса, но моделируются как случайный (стохасти ческий) процесс с автокорреляцией в одном направлении. Поскольку в данном примере присутствует анизотропия, после построения эмпирической вариограммы можно увидеть, что пространственные отношения различны для двух направлений. В направлении север юг форма кривой вариограммы растет перед выравниванием быстрее. Дисперсия 1 3 5 7 9 1 1 1 3 1 5 0.04 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 Переменная A Восток-Запад Север-Юг Лаг (м) При анизотропии форма кривой вариограммы может меняться в зависимости от направления. Изотропия это случай, когда вид вариограммы не зависит от направления. 70 ARCGIS GEOSTATISTICAL ANALYST Комбинирование моделей вариограммы Часто существует два (или более двух) процесса, которые будут диктовать пространственное распределение какого либо явле ния. Например, количество растительности (биомасса) может зависеть от высоты рельефа и от влажности почвы. Если такая зависимость известна, для интерполирования значений биомас сы можно воспользоваться кокригингом. Вы можете использо вать измеренные значения величины биомассы, в качестве пер вого набора данных, значения высот рельефа, в качестве второ го набора данных, и значения величины влажности почвы, в качестве третьего набора данных (см. Главу 6, ‘Построение по верхности с использованием методов геостатистики’). Для каж дого из наборов данных вы можете подобрать различные модели вариограммы, поскольку они отражают различные пространст венные структуры. Так для набора данных с высотами рельефа может лучше всего подойти сферическая модель, для набора дан ных со значениями влажности почвы экспоненциальная мо дель, а для набора данных по биомассе сочетание моделей. Модели могут быть затем скомбинированы, чтобы наилучшим образом охарактеризовать структуру данных. Однако, иногда вам неизвестны принчинно следственные отно шения факторов, определяющих пространственную структуру Дисперсия 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 2 4 6 8 10 Лаг (м) какого либо явления. Если воспользоваться тем же примером с биомассой, то может случиться так, что у вас есть только опор ные точки, в которых измерены значения величины биомассы. Когда вы изучите вариограмму, вы обратите внимание на точки перегиба. Точки быстро растут, затем выравниваются, а затем снова обра зуют перегиб, после которого выравнивание идет до значения порога. Вы можете предположить, что в данных существуют две различные структуры, которые нельзя описать единой моделью. Вы можете подобрать модель вариограммы, используя две отли чающиеся модели (например, сферическую и экспоненциаль ную), а затем скомбинировать их в единую модель. Представление двух очевидных случайных процессов на одной вариограмме не рекомендуется; если это возможно, следует раз делить пространственные процессы. Однако, не всегда можно понять причинно следственные связи. Выбор нескольких моде лей позволяет добавить большее количество параметров для оцен ки. При этом подбор моделей является субъективным и выпол няется “на глаз”. Количественно оценить правильность подбора комбинации из моделей вы можете, воспользовавшись методами перекрестной проверки и изучив статистику такой проверки (см. Главу 7, ‘Использование аналитических инструментов при построении поверхностей’). Модуль Geostatistical Analyst позволяет выбрать до трех моделей помимо модели с учетом эффекта самородка. В приведенном выше примере, модель скомбинирована из трех компонентов: модели с учетом эффекта самородка и двух сферических моде лей с различными радиусами влияния. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 71 Использование модуля Geostatistical Analyst для подбора модели вариограммы Пример, приведенный ранее в этой главе, был упрощен для об легчения понимания. Чтобы продемонстрировать понятие мо делирования вариограммы, мы воспользуемся большим количе ством опорных точек. Из измеренных значений высот рельефа было отобрано десять опорных точек. Номер точки 1 2 3 4 5 6 7 8 9 10 Координата X 1 1 1 3 3 4 5 6 6 7 Координата Y 3 5 6 4 6 5 1 3 6 1 Значение 105 100 95 105 105 100 115 120 110 120 В данном примере мы будем интерполировать пока неизвестное значение высоты для точки с координатами x = 2.75, y = 2.75 (на рисунке справа точка обозначена желтым цветом). Пространственное распределение опорных точек, их значения и искомая точка показаны в документе ArcMap, изображение которого приведено ниже. На первых двух панелях Мастера операций геостатистики, вы определяете набор данных, поле, значение которого вы интер полируете, и метод кригинга (в данном примере будет использо ван метод ординарного кригинга). Третья панель содержит ди алог моделирования вариограммы. На этом этапе наша цель со стоит в том, чтобы подобрать модель для эмпирической варио граммы. На рисунке на стр. 73 приведен список возможных моделей. В предыдущем примере для подбора была использова на простая прямая линия, но как вы видите, существует и много других возможностей. Каждая из моделей несколько отличается одна от другой, поэтому у вас есть возможность выбрать лучшую. Более подробную информацию по используемым моделям вы можете найти в Главе 7, ‘Использование аналитических инстру ментов при построении поверхностей’. 72 ARCGIS GEOSTATISTICAL ANALYST В данном примере для описания эмпирической вариограммы будет применена сферическая модель. Далее приведена форму ла сферической модели. Как видите, эта формула более слож ная, чем для прямой линии, использованной в предыдущем при мере в этой главе. Однако, обе формулы служат одной и той же цели, но с разными результатами. γ (h) = ⎧ ⎪θ ⎨ ⎪ s ⎡ ⎢ ⎢⎣ 3 2 h θr ⎩ − 1 2 ⎜⎜⎝⎛ h θr θs ⎟⎟⎠⎞3 ⎤ ⎥ ⎥⎦ for for 0 ≤ h ≤θr θr < h где q значение порога, s h вектор лага, а h длина h (расстояние между двумя опор ными точками), qr радиус влияния модели. Обратите внимание, что параметры сферической модели даны в нижнем левом углу диалога синими буквами. Это означает, что сферическая модель используется со значением порога, равным 86.1, радиусом влияния 6.96, и нулевым самородком. Следова тельно, вычисленные с помощью сферической модели значения вариограммы будут равны: g(h) = 86.1*(1.5*(h/6.96) 0.5(h/6.96)3), для всех значений лага Ј 6.96 и g(h) = 86.1, для всех значений лага >6.96 Это аналогично нахождению значения вариограммы для задан ного расстояния, h, по подобранной линии в нашем предыдущем примере; поскольку линия была подобрана, по этой линии опре делялись значения для матрицы и векторов из уравнения орди нарного кригинга. В данном случае то же самое может быть проделано с использованием подобранной сферической модели. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 73 Кригинг Как и при выполнении интерполяции по методу взвешенных расстояний (IDW), при кригинге формируются веса для изме ренных значений, находящихся в окрестностях искомой точки, которые используются при интерполировании ее значения. Как и в случае с интерполяцией по методу взвешенных расстояний, ближайшие опорные точки будут иметь большее влияние. Одна ко, веса кригинга для окружающих искомую точку опорных то чек будут присваиваться более сложным и обоснованным спосо бом, чем при методе взвешенных расстояний IDW. Метод взве шенных расстояний использует простой алгоритм, основанный на расстоянии, а веса кригинга вычисляются на основе значений вариограммы, учитывающей пространственную структуру дан ных. Для создания непрерывной поверхности или карты явле ния, для точек на изучаемой территории интерполяция выпол няется с использованием вариограммы и с учетом пространст венной организации опорных точек, расположенных в окрест ностях искомой точки. Поиск соседства Можно предположить, что при удалении опорных точек от ис комой точки, измеренные значения будут меньше пространст венно коррелировать с искомой точкой. Таким образом, при по иске соседства можно исключить точки, которые удалены от ис комой точки на большое расстояние и оказывают на нее неболь шое влияние. Но при удалении точек друг от друга, они не толь ко меньше связаны между собой, существует вероятность того, что точки, расположенные на значительном расстоянии от иско мой, могут исказить результат в том случае, если они расположе ны на территории, сильно отличающейся от той, где находится искомая точка. Другая причина для использования области по иска соседства скорость вычислений. Вспомните, как в первом примере мы находили обратную матрицу для матрицы разме ром 5x5. Если бы у вас было 2 000 опорных точек, такая матри ца была бы слишком велика для нахождения обратной матри цы. Чем меньше область поиска соседства, тем быстрее может быть выполнена интерполяция. Поэтому обычно ограничивают число точек, используемых при интерполировании, путем опре деления области поиска соседей. Заданная форма для поиска соседей ограничивает дальность по иска опорных точек, которые будут использованы в вычислени ях, и его направление. Другие параметры поиска соседства ог раничивают точки, которые будут использованы внутри задан ной области. Форма области поиска соседства зависит от исходных данных и от поверхности, которую вы хотите построить. Если простран ственная автокорреляция ваших данных не испытывает влия ний по направлениям, вы захотите учитывать опорные точки равномерно во всех направлениях. Поэтому вы, возможно, вы берите круг в качестве формы области поиска. Однако, если в ваших данных присутствует пространственная автокорреляция по направлениям, вы можете выбрать в качестве формы облас ти поиска соседства эллипс, большая ось которого параллельна направлению автокорреляции. Область для поиска соседства может быть задана в шаге 3 Масте ра операций геостатистики. После того, как вы определили об ласть поиска соседства, вы можете ограничить выбор используе мых опорных точек. Вы можете задать максимальное и мини мальное количество соседей, которые будут включены в анализ. Вы можете также разделить область соседства на сектора с тем, чтобы убедиться, что вы используете значения во всех направле ниях. Если вы разделите область соседства на сектора, заданное максимальное и минимальное количество соседей будет приме нимо к каждому сектору. 74 ARCGIS GEOSTATISTICAL ANALYST Может быть использовано несколько различных типов секторов (см. рисунок внизу). Один сектор Восемь секторов Эллипс с четырьмя секторами Используя конфигурацию данных в заданной области соседства, в сочетании с подобранной моделью вариограммы, можно опре делить веса опорных точек. На основе этих весов и значений опорных точек, можно выполнить интерполяцию неизвестного значения в искомой точке. Чтобы построить модель непрерыв ной поверхности, процесс необходимо повторить для каждой точки пространства. Построение поверхности проинтерполированных значений с использованием области поиска соседства По мере того, как ваши наборы данных становятся больше и покрывают все большую территорию, вы захотите ограничить число опорных точек, учитываемых при выполнении интерпо ляции. Если вы учитываете в вычислениях точки, удаленные от искомой на значительное расстояние, нужно принимать во вни мание то, что они могут находиться на территории, сильно отли чающейся от той, где расположена искомая точка. Вам необхо димо учесть при расчетах количество точек, достаточное для формирования репрезентативной выборки, и исключить точки, удаленные от искомой на большое расстояние, поскольку они могут оказывать на нее очень маленькое влияние или находить ся в области, сильно отличающейся от той территории, где рас положена искомая точка (см. рисунок). В диалоге, приведен ном на рисунке, в качестве области поиска соседства задан круг с радиусом 3, а максимальное число учитываемых соседей равно Число включаемых соседей = 5 Стратегия поиска: круг с четырьмя квадрантами Радиус = 3 Координаты тестовой точки (x=2.75, y=2.75) Точки, которые Веса будут использованы Проинтерполированное значение= 107.59 5. Точки, используемые для интерполирования неизвестного зна чения в искомой точке (2.75, 2.75), выделены на рисунке, и им присвоены цвета (в зависимости от процентного соотношения коэффициентов l i). В область соседства включены следующие Номер точки области соседства 1 2 3 4 5 Исзодный номер точки 1 2 4 6 7 Координата Координата y Значение x 1 3 105 1 5 100 3 4 105 4 5 100 5 1 115 ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 75 точки: Вычисленное значение для искомой точки (x = 2.75, y = 2.75) равно 107.59. Модуль Geostatistical Analyst выполнил интерпо ляцию, решив уравнения ординарного кригинга. G* l = g и решив уравнение для весов l = G 1 * g С помощью сферической модели вариограммы и упорядоченно го набора измеренных значений, определенных через поиск со седства, можно найти значения l из приведенного выше уравне ния. Сначала создадим матрицу G. Это можно сделать, вычислив расстояния между парами точек и подставив эти значения в урав нение подобранной сферической модели, g(h) = 86.1*(1.5*(h/6.96) 0.5(h/6.96)3), для 0 < h < 6.96 Расстояния между опорными точками равны: Точки Расстояние Точки Расстояние 1,2 2.000 2,4 3.000 1,3 2.236 2,5 5.657 1,4 3.605 3,4 1.414 1,5 4.472 3,5 3.606 2,3 2.236 4,5 4.124 Если подставить расстояние (h) между точками 1 и 3 h = 2.236, значение вариограммы равно: g(h) = 86.1*(1.5*(2.236/6.96) 0.5(2.236/6.96)3) = 40.065 Чтобы получить матрицу G, повторите эту операцию для каж дой пары точек. Чтобы сделать запись более понятной, точкам были присвоены другие номера (как показано в таблице на пре дыдущей странице). i 1 2 3 4 5 6 1 0.000 36.091 40.065 60.920 71.564 1.000 2 36.091 0.000 40.065 52.221 81.855 1.000 3 40.065 40.065 0.0000 25.881 60.920 1.000 4 60.920 52.221 25.881 0.000 67.559 1.000 5 71.564 81.855 60.920 67.559 0.000 1.000 6 1.000 1.000 1.000 1.000 1.000 0.000 Затем найдем обратную матрицу G 1. i 1 2 3 4 1 -0.0191 0.01005 0.00776 -0.0021 2 0.01005 -0.0187 0.00472 0.00402 3 0.00776 0.00472 -0.0317 0.01619 4 -0.0021 0.00402 0.01619 -0.0214 5 0.00336 -0.0001 0.00304 0.00324 6 0.2114 0.24891 -0.1038 0.27739 5 0.00336 -0.0001 0.00304 0.00324 -0.0095 0.36607 6 0.2114 0.24891 -0.1038 0.27739 0.36607 -47.922 Теперь для решения уравнения ординарного кригинга, l = G 1* g, необходимо создать вектор g. Для этого, вычислите расстояние от каждой из пяти опорных точек до искомой точки (2.75, 2.75). Расстояния равны: Из точки x = 2.75, y = 2.75 Точки Расстояние 1 1.768 2 2.850 3 1.275 4 2.574 5 2.850 76 ARCGIS GEOSTATISTICAL ANALYST Вектор g можно создать, подставив значение каждого расстоя ния в уравнение подобранной сферической модели. Из точки x = 2.75, y = 2.75 Точки Дисперсия, полученная по модели 1 32.097 2 49.936 3 23.390 4 45.584 5 49.936 6 1.000 Дополнительный столбец в векторе g (и дополнительные строка и столбец в матрице) были добавлены для того, чтобы сумма весов была равна 1 (т.е., был использован множитель Лагран жа, определение и содержание которого даны в Приложении A). Теперь найдем веса для вектора l. Приведем пример нахожде ния значения веса для точки 1: l = ( 0.019*32.097 + 0.01005*49.936 + 0.00776*23.390 1 0.0021*45.584 + 0.00336*49.936 + 0.2114*1.000) = 0.355 Веса всех точек и множителя Лагранжа (точка 6) равны: Точки 1 l i 0.355 2 0.073 3 0.529 4 0.022 5 0.211 6 0.210 Наконец, найдем значение в искомой точке (2.75, 2.75), умно жив веса измеренных точек (за исключением точки 6) на их значение и сложив их между собой. Искомое значение = 0.355 * 105 – 0.073 * 100 + 0.529 * 105 0.022 * 100 + 0.211 * 115 Искомое значение = 107.59 i λi Значениеi 1 0.355 105 2 -0.073 100 3 0.529 105 4 -0.022 100 5 0.211 115 Повторение этого процесса для нескольких искомых точек и нанесение результатов на карту позволяет построить поверх ность, показанную на рисунке внизу. Результирующие поверхности могут быть построены с исполь зованием модуля Geostatistical Analyst в целом ряде форматов, включая шейп файл с изолиниями, шейп файл с полигонами с заливкой, грид, представляющий непрерывную поверхность, и отмывку. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 77 Модуль Geostatistical Analyst В этом последнем разделе, вы получите дополнительную инфор мацию о модуле Geostatistical Analyst, как о расширении к ArcMap. Доступ к модулю можно получить из меню Geostatistical Analyst на панели инструментов ArcMap. В модуль Geostatistical Analyst включены три основных компонента: (1) Исследование дан ных, (2) Мастер операций геостатистики и (3) Создание подна боров. Исследование данных Перед тем как воспользоваться методами интерполяции, вы можете исследовать свои данные с помощью инструментов ис следовательского анализа пространственных данных (ESDA). Инструменты ESDA помогут вам понять сущность ваших дан ных и выбрать соответствующие параметры для модели интер поляции. Например, при использовании ординарного кригинга для создания карты квантилей, вам необходимо изучить распре деление данных, поскольку для этого метода необходимо, чтобы данные подчинялись закону нормального распределения. Кро ме этого, вы можете исследовать данные с помощью инструмен тов ESDA на наличие тренда, а также не учитывать тренд в про цессе интерполяции. При работе с модулем вы можете использовать следующие инст рументы: • Гистограмма—Исследование одномерного распределения набора данных. • Карта Вороного—Анализ стационарности и пространствен ной изменчивости набора данных. • Нормальный график КК (Квантиль квантиль)—Проверка нормальности распределения данных. • Анализ тренда—Определение глобальных трендов в наборе данных. • Облако вариограммы/ковариации—Анализ пространствен ных зависимостей в наборе данных. • Общий график КК (Квантиль квантиль)—Исследование того, имеют ли два набора данных одно и то же распределе ние. • Облако взаимной ковариации—Понимание взаимной кова риации между двумя наборами данных. Мастер операций геостатистики Модуль Geostatistical Analyst предоставляет целый ряд методов интерполяции, которые используют опорные точки для постро ения поверхности изучаемого явления. Методы интерполяции в модуле Geostatistical Analyst разделены на два основных типа: детерминистские и геостатистические. Детерминистские Детерминистские методы основаны на параметрах, которые контролируют либо (i) область распространения сходных зна чений (например, метод взвешенных расстояний Inverse Distance Weighted) или (ii) степень сглаживания поверхности (например, радиальные базисные функции). Эти методы не ис пользуют модель стохастических пространственных процессов. Геостатистика Геостатистика предполагает, что хотя бы часть пространствен ной неоднородности природных явлений может быть смодели рована вероятностными процессами с пространственной авто корреляцией. Методы геостатистики можно использовать для: • Описания и моделирования пространственных структур — вариография. • Интерполирования значений в точках, не имеющих изме ренных значений—кригинг. • Оценки неопределенности, связанной с интерполяцией зна чений в искомой точке—кригинг. 78 ARCGIS GEOSTATISTICAL ANALYST Кригинг может быть использован для построения следующих поверхностей: • Карты проинтерполированных значений, полученных на ос нове кригинга • Карты стандартных ошибок, связанных с вычисленными зна чениями • Карты вероятности, показывающие, был ли превышен за данный критический уровень • Карты квантилей для предварительно заданных значений ве роятности Создание поднаборов данных Наиболее точный способ оценить качество результирующей по верхности сравнить полученные при выполнении интерполя ции значения с полевыми измерениями. Часто нет возможности вернуться в изучаемый район, чтобы получить независимый на бор данных, который можно будет использовать для проверки. Одно из решений состоит в разделении исходного набора данных на две части. Одна часть может быть использована для модели рования пространственной структуры и построения поверхнос ти. Другая часть может быть использована для сравнения и про верки качества интерполяции. Диалог Создать поднаборы дан ных позволяет вам создавать и тестовый, и учебный набор дан ных. Обработка данных Модуль содержит много инструментов для анализа данных и построения целого ряда результирующих поверхностей. Хотя цели исследования могут отличаться, при анализе/карто графировании пространственных процессов мы рекомендуем придерживаться следующего подхода: Добавить слои и отобразить их в ArcMap. Исследовать статистические и пространственные свойства данных. Выбрать модель для построения поверхности. Для определения и уточнения соответствующей модели используется Мастер операций геостатистики. Оценить качество результирующей поверхности с использованием инструментов перекрестной и простой проверки. Это поможет вам понять, насколько хорошо модель интерполирует значения в искомой точке. Может быть построено более одной поверхности. Поверхности могут быть сопоставлены с использованием статистики перекрестной проверки. ПРИНЦИПЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 79 s Исследовательский анализ пространственных данных (ESDA) 4 В ЭТОЙ ГЛАВЕ • Что такое Исследовательский анализ пространственных данных? • Инструменты Исследовательского анализа пространственных данных • Изучение распределения данных • Определение глобальных и локальных выпадающих значений • Определение глобальных трендов • Изучение пространственной автокорреляции и вариации по направлениям • Изучение ковариации между несколькими наборами данных Исследовательский анализ пространственных данных (ESDA) позволяет вам исследовать данные различными методами. Перед построением по верхности, ESDA помогает вам глубже понять изучаемое явление с тем, чтобы вы могли принимать более обоснованные решения при работе с дан ными. Каждый новый вид данных может быть обработан и изучен, и инст рументы ESDA помогут вам по разному взглянуть на одни и те же данные. Все инструменты ESDA связаны между собой и с отображением данных в ArcMap. То есть, если на гистограмме вы выбираете столбец, точки, отно сящиеся к этому столбцу, будут также выбраны на графике КК (если он открыт), либо в любом другом открытом диалоге ESDA, либо на карте ArcMap. Среда ESDA разработана, как следует из ее названия, для целей исследо вания. Однако, выполнение некоторых задач целесообразно для большин ства научных работ. Изучение распределения данных, определение гло бальных и локальных выпадающих (экстремальных) значений, поиск гло бальных трендов, изучение пространственной автокорреляции и понима ние ковариации между несколькими наборами данных, все это задачи, выполнение которых полезно для понимания структуры данных. Инстру менты ESDA могут помочь вам в решении этих и многих других задач. 81 Что такое Исследовательский анализ пространственных данных (ESDA)? Среда ESDA позволяет вам графически исследовать набор данных с тем, чтобы лучше понять его структуру. Каждый инструмент ESDA по разному представляет данные и отображается в отдель ном окне. ESDA включает следующие диалоги: Гистограмма, Кар та Вороного, Нормальный график КК, Анализ тренда, Облако вариограммы/ковариации, Общий график КК, и облако взаим ной ковариации. Все виды связаны между собой и с картой ArcMap. Выбор объектов; выбор группы объектов и динамические связи выборки Диалоги ESDA связаны между собой, и, если вы выбираете точки в одном из окон, они выделяются цветом на всех картах и графи ках. Для выбора объектов в виде данных ArcMap или в диалогах инструментов ESDA вы можете воспользоваться инструментом выбора группы объектов (при использовании этого инструмента будут выбраны объекты, попадающие в прямоугольник заданного вами размера). Любой выбор, осуществленный в виде ESDA или на карте ArcMap, будет продублирован во всех окнах ESDA и на карте ArcMap (см. диаграмму на следующей странице); такое свойство носит название динамической связи выборки. Если вы выбираете точки в диалогах некоторых инструментов ESDA (на гистограмме, карте Вороного, графике КК и в окне анализа трен да), выбранные точки вида связываются с картой ArcMap, и соот ветствующие точки выделяются на карте цветом. Поскольку точ ки на графиках вариограммы/ковариации представляют пары опорных точек, при выборе точек в окне инструмента Облако вариограммы/ковариации, на карте цветом выделяются пары точек и отображаются отрезки, соединяющие каждую пару. Ког да в виде данных ArcMap выбираются пары точек, точки на гра фике вариограммы/ковариации также выделяются цветом. Взаимодействие слоев ArcMap и инструментов ESDA Инструменты ESDA взаимодействуют со слоями ArcMap следую щим образом: 1. Инструменты ESDA работают со слоями, содержащими точечные и полигональные объекты (например, данные переписи, эпидемиоло гические или демографические данные). 2. Слой, который был выделен в таблице содержания ArcMap, перед тем, как вы открыли инструмент ESDA, будет использоваться этим инструментом, как слой, предложенный по умолчанию. 3. Если для выделенного в ArcMap слоя не определена возможность выбора объектов, слоем, предложенным по умолчанию при запус ке инструмента ESDA, будет верхний слой в таблице содержания. 4. В списке слоев, которые могут быть исследованы с помощью инст румента, в окне соответствующего инструмента отобразятся толь ко те слои с точечными объектами, которые доступны для выбора объектов. 5. Для любого слоя будут сохранен сформулированный запрос. 6. Слой, который исследуется с помощью инструментов ESDA, не обя зательно должен отображаться в виде данных ArcMap; но если он не отображается в ArcMap, выборка не будет видна на карте. 7. Если в таблице содержания ArcMap выделен только один точечный слой, и выбран инструмент ESDA, для работы с которым необходи мо несколько слоев, выделенный в таблице содержания слой будет по умолчанию первым набором данных для данного инструмента. 8. Если в таблице содержания ArcMap выделено два или большее ко личество слоев, и выбран инструмент ESDA, работающий с несколь кими слоями, первый выбранный в таблице содержания точечный слой служит первым исходным набором данных для этого инстру мента ESDA, а второй выделенный слой вторым набором данных. Преобразования Несколько методов, используемых в модуле Geostatistical Analyst, требуют условия нормального распределения данных. Когда дан ные асимметричны (распределение неравномерное, односторон нее), возможно, вы захотите преобразовать данные, чтобы при вести их к нормальному распределению. Такие инструменты ESDA, как Гистограмма и график КК, позволяют вам изучить влияние различных преобразований на распределение набора данных. Если вы выберите опцию преобразования данных пе ред построением поверхности с использованием методов геоста тистики, для вашей проинтерполированной поверхности вычис ленные значения будут преобразованы обратно к исходныму виду. 82 ARCGIS GEOSTATISTICAL ANALYST Исследовательский анализ пространственных данных (ESDA) Выбор опорных точек Выбор по местоположению Инструмент Гистограмма Инструмент выбора Выбор с использованием инструмента ESDA Вид данных ArcMap Инструмент Гистограмма Вид данных ArcMap Инструмент построения карты по методу Вороного Выберите интересующие вас точки в виде данных ArcMap. Ин струменты ESDA отобразят выбранные точки на фоне всех то чек (например, как частичную гистограмму). Инструмент построения карты по методу Вороного Выберите объект, который вас интересует (например, хвост гистограммы) в окне инструмента ESDA. Местоположение вы бранных точек отобразится в окне вида ArcMap. Когда вы от кроете новый инструмент ESDA, он также покажет соответст вующие свойства выбранных точек (например, местоположе ние ячеек Вороного). ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 83 Инструменты Исследовательского анализа пространственных данных (ESDA) Каждый инструмент ESDA предоставляет вам возможность ис следовать данные с различных точек зрения. Каждый инстру мент использует отдельное окно, которое взаимодействует с ото бражением данных в ArcMap и в окнах других инструментов ESDA. Вы можете работать со следующими инструментами: Ги стограмма, карта Вороного, Нормальный график КК, Анализ тренда, Облако вариограммы/ковариации, Общий график КК и Облако взаимной ковариации. Гистограмма Инструмент гистограммы в ESDA дает одномерное (по одной переменной) описание ваших данных. Инструмент показывает плотность распределения для интересующего вас набора дан ных и подсчитывает суммарную статистику. Плотность распределения Плотность распределения это столбчатая диаграмма, которая показывает, насколько часто наблюдаемые значения попадают в тот или иной интервал или класс. Вы задаете число классов рав ной длины, которые будут использованы на гистограмме. Коли чество значений, попадающих в каждый класс, пропорциональ но высоте столбца. В качестве примера на гистограмме, приве Статистика распределения Распределение данных Число столбцов гистограммы Выбор метода преобразования Выбранный слой Выбранный атрибут денной на этой странице, показана плотность распределения для набора данных со значениями концентрации озона (10 клас сов). Суммарная статистика Распределение может быть охарактеризовано с помощью неко торых суммарных показателей, описывающих его форму, поло жение и размах. Меры положения Меры положения дают вам представление о том, где находятся центр и другие параметры распределения. Среднее (mean) это арифметическое среднее из значений дан ных. Среднее характеризует положение центра распределения. Значение медианы (median) соответствует совокупной доле по ловины (0.5). Если данные были организованы в порядке возра стания, это означает, что 50 процентов значений будут ниже медианы, а 50 процентов значений выше медианы. Медиана дает еще одну меру центра распределения. Первый и третий квартили (quartile) характеризуют совокуп ные доли 0.25 и 0.75, соответственно. Если данные были орга низованы в порядке возрастания, 25 процентов значений будет ниже первого квартиля, и 25 процентов значений выше треть его квартиля. Первый и третий квартили это частный случай квантилей. Квантили рассчитываются по следующей формуле: квантиль = (i) 0.5 / N где (i) iый класс упорядоченных значений данных, а N количе ство значений данных. Характеристики размаха Размах точек относительно среднего значения еще одна харак теристика диаграммы плотности распределения. Дисперсия (variance) данных равна среднему из квадратов отклонения зна чений всех точек от среднего. Единицы измерения дисперсии квадрат единиц измерения, в которых выполнялись исходные 84 ARCGIS GEOSTATISTICAL ANALYST FrequeПnлcоyтDнiоstсriтbьution измерения, и поскольку для вычисления дисперсии использу ются квадраты разностей, она чувствительна к экстремально высоким и экстремально низким значениям. Стандартное отклонение (standard deviation) равно корню ква дратному из дисперсии. Оно характеризует распределение дан ных относительно среднего в тех же единицах измерения, что и исходные измерения. Чем меньше дисперсия и стандартное от клонение, тем плотнее измеренные значения сгруппированы около среднего. На нижней диаграмме показаны два распределения с различны ми стандартными отклонениями. Частотное распределение, по казанное черной линией, более пологое (значения данных более разнообразны и их размах шире), чем распределение, показан ное красным цветом. Дисперсия и стандартное отклонение для пространственного распределения, показанного черным цветом, больше, чем для частотного распределения, показанного крас ным цветом. Меры формы 0.4 0.3 0.2 0.1 0.0 ЗнаVчaеlнuиeя Плотность распределения можно охарактеризовать также фор мой. Коэффициент асимметрии это мера симметрии распределе ния. Для симметричных распределений этот коэффициент ра вен нулю. Если у графика распределения есть длинный правый хвост больших значений, распределение имеет положительную симметрию, а если график имеет длинный левый хвост малень FrequenПcлyоDтiнstоriсbтuьtion FrequenПcлyоDтiнstоriсbтuьtion ких значений, распределение имеет отрицательную симметрию. Для распределений с положительной симметрией, среднее боль ше медианы, и наоборот, для распределений с отрицательной симметрией, среднее меньше медианы. На нижнем рисунке по казано распределение с положительной симметрией. 0.3 0.2 0.1 0.0 ЗVнalаuчeения Медиана Среднее Эксцесс кривой плотности распределения зависит от размера хвостов графика и дает меру того, насколько вероятно, что в распределении будут встречаться резко выделяющиеся, выпа дающие значения. Эксцесс нормального распределения равен 3. Распределения с относительно толстыми хвостами являются “ос тровершинными” и имеют эксцесс больше 3. Распределения с относительно тонкими хвостами являются “плосковершинны ми”, и их эксцесс меньше 3. На рисунке, приведенном внизу, нормальное распределение показано кривой красного цвета, а кривая с эксцессом больше нормального (островершинная) дана черным цветом. 0.4 0.3 0.2 0.1 0.0 ЗнVаaчluеeния ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 85 Карта Вороного Карты Вороного строятся из серий полигонов, образуемых во круг опорных точек. Инструменты (масштабирование, перемещение по карте, и т.п.) Карта Вороного Значения ячеек Например, на следующем рисунке яркая желтая опорная точка ок ружена полигоном, обозначенным красным цветом. Каждая точка, попадающая в красный полигон, ближе к желтой опорной точке, чем к любой другой опорной точке (опорные точки показаны небольши ми темно синими точками). Все полигоны, обозначенные голубым цветом, имеют общую границу с красным полигоном, таким обра зом, опорные точки, расположенные в голубых полигонах, являются соседями желтой опорной точки. Выбор метода Выбранный Выбранный набор данных атрибут Цветовая шкала Полигоны Вороного создаются таким образом, чтобы каждая точка внутри полигона находилась ближе к рассматриваемой опорной точке, чем к любой другой опорной точке. После того, как полигоны созданы, соседи опорной точки определяются как любая другая опорная точка, чей полигон имеет общую границу с выбранной опорной точкой. Используя определение соседей, можно вычислить целый ряд ло кальных статистических показателей. Например, локальное сред нее может быть найдено, как среднее из значений опорных точек, попадающих в красный и голубые полигоны. Затем это среднее зна чение присваивается красному полигону. После того, как эта опера ция будет выполнена для всех полигонов и их соседей, с помощью цветовой шкалы будут показаны значения локальных средних, что бы поможет визуализировать регионы высоких и низких значений. Инструмент составления карты по методу Вороного предлагает це лый ряд методов для присвоения полигонам вычисленных значений. С использованием простого значения: Значение, присваиваемое ячей ке, это значение опорной точки, попадающей в этот полигон. С использованием среднего: Значение, присваиваемое ячейке, сред нее, полученное из значений опорной точки ячейки и ее соседей. С использованием моды: Все значения ячеек группируются в пять классов. Значение, присваиваемое ячейке, мода (наиболее часто встречающееся значение) ячейки и ее соседей. 86 ARCGIS GEOSTATISTICAL ANALYST По методу кластера: Все ячейки группируются в пять классов. Если интервал класса ячейки отличается от каждого из интерва лов класса соседей, ячейка окрашивается в серый цвет, чтобы отличить ее от соседей. По методу энтропии: Все ячейки распределяются по пяти клас сам на основе естественной группировки значений данных (т.н., “регулируемые” квантили; обратитесь к Главе 8, ‘Отображение геостатистических слоев и управление ими’). Значение, при сваиваемое ячейке это энтропия, вычисляемая на основе зна чений опорных точек в ячейке и ее соседях, Энтропия = S (p * Log p ) i i где p частота встречаемости ячеек, отнесенных к каждому клас i су. Например, рассмотрим ячейку с четырьмя соседями (общее ко личество ячеек равно 5). Их значения помещены в соответству ющие классы: Class Frequency pi 1 3 3/5 2 0 0 3 1 1/5 4 0 0 5 1 1/5 Значение энтропии, присвоенное ячейке, будет равно: E = [0.6*log2 (0.6) + 0.2* log2 (0.2) + 0.2* log2 (0.2)] = 1.371 Значение энтропии будет минимальным, если значения всех ячеек попадают в один и тот же класс. Тогда, E = [1 * log (1)] = 0 min 2 Значение энтропии будет максимальным, когда все ячейки по падают в разные классы. Тогда, Emax = [0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2) + 0.2 * log2 (0.2)] = 2.322 По методу медианы: Значение, присваиваемое ячейке, медиа на, вычисленная для плотности распределения ячейки и ее сосе дей. По методу стандартного отклонения: Значение, присваиваемое ячейке, стандартное отклонение, вычисленное для значений ячейки и ее соседей. Диапазон между квартилями: Первый и третий квартили рас считываются для плотности распределения ячейки и ее соседей. Значение, присваиваемое ячейке, вычисляется путем вычита ния значения первого квартиля из значения третьего квартиля. Другие статистические показатели для карты Вороного исполь зуются для других целей. Статистические показатели могут быть сгруппированы в следующие функциональные категории: Локальное сглаживание Среднее Мода Медиана Локальные отклонения Стандартное отклонение Диапазон между квартилями Энтропия Локальные выпадающие значения Кластер Локальное влияние Простое значение ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 87 КумулCяuтmиulвaнtiоvеeрDаisсtпriрbеutдiеoлnение ЗнDаatчaенVaиlяueданных КумулCяuтmиuвlнatiоvеeрDаiсstпriрbеuдtiеoлnение КумуCлuяmтuиlaвtiнvоeеDрiаstсriпbрuеtiдoеnление НDаatбоaрSдeаtн1ныVхal1ues КумуCлuятmиulвaнtiоvеe рDiаsсtrпiрbеutдiеoлnение Нормальный и общий графики КК (Квантиль квантиль) Графики КК Plots графики, на которых квантили из двух рас пределений рассматриваются относительно друг друга. Построение нормального графика КК Кумулятивное (совокупное) распределение данных можно полу чить, упорядочив данные и построив график, по одной оси кото рого откладываются эти упорядоченные значения, а по другой значения совокупного распределения, вычисляемого по формуле (i 0.5)/n для i ого упорядоченного значения из общего числа n значений (доли данных ниже значения). Между значениями ис пользуется линейная интерполяция. Нормальный график КК стро ится путем нанесения на соответствующие оси координат значе ний из набора данных и значений, полученных по кривой нор мального распределения, соответствующих одинаковому значе нию кумулятивного распределения (см. нижний рисунок). 1.0 0.8 0.6 0.4 0.2 0.0 0 ДаDнaнtaые НормNаoлrьmнaоlеDрisаtсriпbрuеtiдoеnление 1.0 0.8 0.6 0.4 0.2 0.0 2 4 6 8 10 12 -4 -3 -2 -1 0 1 2 3 4 Значеvaнluиeе НNорoмrmалaьlнQыQй гpрlаoфt ик КК vaЗluнeачение 12 10 8 6 4 2 0 -2 -1 0 1 2 НNoоrрmмaаl лVьalнuоe е значение Построение общего графика КК Общий график КК используется для оценки схожести распреде лений двух наборов данных. Общий график КК создается путем нанесения значений данных, для которых совокупное распре деление имеет равные значения (см. нижний рисунок). НабDоaрtaдSанeнt ы1 х 1 1.0 НабоDрatдaаSнeнtы2х 2 1.0 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 0 2 4 6 8 10 12 10 12 14 16 18 vЗaнluаeчение Значvaеluнeие ÎGснeоnвeнrоaйl QгрQафpиloкtКК 12 10 8 6 4 2 0 10 12 14 16 18 НDаaбtоaрSдeанt н2ыVхa2lues 88 ARCGIS GEOSTATISTICAL ANALYST Нормальный график КК (Квантиль квантиль) Используемый метод преобразования График квантилей исходного набора данных относительно квантилей стандартного нормального распределения Общий график КК (Квантиль квантиль) График квантилей двух наборов данных Исходные наборы данных Исходный набор данных Используемый атрибут Используемые атрибуты ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 89 Анализ тренда Вам может быть также интересно построить карту, отражаю щую тренд данных, или вычесть тренд из набора данных перед использованием кригинга. Инструмент Анализ тренда может помочь вам в определении глобального тренда в ваших данных. Инструменты (перемещение по карте, масштабирование, т.п.) Линия тренда в направлении восток запад Линия тренда в направлении север юг Каждая линия показывает положение и значение (высоту) каждой опорной точки Углы отображения Контроль движения по вертикали Оси карты Контроль движения по горизонтали Контроль перспективы Опции отображения Параметры отображения проецируются на плоскости x,z и y,z , образуя точечные графи ки. Эти графики могут рассматриваться как боковые проекции трехмерных данных. Затем к точечным графикам на плоско стях проекций подбираются полиномы, аппроксимирующие их расположение. Дополнительная особенность состоит в том, что вы можете вращать данные, чтобы выделить в значениях трен ды по направлениям. Существует целый ряд других функцио нальных особенностей, которые позволяют вам вращать и ме нять перспективу целого изображения, менять размер и цвет точек и линий, удалять плоскости и точки, и выбирать степень полинома, который будет использован для аппроксимации то чечных графиков. На диаграмме, приведенной внизу, данные развернуты под углом 25 градусов по часовой стрелке, а для аппроксимации точечного графика используется полином вто рой степени. На задней плоскости виден квадратичный тренд (показан зеленым цветом): кривая начинается с низких значе ний, затем значения растут, и потом снова падают. Тренд на правой плоскости (показан голубой линией) является более ли нейным и более постепенным. Выбранный набор данных Выбранный атрибут Инструмент Анализ тренда позволяет увидеть данные в трех мерном изображении. Координаты опорных точек наносятся в плоскости x,y. В каждой опорной точке высотой отрезка пока зано значение точки (по оси z). Уникальная особенность инстру мента Анализа тренда состоит в том, что значения точек затем 90 ARCGIS GEOSTATISTICAL ANALYST Облако вариограммы/ковариации Облако вариограммы/ковариации это эмпирическая варио грамма (на которой показаны значения половины квадрата раз ности между измеренными величинами) и ковариация для всех пар опорных точек из набора данных; на облаке вариограммы эти значения показаны как функция расстояния между двумя точками. Пусть z(si) обозначает значение набора данных в i той точке. Точки вариограммы, представляющие пары опорных точек Параметры по направлениям Тогда значение эмпирической вариограммы для пары (i,j) рав но 0.5* (z(si ) − z(s j ))2 , а эмпирическая ковариация (z(si ) − z)(z(s j ) − z) , где z среднее значение данных. Облако вариограммы/ковариации может быть использовано для изу чения локальных характеристик пространственной автокор реляции в наборе данных и определения выпадающих значе ний в выборке. Облако вариограммы/ковариации выглядит следующим образом: Поверхность Выбранный вариограммы набор данных Выбранный атрибут ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 91 где каждая красная точка это эмпирическая вариограмма (по ловина квадрата разницы значений, нанесенная на график как функция расстояния между точками) для всех пар опорных то чек из набора данных. Вы можете выделить точки с помощью инструмента выбора и увидеть связанные пары точек в ArcMap. Вы также можете воспользоваться поверхностью вариограммы с возможностями поиска по направлению. Значения на облаке вариограммы распределяются по бинам, основанным на направ лениях и расстоянии между парами опорных точек. Эти значе ния бинов усредняются и сглаживаются, а затем по ним строит ся поверхность вариограммы. Справа дана цветовая шкала и значения на границах перехода между цветовыми обозначения ми. Область отображения поверхности вариограммы контроли руется размером лага и количеством лагов. (см. Главу 3, ‘Прин ципы геостатистического анализа’, для дополнительной инфор мации о поверхности вариограммы, бинах и лаге вариограммы.) Вы можете просматривать поднаборы значений на облаке вари ограммы, выбрав направление поиска, а затем щелкнуть на ука затель направления, если вы хотите изменить его размер или ориентацию. Вы также можете щелкнуть по серой стрелке в верхней части панели, чтобы временно скрыть эту часть инстру мента. Вы выбираете набор данных и атрибут с использованием следу ющей панели: где OZONE поле таблицы атрибутов, в котором хранятся зна чения концентрации озона. Вы можете щелкнуть по серой стрел ке вверху панели, чтобы временно спрятать эту часть инстру мента. 92 ARCGIS GEOSTATISTICAL ANALYST Облако взаимной ковариации Облако взаимной ковариации показывает эмпирическую взаим ную ковариацию для всех пар точек между двумя наборами дан ных; точки на графике даны как функция расстояния между двумя точками. Пусть z(si) обозначает значение i ой точки в первом наборе дан ных, а y(t ) значение j той точки во втором наборе данных. j Точки взаимной ковариации, представляющие пары опорных точек из различных наборов данных Параметры по направлениям z Тогда значение эмпирической взаимной ковариации для пары (i,j) находится по формуле (z(si ) − z)( y(t j ) − y) , где z и y средние значения для первого и второго наборов данных, соответственно. Облако взаимной ковариации может быть использовано для локальных характеристик пространст венной автокорреляции между двумя наборами данных; по об лаку взаимной ковариации могут быть определены также про странственные сдвиги в корреляции между двумя наборами дан ных. Облако взаимной ковариации выглядит следующим обра зом: Поверхность ковариации Выбранные наборы данных Выбранные атрибуты ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 93 где каждая красная точка соответствует эмпирической взаим ной ковариации между парами опорных точек в каждом набо ре данных. Вы можете выбрать точки и просмотреть их свя занные пары в ArcMap. (Чтобы различать, какие пары точек относятся к каждому из наборов данных, в диалоге свойств каж дого набора данных задайте свой цвет выбора.) Также вы можете работать с поверхностью ковариации и вос пользоваться возможностью поиска по направлениям. Значе ния на облаке взаимной ковариации сгруппированы в бины, основанные на сходном направлении и одинаковом расстоянии между парами опорных точек. Затем эти значения бинов ус редняются и сглаживаются для построения поверхности вза имной ковариации. Справа дана цветовая шкала, на которой приведены значения, соответствующие цветовой границе пе рехода между бинами. Область отображения поверхности вза имной ковариации контролируется размером лага и количест вом лагов. (См. Главу 3, ‘Принципы геостатистического анали за’, для дополнительной информации о поверхности вариограм мы, бинах и лагах.) Вы можете просмотреть значения поднаборов данных на обла ке взаимной ковариации, отметив галочкой опцию Показывать направление поиска, а затем, щелкнув по указателю направле ния, менять его размер или ориентацию. Вы можете также щелкнуть по серой стрелке в верхней части панели, чтобы вре менно скрыть эту часть инструмента. 94 ARCGIS GEOSTATISTICAL ANALYST Изучение распределения данных ProbaПbiлliоtтyнDоeсnтsьity Плотность Probability Density Определенные методы кригинга работают лучше, если данные под чиняются закону нормального распределения, функция плотности которого выглядит следующим образом: 0.4 0.3 0.2 0.1 0.0 ЗначVеaнluиeя В частности, карты квантилей и вероятности, построенные с ис пользованием методов ординарного, простого и универсального кригинга, используют данные, которые подчиняются закону нор мального распределения. Как уже упоминалось в Главе 3, метод кригинга основывается так же на предположении о стационарности. Это предположение, в частности, требует соблюдения условия того, что все распределе ния значений данных имеют одинаковую изменчивость. Часто в природе мы наблюдаем, что с увеличением значений, увеличивает ся также их изменчивость. Чтобы привести данные к нормальному распределению и выполнить условие их равной изменчивости, вы можете выполнить различные преобразования наборов данных. Инструменты гистограммы и нормального графика КК позволяют использовать несколько методов преобразований, включая метод Box–Cox (“рубка рулевого” также известно как степенное пре образование), логарифмический и арксинуса (для дополнительной информации см. Главу 7, ‘Использование аналитических инстру ментов при построении поверхностей’). Преобразование по мето ду Box–Cox определяется выражением Y(s) = (Z(s)l 1)/ l для l № 0. Этот метод преобразования следует использовать в том случае, если ваши данные состоят из подсчетов встречаемости какого либо явления. Для таких типов данных дисперсия часто определяется по среднему значению. Это означает, что если на части изучаемой территории встречаемость маленькая, изменчивость в этом локаль ном районе будет меньше, чем изменчивость в другом районе, где встречаемость больше. В этом случае, известно, что если вы сначала извлечете корень квадратный из всех значений ваших данных, это поможет сделать дисперсии более постоянными для всей изучаемой территории, и также часто позволяет привести данные к нормаль ному распределению. Преобразование с использованием квадрат ного корня применимо, когда l = Ѕ. Логарифмическое преобразо вание обычно рассматривается, как частный случай преобразова ний по методу Box–Cox, когда l = 0, Y(s) = ln(Z(s)) для Z(s) > 0, и ‘ln’ натуральный логарифм. Логарифмическое преобразование часто используется в тех случаях, когда данные имеют распределе ние с положительной асимметрией, и в данных есть несколько очень больших значений. Вы можете локализовать эти большие значения на изучаемой территории, а логарифмическое преобразование по может сделать дисперсии более постоянными и нормализовать ваши данные. Распределение с положительной асимметрией выглядит следующим образом: 0.3 0.2 0.1 0.0 ЗнаVчaеluнeия Преобразование по методу арксинуса имеет выражение Y(s) = sin 1(Z(s)), если значения Z(s) находятся в интервале от 0 до 1. Пре образование по методу арксинуса может быть использовано для дан ных, выраженных в относительных единицах (или в процентах). Часто, когда данные выражены пропорцией, дисперсия будет наи ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 95 меньшей для значений, близких к 0 и 1, и наибольшей для значе ний, близких к 0.5. Преобразование по методу арксинуса поможет сделать дисперсии более постоянными для всей изучаемой терри тории и часто приводит к нормализации распределения данных. Чтобы понять, какие преобразования данных необходимо выпол нить для того, чтобы привести данные к нормальному распределе нию, вы можете воспользоваться инструментами гистограммы и нормального графика КК. Это же преобразование (по методу арк синуса), скорее всего, также приведет к выравниванию дисперсий, что поможет выполнить условие стационарности данных. Использование инструмента гистограммы для изучения распределений С помощью инструмента гистограммы вы можете изучить форму рас пределения визуально. Просмотрев статистику, в частности значения среднего и медианы, вы можете определить центр распределения. Обратите внимание на рисунке внизу, что форма гистограммы похо жа на колокол, и поскольку значения среднего и медианы очень похо жи, это распределение близко к нормальному. Вы можете также вы делить цветом экстремальные значения в хвосте гистограммы и по смотреть, как они пространственно распределены в ландшафте. На нижнем рисунке, на котором показаны данные по концентрации озо на, наиболее высокие значения расположены, как и ожидалось в го родских районах. Если ваши данные имеют сильную асимметрию, вы можете проверить результат применения преобразований к вашим данным. На верхней диаграмме показано асимметричное распределение до применения преобразований. К асимметричным данным применено логарифмическое преобра зование, которое привело данные к распределению, близкому к нормальному. 96 ARCGIS GEOSTATISTICAL ANALYST Изучение распределений с помощью графиков Квантиль квантиль Для двух идентичных распределений общий график КК (кван тиль квантиль) будет прямой линией. Таким образом, сравне ние этой линии с точками на нормальном графике КК дает пред ставление об одномерной нормальности. Если данные асиммет ричны (т.е. далеки от нормального распределения), точки бу дут отклоняться от прямой линии. На нижней диаграмме квантили стандартного нормального рас пределения нанесены на нормальный график КК по оси x, а квантили набора данных по оси y. Вы можете видеть, что гра фик близок к прямой линии. Главное отклонение от этой линии происходит в области высоких значений концентрации озона. Инструмент нормального графика КК позволяет вам выбрать точки, которые не попадают на прямую линию. Выбранные точ ки выделяются цветом в виде данных ArcMap. (Здесь видно, что они сконцентрированы на небольшом участке рядом с Лос Анд желесом.) Однако, если вы посморите на следующий рисунок, вы увидите, что после логарифмического преобразования набора данных, точки лежат ближе к прямой линии. Тот же набор данных, что мы трансформировали в предыдущем примере с гистограммой, также был преобразован с помощью инструмента нормального графика КК (рисунки справа). Об ратите внимание, что на первом графике точки сильно отклоня лись от прямой линии. ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 97 Изучение Изучение 1 распределения распределения с помощью инструмента ваших данных Гистограмма Инструменты ESDA помогают вам в изучении распределения ваших данных. Вы хотите знать, подчиняются ли ваши данные нормальному распределению (кривая в фор ме колокола). Среднее и медиа на при нормальном распределе нии будут иметь близкие значе ния, асимметрия будет близка к нулю, а эксцесс должен иметь значение, примерно равное 3. 1. В таблице содержания ArcMap выберите точечный слой, данные которого вы хо тите изучить. 2. На панели инструментов Geostatistical Analyst выбери те опцию Исследовать дан ные, затем строку Гистограм ма. Если данные имеют значитель ную асимметрию, вы можете попробовать преобразовать их с тем, чтобы привести к нормаль ному распределению. При пост Изучение 1 роении поверхности преобразо распределения с вание данных надо выполнять с помощью графика КК осторожностью, поскольку полу ченные интерполированные значения будут подвергнуты об ратному преобразованию, и это обратное преобразование даст 1. В таблице содержания ArcMap выберите точечный слой, дан ные которого вы хотите изу чить. приблизительно несмещенные значения интерполяции с при мерной стандартной ошибкой кригинга. 2. На панели инструментов Geostatistical Analyst выбери те опцию Исследовать дан ные, затем строку Нормаль Подсказка ный график КК. График КК Если данные подчиняются нор мальному распределению, точ ки будут расположены близко к прямой линии. 98 2 2 ARCGIS GEOSTATISTICAL ANALYST Поиск глобальных и локальных выпадающих значений в наборе данных Глобальное выпадающее значение это очень высокое или очень низкое (относительно других точек в наборе данных) измеренное значение в опорной точке. Например, если 99 из 100 точек имеют значение в интервале между 300 и 400, но сотая точка имеет значе ние, равное 750, эта сотая точка может рассматриваться как гло бальное выпадающее значение. Локальное выпадающее значение это измеренное значение в опор ной точке, которое попадает в обычный интервал значений всего набора данных, но если вы посмотрите на точки, расположенные в окрестности этой точки, то по сравнению с ними, это значение нео бычно высокое или низкое. Например, на диаграмме внизу показан разрез долины в ландшафте. Видно, что в центре долины есть одна точка, высота которой слишком велика относительно соседних то чек, но при этом значение не выпадает из набора данных в целом. они должны быть либо исправлены, либо удалены из набора дан ных до построения поверхности. Выпадающие значения могут ис казить поверхность проинтерполированных значений, а также оказать отрицательное влияние на моделирование вариограммы и на использование области поиска соседства. Поиск выпадающих значений по гистограмме Инструмент гистограммы позволяет вам выбирать точки на хвос тах распределения. Выбранные точки отображаются в виде дан ных ArcMap. Если экстремальные значения соответствуют отдель ным опорным точкам (т.е., окруженным точками с очень разными значениями), может потребоваться дополнительное изучение дан ных, и, при необходимости, удаление точки с экстремальным зна чением. Выпадающие значения важно определять по двум причинам: они могут либо указывать на ненормальность явления, либо на то, что была допущена ошибка при измерении или записи значения этой точки. Если выпадающее значение соответствует действительной ненор мальности явления, это может стать самой существенной точкой исследования и важным фактором в понимании изучаемого явле ния. Например, опорная точка, расположенная на рудной жиле какого либо минерала, может иметь резко выделяющееся значе ние, и именно это место будет представлять наибольший интерес для горнодобывающей компании. Если выпадающие значения вызваны ошибками при вводе данных, и эти значения опорных точек точно являются неправильными, В приведенном выше примере, высокие значения концентрации озона не являются экстремальными или выпадающими, и, следова тельно, нет необходимости удалять их из набора данных. Определение выпадающих значений по облаку вариограммы/ковариации Если в вашем наборе данных присутствует глобальное выпадающее, нехарактерно высокое для набора данных значение, все пары точек, образующиеся с участием этого экстремального значения, будут иметь высокие значения и на облаке вариограммы, независимо от их уда ленности друг от друга. Это можно увидеть по облаку вариограммы, приведенному на рисунке на следующей странице. Обратите внима ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 99 ние на два основных слоя вариограммы. Если вы выделите точки в верхнем слое, как показано на рисунке, в виде данных ArcMap вы увидите, что все эти высокие значения соответствуют парам с одной точкой точкой, имеющей экстремально высокое значение. Таким образом, верхний слой точек был образован всеми парами опорных точек с единственной точкой, имеющей экстремально высокое зна чение, а нижний слой соответствует парам, которые образуют ос тальные опорные точки. Когда вы смотрите на гистограмму, кото рая также приведена на рисунке внизу, вы видите одно высокое значение в правом хвосте гистограммы, которое также указывает на глобальное выпадающее значение. Возможно, была допущена ошиб ка при вводе данных, и в таком случае, следует исправить значение или удалить точку из набора данных. подчиняются нормальному закону распределения, и на гистограмме нет необычной точки. Обсуждаемая точка выделена цветом в низком (правом) хвосте гистограммы и образует пары с более высокими соседними значениями (см. выделенные на гистограмме значения). Эта точка может быть локальным выпадающим значением. Необхо димо дальнейшее исследование данных. Когда в данных существует локальное выпадающее значение, значе ние этой точки не будет выходить за пределы значений всего распре деления, но будет иметь нехарактерную величину по сравнению с соседними точками. На рисунке справа вы видите группу пар точек, расположенных близко к друг другу, но имеющих высокое значение вариограммы (они расположены в начале оси x, что означает, что они находятся на местности рядом, и высоко по оси y, что означает, что они имеют высокие значения вариограммы). Если вы выберите эти точки, вы увидите, что все они образуют пару с одной опорной точкой. Если вы посмотрите на гистограмму, вы увидите, что данные Поиск выпадающих значений по карте Вороного Для определения возможных экстремальных значений данных мо гут быть применены карты Вороного, построенные с использовани ем методов энтропии и кластерного анализа. Значения энтропии показывают степень различия между соседними ячейками. В природе следует ожидать, что объекты, расположен ные ближе друг к другу будут более похожи, чем удаленные друг от друга. Следовательно, локальные выпадающие значения могут быть определены с помощью областей с высокими значениями энтропии. Метод кластерного анализа определяет ячейки, которые отличают ся от своих соседей. Следует предположить, что значение, относяще еся к ячейке, будет походить хотя бы на одно значение соседней ячейки. Таким образом, и этот инструмент может быть использован для определения локальных выпадающих значений. 100 ARCGIS GEOSTATISTICAL ANALYST Определение Определение 1 глобальных и глобальных выпадающих значений локальных с использованием выпадающих значений инструмента Гистограмма 1. В таблице содержания Для определения глобального выпадающего значения, обра тите внимание на необычно высокие или низкие значения ArcMap выберите слой точеч ных или полигональных объ ектов, которые вы хотите изу чить. на гистограмме и две ясно раз личимых горизонтальных груп пы точек на облаке вариограм мы. Локальные выпадающие значения можно определить по высоким значениям вариограм 2. На панели инструментов Geostatistical Analyst выбери те опцию Исследовать дан ные, затем строку Гистограм ма. мы, относящимся к одной точ ке в начале оси x на облаке ва риограммы. И глобальные, и локальные вы Определение 1 падающие значения могут ока глобальных зывать отрицательное воздей выпадающих значений ствие на поверхность проин терполированных значений, путем влияния на модель вари ограммы и на искомые значе по облаку вариограммы/ ковариации ния. 1. В таблице содержания ArcMap выберите слой точеч См. также ных или полигональных объ ектов, которые вы хотите изу См. Главу 3, ‘Принципы гео чить. статистического анализа’, для дополнительной информа ции о выпадающих (экстре мальных) значениях. 2. На панели инструментов Geostatistical Analyst выбери те опцию Исследовать дан ные, затем строку Облако ва риограммы/ковариации. ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 2 2 101 Обнаружение локальных 1 2 выпадающих значений с использованием карты Вороного 1. В таблице содержания ArcMap выберите слой точеч ных или полигональных объ ектов, которые вы хотите изу чить. 2. На панели инструментов Geostatistical Analyst выбери те опцию Исследовать дан ные, затем строку Карта Во роного. 102 ARCGIS GEOSTATISTICAL ANALYST Определение глобальных трендов Поверхность может состоять из двух главных компонентов: фик сированного глобального тренда и случайной вариации на мик роуровне. Глобальный тренд часто рассматривается как струк тура с фиксированным средним. Случайная вариация на микро уровне (иногда называемая случайной ошибкой) может быть смоделирована для двух составляющих: пространственной авто корреляции и эффекта самородка. Если вы пришли к выводу, что в ваших данных присутствует глобальный тренд, то вы должны решить, как описать его с по мощью модели. Используете ли вы для построения поверхности детерминистский метод или геостатистический, как правило, зависит от целей ваших исследований. Если вы хотите смодели ровать только глобальный тренд и построить сглаженную по верхность, для создания результирующей поверхности вы мо жете воспользоваться интерполяцией по методу глобального полинома или локальных полиномов (см. Главу 3, ‘Принципы геостатистического анализа’, и Главу 5, ‘Детерминистские ме тоды интерполяции пространственных данных ’). Однако, вы можете учесть тренд при использовании геостатистического ме тода, вычесть его, а затем моделировать оставшуюся часть как случайную вариацию на микроуровне. Главная причина для вы читания тренда в геостатистике удовлетворение предположе ния о стационарности (см.Главу 3, ‘Принципы геостатистичес кого анализа’). Если вы вычтете тренд при использовании геостатистического метода, вы будете моделировать случайную вариацию на микро уровне для остатков значений. Для того, чтобы вы получили обоснованные значения интерполяции, тренд будет снова авто матически добавлен в ваши данные. Если вы раскладываете данные на тренд и вариацию на микро уровне, вы предполагаете, что тренд является фиксированным, а вариация на микроуровне случайной. В данном случае поня тие “случайный” не означает “непредсказуемый”; скорее, та кой случайный процесс регулируется правилами теории вероят ности, которые включают правила зависимости от соседних зна чений и носят название автокорреляции. Результирующая по верхность это сумма фиксированной и случайной поверхнос тей. То есть, следует подумать об использовании двух слоев: того, который никогда не меняется, в то время как другой меняется случайным образом. Например, предположим, что вы изучаете биомассу. Если вам необходимо вернуться в прошлое, скажем на 1000 лет назад, и устремиться в будущее, в наши дни, та часть поверхности величины биомассы, которая соответствует гло бальному тренду, останется неизменной. Однако, та часть по верхности величины биомассы, которая соответствует вариа ции на микроуровне, изменится. Неизменяемый глобальный тренд может быть отнесен за счет фиксированных эффектов, таких как топография. Вариация на микроуровне может быть вызвана менее постоянными явлениями, которые невозможно проследить в столь длительный период времени, такими как ко личество осадков, поэтому предполагается, что они являются слу чайными и коррелирующими. Если вы сможете определить тренд и оценить его количествен но, вы получите более глубокое представление о своих данных, и, таким образом, сможете принять более правильные решения по работе с ними. Если вы вычтете тренд, вы сможете более аккуратно смоделировать случайную вариацию на микроуров не, поскольку глобальный тренд не будет оказывать влияние на пространственный анализ ваших данных. Изучение глобального тренда с помощью инструмента анализа тренда Инструмент анализа тренда поднимает точки над изображени ем интересующего вас участка до высоты значений изучаемого атрибута на трехмерной диаграмме исследуемой территории. Точки затем проецируются в двух направлениях (по умолча нию, север и восток) на две плоскости, перпендикулярные пло скости карты. Кривая полинома подбирается для каждого спро ецированного изображения. Поверхность всей карты может ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 103 вращаться в любом направлении, что также приводит к измене нию направлений, соответствующих плоскостям проекции. Если кривая, проходящая через спроецированные точки, близка к прямой линии (как голубая линия на правой плоскости проек ции на рисунке на следующей странице), в данных тренд отсут ствует. предположить, что в ваших данных существует глобальный тренд. Если вы повернете опорные точки на 30 градусов, как показано на диаграмме внизу, тренд становится более явным и выглядит, как сильно выгнутая U образная кривая. Для описания данных может быть подобран полином второго порядка (см. Главу 3, ‘Принципы геостатистического анализа’, и Главу 5, ‘Детерми нистские методы интерполяции пространственных данных’). С помощью точной настройки, возможной при использовании ин струмента анализа тренда, может быть определено истинное направление тренда. В нашем примере, наиболее сильно тренд проявляется в направлении с юго востока на северо запад. Если кривая может быть описана при помощи полинома, как, например, выгнутая вверх кривая на левой задней плоскости проекции, показанная на диаграмме зеленым цветом, можно 104 ARCGIS GEOSTATISTICAL ANALYST Определение Определение 1 глобальных глобальных трендов с помощью инструмента трендов Анализ тренда Для определения глобального тренда в ваших данных, необ ходимо выявить линию, отли чающуюся от прямой, на плос кости проекции в инструменте анализа тренда. Если в ваших данных присут ствует глобальный тренд, вы мо жете построить поверхность с использованием одного из де терминистских методов интер поляции (например, глобально го или локального полинома), либо вычесть тренд из ваших данных перед моделированием вариограммы/ковариации для кригинга. 1. В таблице содержания ArcMap выберите слой точечных или полигональных объектов, ко торые вы хотите изучить. 2. На панели инструментов Geostatistical Analyst выбери те опцию Исследовать дан ные, затем строку Анализ Трен да. См. также См. Главу 5, ‘Детерминистские методы интерполяции прост ранственных данных’, для до полнительной информации о де терминистских методах ин терполяции и Главу 7, ‘Исполь зование аналитических инст рументов при построении по верхностей’, для дополнитель ной информации о трендах. ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 2 105 Изучение пространственной автокорреляции и вариации по направлениям Исследуя данные, вы получаете представление о пространствен ной корреляции между измеренными значениями. Такое пони мание может быть использовано для принятия более обоснован ных решений при выборе моделей при выполнении пространст венной интерполяции. Пространственная автокорреляция Вы можете исследовать пространственную корреляцию, которая существует в ваших данных, путем изучения различных пар опор ных точек. Облако вариограммы образуется при нанесении на график расстояний между двумя точками и величины половины квадрата разности между значениями в этих точках. Расстояние между точками откладывается по оси x, а половина квадрата раз ности значений точек по оси y. Каждая точка на вариограмме соответствует паре опорных точек, а не индивидуальной точке на карте. Если данные являются пространственно зависимыми, пары то чек, расположенных близко друг от друга (в начале оси x) долж ны иметь меньшие значения квадрата разности (располагаться в нижней части оси y). По мере того, как точки удаляются друг от друга (перемещение вправо по оси x), в целом, величина квадра та разности должна расти (перемещение вверх по оси y). Часто существует некое расстояние, за пределами которого квадрат раз ности остается примерно постоянным. Считается, что точки, уда ленные друг от друга на расстояние, большее этого некоего рас стояния, не коррелируют друг с другом. Основным допущением для геостатистических методов является предположение, что любые две пары точек, расположенных на одинаковом расстоянии и в одинаковом направлении друг от дру га, должны иметь похожие значения квадрата разности. Такая взаимосвязь носит название стационарности (см. Главу 3, ‘Прин ципы геостатистического анализа’, и Главу 7, ‘Использование ана литических инструментов при построении поверхностей’). Пространственная корреляция может зависеть только от рассто яния между двумя точками, что носит название изотропии. Одна ко, возможно, что то же самое значение корреляции могут иметь точки, удаленные друг от друга на другое расстояние или точки, расположенные по другому относительно друг друга в простран стве. Однако в действительности, может случиться так, что объ екты, удаленные друг от друга на значительное расстояние в од ном направлении, будут больше похожи между собой, чем объек ты, расположенные ближе друг к другу в другом направлении. Такое влияние по направлениям видно на вариограммах и диа граммах ковариации и носит название анизотропии. Важно исследовать анизотропию, поскольку если вы обнаружите присутствие влияния по направлениям в корреляции, вы можете учесть их в моделях вариограммы и ковариации. Это, в свою оче редь, влияет на геостатистический метод интерполяции. Исследование пространственной структуры с помощью инструмента Облако Вариограммы/ ковариации Инструмент Облако вариограммы/ковариации может быть ис пользован для изучения корреляции ваших данных. Рассмот рим набор данных со значениями концентрации озона. На сле дующем рисунке обратите внимание, что вы можете выбрать все пары точек, которые находятся на определенном расстоя нии друг от друга, выделив их на вариограмме. 106 ARCGIS GEOSTATISTICAL ANALYST Определение влияния по направлениям с помощью инструмента облака Вариограммы/Ковариации В предыдущем примере вы использовали инструмент Облако вариограммы/ковариации для определения общей корреляции в данных. Однако, взглянув на поверхность вариограммы, мож но предположить, что в значениях вариограммы могут быть раз личия в зависимости от направления. Если вы выберите опцию Показывать направление поиска и зададите угол и ширину по лосы, как показано на следующем рисунке, вы обнаружите, что связанные точки имеют очень похожие значения, поскольку зна чения вариограммы являются относительно низкими. Теперь, если вы измените направление связей, как показано на следующем рисунке, вы можете увидеть, что некоторые связан ные точки имеют значения, которые сильно отличаются друг от друга, что приводит к высоким значениям вариограммы. Это означает, что точки, отстоящие друг от друга на расстояние око ло 0.9 x 105 метров в направлении под углом 70/250 градусов в среднем больше различаются между собой, чем точки в направ лении под углом 160/340 градусов. Напомним, что свойство, при котором вариация меняется в одном направлении быстрее, чем в другом, носит название анизотропии. При интерполяции по верхности с использованием Мастера операций геостатистики модуля Geostatistical Analyst, для учета анизотропии вы можете использовать модели вариограммы. ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 107 Изучение Изучение 1 пространственной пространственной структуры структуры и 1. В таблице содержания ArcMap вариации по выберите слой точечных или направлениям полигональных объектов, ко торые вы хотите изучить. Изучение пространственной структуры позволяет выявить пространственную автокорре ляцию опорных точек и опре делить наличие влияний по на правлениям. Выберите пары точек, располо женных близко друг к другу (слева по оси x на вариограм ме), которые должны быть в наибольшей степени схожи (значения которых находятся в нижней части оси y). При уда лении точек друг от друга (дви жение вправо по оси x), вариа ция должна возрастать (значе ния находятся выше по оси y). Если пары точек на вариограм ме образуют прямую горизон тальную линию, в данных мо жет отсутствовать пространст венная корреляция, поэтому она может не учитываться при построении поверхности. 2. На панели инструментов Geostatistical Analyst выбери те опцию Исследовать дан ные, затем строку Облако ва риограммы/ковариации. См. также См. Главу 7, ‘Использование аналитических инструментов при построении поверхнос тей’, для дополнительной ин формации о моделировании ва риограммы и трендах по на правлениям. 108 2 ARCGIS GEOSTATISTICAL ANALYST Изучение ковариации между несколькими наборами данных Изучение ковариации между несколькими наборами данных Инструмент Облако взаимной ковариации может быть исполь зован для определения взаимной корреляции между двумя на борами данных. Рассмотрим значения концентрации озона (пер вый набор данных Ozone) и двуокиси азота NO2 (второй набор данных NO ). Обратите внимание, что взаимная корреляция 2 между значениями концентрации NO2 и озона выглядит асим метричной. Темно красный участок показывает, что самые вы сокие значения концентрации характерны для тех районов, где значения NO2 получены со смещением к западу от значений кон центрации озона. Инструмент поиска по направлению поможет определить причину этого явления. Когда он ориентирован на запад, мы получаем следующую картину: Облако взаимной ковариации а когда он направлен на восток, следующую: Облако взаимной ковариации Очевидно, что значения ковариации выше, когда инструмент направления поиска ориентирован на запад. Теперь вы можете изучить, какие пары точек дают высокие значения взаимной ковариации. Для этого воспользуемся инструментами Облако взаимной ковариации и Гистограмма (рисунок на стр. 110). Если инструмент направления поиска указывает на запад, и вы выберите на графике несколько точек с высокими значениями взаимной ковариации, вы увидите, что большинство пар данных расположены в районе Лос Анджелеса. Вы также можете заме тить, что значения концентрации NO смещены к западу от зна 2 чений концентраций озона. По гистограммам можно опреде лить, что высокие значения ковариации для всех пар данных характерны для тех точек, где и значения концентрации NO2 (голубые столбики на гистограмме NO2), и значения концентра ции озона (оранжевые столбики на гистограмме Ozone) выше своих соответствующих средних. Итак, вы определили, что асим метрия взаимной ковариации является результатом смещения высоких значений концентрации NO к западу от высоких зна 2 чений концентрации озона в районе Лос Анджелеса. Обратите внимание, что вы можете также получить высокие значения взаимной ковариации, когда выбранные пары из обоих наборов данных имеют значения ниже соответствующих средних для каждого из набора данных. В действительности, в целом следует ожидать, что высокие значения взаимной ковариации будут ха рактерны для пар точек, имеющих значения как выше, так и ниже их соответствующих средних, и такие пары могут встре чаться на различных участках изучаемой территории. Исследо вав данные, вы определили, что значения взаимной ковариации в районе Лос Анджелеса отличаются от значений на остальной территории штата (см. рисунок на стр. 110). Воспользовавшись этой информацией, вы можете предположить, что причиной ре зультатов, полученных с помощью инструмента исследования взаимной ковариации, может быть непостоянное среднее в дан ных, и попробовать вычесть тренды из данных со значениями концентрации NO2 и озона, либо разделить изучаемую террито рию на районы и выполнить моделирование с помощью кригин га и кокригинга в пределах этих районов. ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 109 Изучение корреляции между двумя наборами данных Образование пар между точками с высокой взаимной корреляцией между значениями концентрации озона и двуокиси азота для района Лос Анджелеса 110 ARCGIS GEOSTATISTICAL ANALYST Изучение Изучение 1 2 пространственной пространственной ковариации между ковариации с несколькими помощью инструмента Облако взаимной наборами данных ковариации 3 4 Инструмент позволяет изучить 1. В таблице содержания ArcMap взаимную ковариацию двух на нажмите правой клавишей боров данных. мыши на слое точечных про Проверьте, является ли по верхность ковариации симмет ричной, и воспользуйтесь инст рументом направления поиска, чтобы определить, аналогично ли облако взаимной ковариации странственных объектов, кото рый будет первым слоем, уча ствующим в анализе взаимной ковариации, и выберите Свой ства. 2. Откройте закладку Выборка. выглядит для всех направлений. 3. Отметьте опцию выделения Если вы обнаружите, что для значений двух наборов данных объектов с помощью данного символа. характерно пространственное 4. Щелкните по кнопке с изоб смещение, или необычно высо ражением символа. кие значения взаимной ковари ации, вы можете исследовать, где это происходит. Если вы за метите, что необычные значе ния взаимной ковариации ха рактерны для отдельных точек или ограниченных участков изучаемой территории, воз можно, вы захотите что либо предпринять, например, обра тить внимание на определен ные значения в данных , вы честь тренд из ваших данных или разделить данные на участ 5. Выберите цвет и размер сим вола, который вы будете ис пользовать для выделенных объектов. Повторите шаги 1–5 для вто рого слоя, который будет ис пользоваться в анализе взаим ной ковариации, но выберите символ другого цвета и разме ра. 6. Выделите эти два слоя в табли це содержания ArcMap, удер живая клавишу Ctrl. ки. 7. На панели Geostatistical Analyst выберите опцию Исследовать данные, а затем строку Обла ко взаимной ковариации. f ИССЛЕДОВАТЕЛЬСКИЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ДАННЫХ 5 111 8. Выберите соответствующие атрибуты для каждого слоя из списка Атрибут. 12 9. Введите размер лага и коли чество лагов. 10. Отметьте опцию Показывать направление поиска. 11. Удерживайте курсор мыши на центральной синей линии на поверхности ковариации и поворачивайте стрелку на правления поиска до тех пор, пока она не будет соответст вовать углу, при котором вы 10 предполагаете наличие сме щения; в нашем примере это 11 угол 270 градусов (он дан в окне “угол направления”). 9 12. Выберите несколько точек на графике ковариации, удержи вая левую клавишу мыши и растягивая инструмент выбо 8 ра так, чтобы захватить не сколько точек. Просмотрите, какие точки выбраны на кар те в ArcMap. 112 ARCGIS GEOSTATISTICAL ANALYST Детерминистские методы интерполяции пространственных данных 5 В ЭТОЙ ГЛАВЕ • Как работает интерполяция по методу взвешенных расстояний • Построение поверхности с использованием интерполяции по методу взвешенных расстояний (IDW) • Как работает интерполяция по методу глобального полинома • Создание карты с использованием метода глобального полинома • Как работает интерполяция по методу локальных полиномов • Создание карты с использованием метода локальных полиномов • Как работает интерполяция с использованием радиальных базисных функций • Создание карты с использованием интерполяции на основе радиальных базисных функций Существует две основные группы методов интерполяции: детерминистские методы и геостатистические. Детерминистские методы интерполяции строят поверхность по опорным точкам, основываясь либо на степени схожести то чек выборки (как например, метод взвешенных расстояний), либо на степени сглаживания (как например, радиальные базисные функции). Геостатистиче ские методы интерполяции (например, кригинг) используют статистические свойства опорных точек. Геостатистические методы количественно определя ют пространственную корреляцию между опорными точками и учитывают расположение опорных точек в пространстве вокруг искомой точки. Геоста тистические методы будут обсуждаться в Главе 6, ‘Построение поверхности с использованием методов геостатистики’. Детерминистские методы интерполяции могут быть разделены на две группы: глобальные и локальные. Глобальные методы вычисляют искомые значения с использованием всего набора данных. Локальные методы используют для вы числения искомых значений только опорные точки, расположенные в окрест ностях искомой, и относятся только к небольшим участках изучаемой терри тории. Модуль Geostatistical Analyst в качестве глобального интерполятора использует метод глобального полинома, а в качестве локального методы взвешенных расстояний, локальных полиномов и радиальных базисных функций. Поверхность, построенная с использованием детерминистских методов, мо жет как проходить, так и не проходить через опорные точки. Метод интерпо ляции, который дает в опорной точке значение, равное измеренному, носит название жесткого интерполятора. Нежесткий интерполятор в опорной точке дает значение, отличное от измеренного (то есть, аппроксимирует значение в опорной точке). Последнее позволяет избежать острых пиков или впадин на результирующей поверхности. Метод взвешенных расстояний и радиальные базисные функции являются жесткими интерполяторами, в то время как глобальные и локальные полиномы нежесткими интерполяторами. 113 Как работает интерполяция по методу взвешенных расстояний Интерполяция по методу взвешенных расстояний (IDW) ис пользует предположение, что объекты, расположенные ближе к другу в большей степени похожи, чем удаленные друг от друга. Чтобы найти значение в какой либо точке, метод IDW использу ет опорные точки, находящиеся в окрестностях искомой. Эти опорные точки будут оказывать большее влияние на интерполи руемое значение, чем те, которые от нее удалены на значитель ное расстояние. Таким образом, метод IDW предполагает, что каждая опорная точка оказывает локальное влияние, которое уменьшается с расстоянием. Точкам, находящимся в окрестно стях искомой, присваиваются весовые значения большие, чем удаленным от нее точкам. Отсюда и пошло название метода: метод (обратных) взвешенных расстояний. N Z€(s0 ) = ∑ λiZ (si ) i=1 Z€(s0 ) искомое значение для точки s . 0 N число опорных точек, находящихся в окрестности искомой точки и используемых в вычислениях. li веса, присвоенные каждой опорной точке, из числа тех, ко торые будут использованы в вычислениях. Эти веса уменьша ются с расстоянием. Z(s ) измеренное значение в точке s . i i Формула метода выглядит следующим образом: N N ∑ ∑ λi = d−p i0 / d−p i0 λi = 1 , i =1 i=1 где: Веса определяются по следующей формуле: С увеличением расстояния вес уменьшается за счет коэффици ента p. Величина di0 это расстояние между искомой точкой , so, и i той опорной точкой, s . i Параметр степени p влияет на присвоение весов опорным точ кам; это означает, что по мере того, как увеличивается расстоя ние между опорными точками и искомой точкой, влияние (или вес), которое опорная точка будет оказывать на искомую точку, уменьшается по экспоненте. Сумма весов опорных точек, которые будут использованы при выполнении интерполяции, должна быть равна 1. Степенная функция Оптимальное значение p определяется путем минимизации сред неквадратичной ошибки вычислений (RMSPE). Значение сред неквадратичной ошибки является статистической величиной и рассчитывается при перекрестной проверке (см. Главу 7, ‘Ис пользование аналитических инструментов при построении по верхностей’). При перекрестной проверке каждая опорная точка исключается из вычислений и сравнивается с проинтерполиро ванным значением для этого местоположения. Среднеквадра тичная ошибка RMSPE это суммарная статистическая величи на, количественно определяющая ошибку интерполируемой по верхности. Модуль Geostatistical Analyst подставляет несколько вариантов значения степени в формулу метода взвешенных рас стояний (IDW), чтобы определить при каком значении степени среднеквадратичная ошибка минимальна. На графике внизу RMSPE (p) Оптèмàëьíîå зíàчåíèå 114 ARCGIS GEOSTATISTICAL ANALYST показано, как модуль Geostatistical Analyst вычисляет оптималь ную степень. Значение RMSPE наносится на график относи тельно различных степеней, использованных для одного и того же набора данных. Через точки проводится кривая (описывае мая локальным полиномом второй степени), и по этой кривой определяется оптимальное значение степени, при котором сред неквадратичная ошибка минимальна. Веса обратно пропорциональны расстоянию, возведенному в сте пень p. В результате, по мере увеличения расстояния, веса бы стро уменьшаются. Насколько быстро это происходит, зависит от значения p. Если p = 0, с увеличением расстояния веса не уменьшаются, и поскольку каждый вес li будет иметь одно и то же значение, искомый результат будет представлять собой сред нее из всех значений опорных точек. По мере возрастания сте пени p, веса для удаленных точек быстро уменьшаются, что вид но на диаграмме, приведенной внизу. Если значение p очень ве лико, только точки, находящиеся в непосредственной близости от искомой, будут влиять на полученное значение. Поиск соседей Поскольку объекты, расположенные ближе друг к другу более похожи, чем удаленные друг от друга, при удалении точек зна чения опорных точек будут иметь все меньшую взаимосвязь со значением искомой точки. Чтобы ускорить процесс вычисле ния, мы можем принять вес значительно удаленных точек, с небольшим влиянием на искомую точку, за ноль. В результате, обычно ограничивают количество опорных точек, которые бу дут использованы при расчете искомого значения, путем опре деления области поиска соседства. Заданная форма, в пределах которой выбираются соседние точки, ограничивает дальность и направление поиска опорных точек, которые будут использова ны при выполнении интерполяции. На следующем рисунке по казано, какие пять опорных точек (соседей) будут участвовать при вычислении значения искомой точки, обозначенной жел тым цветом. В модуле Geostatistical Analyst используются функции со степе нью выше 1. При значении p = 2 метод носит название интерпо ляции по методу квадратичных взвешенных расстояний (inverse distance squared weighted). ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ 115 Форма области соседства зависит от исходных данных и поверх ности, которую вы хотите построить. Если определение весов не зависит от влияния по направлениям, вы должны учитывать точки равномерно во всех направлениях. Для этого область со седства должна иметь форму круга. Однако, если для ваших дан ных характерно влияние по направлениям, такое, как, напри мер, преобладающий ветер, вы можете использовать для опре деления области соседства эллипс, большая ось которого направ лена параллельно ветру. Регулирование области поиска соседей для такого направленного влияния обоснованно, поскольку вы знаете, что точки, расположенные в направлении по ветру, даже удаленные друг от друга, будут больше похожи, чем точки, рас положенные перпендикулярно к преобладающему направлению ветра. После того, как определена форма области поиска соседей, вы можете также ограничить, какие точки, попадающие в эту об ласть, должны быть использованы. Вы можете определить мак симальное и минимальное количество используемых точек, а также вы можете разделить область поиска соседей на сектора. Если вы разделите эту область на сектора, ограничения по мак симальному и минимальному количеству точек будут примене ны к каждому сектору. Существуют различные способы деления на сектора (см. рисунок внизу). Точки, выделенные в виде данных диалога Поиск соседей, пока зывают опорные точки с весами, которые будут использованы для поиска значения искомой точки в центре эллипса. Соседи попадают в показанный эллипс. В данном примере, двум точкам (красным) в западном секторе и одной в южном секторе будут присвоены веса более 10 процентов. Вес точки (желтой), распо ложенной в северном секторе, будет от 3 до 5 процентов. Один сектор Эллипс с четырьмя секторами Эллипс с восьмью секторами 116 ARCGIS GEOSTATISTICAL ANALYST Поверхность, построенная по методу взвешенных расстояний (IDW), зависит от выбора степени (p) и способа поиска соседей. Метод взвешенных расстояний это жесткий интерполятор, при котором максимальные и минимальные значения на проинтер полированной поверхности (см. рисунок) могут иметь только опорные точки. Результирующая поверхность чувствительна к кластеризации и присутствию в данных экстремальных значе ний. Метод взвешенных расстояний предполагает, что поверх ность была получена с использованием локальной вариации, ко торая может быть учтена с помощью определения области поис ка соседей. Поверхность, полученная по методу взвешенных расстояний Опорные точки ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ 117 Построение поверхности с использованием метода взвешенных расстояний (IDW) Метод IDW предполагает, что поверхность получена на осно ве локальной вариации. Он луч ше работает, если опорные точ ки равномерно распределены по территории и если они не объединены в кластеры. При выполнении интерполяции по методу IDW важны следующие параметры: условия поиска со седей, степень ‘p’, и анизотро пия, если она есть (см. Главу 3, ‘Принципы геостатистического анализа’). Подсказка Использование файла базы данных вместо точечного слоя Вместо слоя ArcMap может быть использован файл базы данных. Для этого в диалоге Выберите исходные данные и метод следует нажать кнопку Пролистать и выбрать требу емый файл базы данных. См. также Для дополнительной информа ции о параметрах, устанавли ваемых в диалоге Поиск сосед ства и изучения диалога Пере крестная проверка, обрати тесь к Главе 7, ‘Использование аналитических инструментов при построении поверхнос тей’. Построение карты проинтерполированных значений 1. В таблице содержания ArcMap выберите точечный слой, который будет исполь зован для интерполяции по методу взвешенных расстоя ний (IDW). 2. Запустите модуль Geostatistical Analyst. 3. В диалоге Выберите вход ные данные и метод в окне Атрибут определите показа тель, на основе значений ко торого будет выполняться интерполяция по методу взвешенных расстояний. 4. Выберите Метод взвешен ных расстояний. 5. Нажмите Далее. 6. В диалоге Задать параметры установите требуемые пара метры и нажмите Далее. 7. Изучите результаты в диало ге Перекрестная проверка и нажмите Готово. 8. В диалоге Информация о ре зультирующем слое нажмите OK. 118 3 4 5 6 ARCGIS GEOSTATISTICAL ANALYST Подсказка Создание учебных и тестовых наборов данных При выполнении проверки ис пользуются два набора данных: учебный и тестовый. Учебный набор данных содержит значе ния опорных точек, которые будут использованы для созда ния модели интерполяции. Тес товый набор данных нужен для подтверждения достоверности полученных данных. Учебный набор данных вводится как На бор данных 1, а тестовый как Набор данных для проверки. См. раздел ‘Выполнение проверки для геостатистического слоя, созданного из поднабора дан ных’, в Главе 9, для дополни тельной информации о создании поднаборов данных. Подсказка Использование проверки Убедитесь, что учебный набор данных содержит достаточное для точного представления по верхности количество опорных точек. Если учебный набор дан ных слишком мал, экстремаль ные (выпадающие) значения дан ных могут исказить парамет ры модели и полученные резуль таты. См. также Для получения дополнительной информации об определении па раметров для диалога Поиск со седства и изучения диалога Пе рекрестная проверка обрати тесь к Главе 7, ‘Использование аналитических инструментов при построении поверхностей’. Создание карты проинтерполированных значений с использованием проверки 1. В таблице содержания ArcMap выберите точечный слой, кото рый будет использован для ин терполяции по методу взвешен ных расстояний. 2. Запустите модуль Geostatistical Analyst. 3. В диалоге Выберите входные данные и метод в окне Атрибут определите показатель, на ос нове значений которого будет выполняться интерполяция по методу взвешенных расстоя ний. 4. Отметьте галочкой опцию Про верка. 5. В меню Входные данные выбе рите точечный слой или проли стайте папки, чтобы найти тре буемый файл. 6. В диалоге Выберите входные данные и метод в окне Атрибут определите показатель, на ос нове значений которого будет выполняться проверка интер поляции по методу взвешен ных расстояний. 7. Выберите Метод взвешенных расстояний. 8. Нажмите Далее. 9. В диалоге Задать параметры установите требуемые парамет ры и нажмите Далее. 10. Изучите результаты в диалогах Перекрестная проверка и Проверка и нажмите Готово. 11. В диалоге Информация о ре зультирующем слое нажмите OK. ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ 34 56 7 8 119 Как работает интерполяция по методу глобального полинома Интерполяция по методу глобального полинома подбирает сгла женную поверхность, построенную по опорным точкам с помо щью математической функции (полинома). Поверхность, пост роенная по методу глобального полинома, меняется постепенно и грубо передает общий характер данных. Поверхность, построенную с помощью интерполяции по методу глобального полинома, можно представить как лист бумаги, раз мещенный так, чтобы он прошел через точки, поднятые до зна чения высоты. На нижнем рисунке это проиллюстрировано для набора опорных точек, отобранных на пологом склоне (лист бу маги показан лиловым цветом). Но плоский лист бумаги не может точно описать ландшафт, в котором есть долина. Однако, если вы один раз перегнете кусок бумаги, вы сможете гораздо лучше подогнать его под форму по верхности. Добавление определенного выражения в математи ческую формулу дает аналогичный результат перегиб плоско сти. Ровная плоскость (на листе бумаги нет перегибов) может быть описана полиномом первой степени (линейной функци ей). Один перегиб плоскости будет соответствовать полиному второго порядка (квадратичная функция), два перегиба по линому третьего порядка (кубическая функция), и так далее, вплоть до 10, максимально возможной для модуля Geostatistical Analyst степени полинома. На следующем рисунке показано, как можно описать долину с помощью полинома второго порядка. Лист бумаги редко будет проходить непосредственно через опор ные точки, что делает метод интерполяции по методу глобально го полинома нежестким интерполятором (метод глобального полинома аппроксимирует значения в опорных точках). Неко торые точки будут расположены над листом бумаги, некоторые ниже. Однако, если вы сложите значения превышений значе ний опорных точек над плоскостью и недобора значений опор ных точек до значений на плоскости, эти две суммы должны быть равны. Поверхность, показанная лиловым цветом, полу чена при подборе плоскости по методу наименьших квадратов. Результирующая поверхность минимизирует сумму квадратов разности между действительными значениями опорных точек и их значениями на плоскости. 120 ARCGIS GEOSTATISTICAL ANALYST Когда использовать интерполяцию по методу глобального полинома Результатом интерполяции по методу глобального полинома яв ляется сглаженная математическая поверхность, которая отра жает постепенные тренды в поверхности изучаемой террито рии. Глобальная интерполяция используется для: 1. Подбора поверхности для опорных точек в том случае, если поверхность медленно меняется от участка к участку на изу чаемой территории (например, загрязнение над промыш ленными территориями). 2. Изучения и/или удаления эффектов длительных или глобаль ных трендов. В таком случае метод часто называют методом анализа тренда поверхности. Интерполяция по методу глобального полинома строит медлен но изменяющиеся поверхности с использованием полиномов маленьких степеней, которые могут описывать некоторые фи зические процессы (например, загрязнение и направление вет ра). Следует заметить, однако, что чем сложнее полином, тем труднее связать с ним некий физический процесс. Кроме того, вычисленные поверхности очень чувствительны к экстремаль ным значениям (очень низким или очень высоким, особенно по краям изучаемой территории). ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ 121 Создание карты с Создание карты использованием метода проинтерполированных значений 3 1. В таблице содержания глобального ArcMap выберите точечный полинома слой, который будет исполь зован для интерполяции по Для построения карты проин методу глобального полинома. 4 терполированных значений ис 2. Запустите модуль пользуйте метод глобального по Geostatistical Analyst. линома. Этот метод дает лучшие 3. В диалоге Выберите входные результаты, если атрибут в пре данные и метод в окне Атри делах изучаемой территории ме бут определите показатель, на няется медленно, а также, если основе значений которого бу вы применяете его для изучения дет выполняться интерполя эффектов глобальных трендов ция по методу глобального или анализа поверхности трен полинома. да. Поверхность, построенная по методу глобального полинома, чувствительна к экстремальным значениям, особенно по краям 4. Выберите интерполяцию по методу глобального полинома и нажмите Далее. 5 изучаемой территории. Модели 5. В диалоге Задать параметры руемый атрибут в пределах изу для интерполяции по методу чаемой территории должен ме глобального полинома опре няться медленно. делите порядок полинома и нажмите Далее. 6. Изучите результаты в диалоге Перекрестная проверка и на жмите Готово. 7. В диалоге Информация о ре зультирующем слое нажмите OK. 122 ARCGIS GEOSTATISTICAL ANALYST Как работает интерполяция по методу локальных полиномов Интерполяция по методу глобального полинома применяет по лином ко всей поверхности. Интерполяция по методу локаль ных полиномов использует несколько полиномов, каждый из которых подбирается для отдельного участка (участки граничат между собой и перекрываются). Поиск соседей может быть оп ределен с использованием диалога Поиск соседства (см. раздел об интерполяции по методу взвешенных расстояний в этой главе и Главу 7, ‘Использование аналитических инструментов при по строении поверхностей’). В диалоге могут быть определены форма области поиска, максимальное и минимальное количест во используемых точек и конфигурация секторов поиска. Поми мо этого, можно задать ширину полосы поиска наряду с параме тром степени, который, в зависимости от расстояния, будет уменьшать веса опорных точек, попадающих в область соседст ва. Таким образом, интерполяция по методу локального полино ма позволяет строить поверхности, больше учитывающие ло кальную вариацию. Глобальный полином первого порядка позволяет провести через опорные точки ровную поверхность; глобальный полином вто рого порядка описывает поверхность с перегибом, что позволя ет использовать его для участков с долиной; глобальный поли ном третьего порядка допускает наличие двух перегибов в по верхности; и т.д. Однако, в тех случаях, когда у поверхности другая форма, как в нашем примере, когда сначала мы видим склон, затем поверхность выравнивается, а затем снова образу ет склон, единый глобальный полином не сможет достаточно хорошо описать форму поверхности. Более точно отразить ха рактер поверхности смогут несколько плоскостей, построенных с использованием полиномов (см. нижний рисунок). Интерполяция по методу локальных полиномов подбирает по лином определенной степени (например, нулевой, первой, вто рой и третьей), используя точки только из заданной области со седства. Соседние области перекрываются, и значение, исполь зуемое для каждой искомой точки это значение подобранного полинома в центре области соседства. На нижнем рисунке приведен профиль для опорных точек со значениями высот (поперечный разрез). На левом рисунке, по казаны три соседние точки (обозначены красным цветом), ис пользованные для расчета полинома первой степени и линия полинома (красная линия), по которой получено значение иско мой точки, обозначенной голубым цветом. Значение второй точ ки (обозначенной на правом рисунке желтым цветом) вычисле но с использованием другого полинома первой степени. Точка расположена очень близко к первой точке, и в вычислениях были использованы те же самые опорные точки; но присвоенные им веса немного отличались друг от друга, поэтому и подобранный полином (голубая линия) несколько отличается от первого. ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ 123 Этот процесс повторяется, при этом центр смещается в последу ющую искомую точку, и для определения значений этих точек подбираются локальные полиномы. На двух нижних рисунках показаны еще две искомые точки, вычисленные в процессе по строения результирующей поверхности. Значение оранжевой точки получено по подобранному полиному, показанному зеле ной линией, на основе значений зеленых опорных точек. Значе ние коричневой точки получено с использованием полинома, показанного сиреневым цветом. На двух следующих рисунках отображены еще два подобран ных полинома (желтая и серая линия) для двух искомых точек (бирюзовая и зеленая точки). Этот процесс повторяется для всех точек. На нижнем рисунке вы можете видеть, как строится поверхность (малиновая ли ния) для опорных точек. Модель оптимизируется путем повторяющейся перекрестной проверки результирующих поверхностей, рассчитанных с ис пользованием различных параметров. Оптимальный параметр выбирается таким образом, чтобы минимизировать среднеквад ратичную ошибку подобно тому, как это делается при выборе параметра степени ‘p’ при использовании интерполяции по ме тоду взвешенных расстояний (IDW). Когда использовать локальную интерполяцию Интерполяция по методу глобального полинома может быть ис пользована для построения сглаженных поверхностей и для оп ределения трендов длительного воздействия в наборе данных. Однако, в науках о Земле изучаемая переменная, как правило, изменчива в короткий период времени и, вместе с тем, имеет долговременный тренд. Когда в наборе данных проявляется кратковременная вариация (или вариация на микроуровне), карты, построенные при помощи метода локальной интерполя ции, могут помочь выявить эту кратковременную вариацию. Интерполяция с использованием локальных полиномов чувст вительна к расстоянию до соседних точек. По этой причине, вы можете предварительно просмотреть данные перед тем, как со здать результирующий слой. Как и в случае с интерполяцией по методу взвешенных расстоя ний, вы можете определить модель, которая учитывает анизот ропию (обратитесь к разделу этой главы, посвященному методу взвешенных расстояний) . 124 ARCGIS GEOSTATISTICAL ANALYST Создание карты с использованием интерполяции по методу локальных полиномов Метод интерполяции с использо ванием локальных полиномов не является жестким интерполято ром (аппроксимирует значения в опорных точках). С его помощью строится сглаженная поверх ность. Лучше ее применять, ког да данным присуща кратковре менная вариация (вариация на микроуровне). См. также Для дополнительной информа ции об определении параметров в диалоге Поиск соседства и изучения диалога Перекрестной проверки обратитесь к Главе 7, ‘Использование аналитических инструментов при построении поверхностей’. Создание карты проинтерполированных значений 1. В таблице содержания ArcMap выберите точечный слой, который будет исполь зован для интерполяции по Методу локальных полино мов. 2. Запустите модуль Geostatistical Analyst. 3. В диалоге Выберите входные данные и метод в окне Атри бут определите показатель, на основе значений которого бу дет выполняться интерполя ция по методу локальных по линомов. 4. Выберите метод интерполя ции с использованием ло кальных полиномов. 5. Нажмите Далее. 6. В диалоге Задать параметры определите параметры, кото рые вы будете использовать при выполнении интерполя ции по методу локальных по линомов и нажмите Далее. 7. Изучите результаты в диалоге Перекрестная проверка и на жмите Готово. 8. В диалоге Информация о ре зультирующем слое нажмите OK. ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ 3 4 5 6 125 Как работает интерполяция с использованием радиальных базисных функций Радиальные базисные функции (Radial basis functions RBF) это целый ряд жестких методов интерполяции; то есть, поверх ность, построенная с использованием этих функций, будет про ходить через все опорные точки. Существует пять различных видов функций: плоский сплайн, сплайн с натяжением, полно стью регуляризованный сплайн, функция мультиквадриков, и обратный мультиквадрик. Каждая радиальная функция имеет различную форму и результаты для различных поверхностей интерполяции. Методы RBF форма искусственных нейрон ных сетей. Методы RBF концептуально похожи на метод “резинового лис та”, когда лист проходит через все опорные точки, и при этом минимизируется общая кривизна поверхности. Выбранная ба зисная функция определяет, как резиновый лист пройдет через опорные точки. На диаграмме внизу наглядно показано, как поверхность, построенная с использованием радиальной базис ной функции RBF, проходит через опорные точки с высотами. На профиле обратите внимание, что поверхность проходит че рез значения опорных точек. Будучи жесткими интерполяторами, методы RBF отличаются от интерполяторов, использующих глобальные и локальные по линомы, поскольку эти два метода являются нежесткими ин терполяторами и не предполагают прохождения поверхности через опорные точки (аппроксимируют значения в опорных точ ках). При сравнении методов с использованием радиальных ба зисных функций и метода взвешенных расстояний, другого жесткого интерполятора, следует отметить, что метод IDW ни когда не даст значений, которые будут выше максимальных или ниже минимальных значений опорных точек (см. приведенные ниже профили). Опорные точки Поверхность, построенная с использованием метода взвешенных расстояний Опорные точки Поверхность, построенная с использованием радиальных базисных функций 126 ARCGIS GEOSTATISTICAL ANALYST В отличие от метода взвешенных расстояний, функции RBF могут давать значения выше максимальных и ниже минималь ных измеренных значений (см. нижний разрез на рисунке на стр.126). Оптимальные параметры функций определяются так же, как и для метода взвешенной интерполяции и локальных полиномов с использованием перекрестной проверки (см. раздел этой гла вы, посвященный методу взвешенных расстояний). Когда использовать радиальные базисные функции Радиальные базисные функции используются для построения сглаженных поверхностей для большого количества опорных точек. Функции дают хорошие результаты для плавно меняю щихся поверхностей, таких как рельеф. Эти методы не подходят в тех случаях, когда на поверхности происходит резкое изменение значений на коротком расстоя нии по горизонтали и/или в тех случаях, когда вы предполагае те, что в исходных данных могут быть ошибки или неточности. Теоретические основы использования радиальных базисных функций В модуле Geostatistical Analyst радиальные базисные функции формируются над каждой опорной точкой. РБФ это функция, которая меняется с расстоянием. Например, на следующем ри сунке показаны три точки, и для каждой из них функция РБФ показана своим цветом. ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ z 6 4 2 0 1 3579 x φ3 φφ21 127 В данном примере, радиальная базисная функция просто рас стояние от каждой точки, поэтому над каждой точкой она обра зует перевернутый конус. Если вы посмотрите на сечение плос кости x,z для значения y = 5 (второй рисунок на предыдущей странице), вы увидите разрез каждой из приведенных РБФ. Теперь предположим, что вам надо найти значение функции для точки y = 5, x = 7. Значение каждой из рассматриваемых функ ций RBF в искомой точке может быть определено по графику, показанному на рисунке, (значения обозначены буквами f , f и 12 f ) и зависит от расстояния до каждой из точек. Интерполятор 3 образуется путем нахождения взвешенного среднего w1f1 + w2 f2 + w f +…. Вопрос заключается в том, как определить эти веса? 33 Ведь вы совсем не использовали значения данных! Веса w1, w2, w , и так далее, должны удовлетворять следующему условию: 3 если искомая точка будет помещена в точку с измеренным зна чением, значение данных будет проинтерполировано точно. Это приводит к образованию системы из N уравнений с N неизвест ными, для которой могут быть найдены однозначные решения. Таким образом, поверхность проходит через опорные точки, то есть интерполятор является жестким. Функция RBF, приве денная выше, является особым случаем мультиквадриков. В модуле Geostatistical Analyst можно также использовать другие функции РБФ, такие как полностью регуляризованный сплайн, плоский сплайн, сплайн с натяжением, и обратные мультиквад рики. Часто разница между ними невелика, но у вас могут быть причины для выбора одной из них, либо вы можете попробовать использовать несколько функций, а затем для выбора оконча тельной применить перекрестную проверку. Каждая функция РБФ имеет параметр, который контролирует “сглаживание” поверхности. Для всех методов, за исключением обратных мультиквадриков, чем выше значение параметра, тем выше сглаживание поверх ности; обратное утверждение верно для функции обратных муль тиквадриков. 128 ARCGIS GEOSTATISTICAL ANALYST Создание карты с использованием интерполяции на основе радиальных базисных функций Функции РБФ жесткие интер поляторы, которые строят сгла женные поверхности. Они дают хорошие результаты для плавно меняющихся поверхностей. По скольку интерполяторы являют ся жесткими, функции РБФ мо гут быть чувствительны к экстре мальным (выпадающим) значе ниям. См. также Для дополнительной информа ции об определении параметров в диалоге Поиск соседства и изучения диалога Перекрестной проверки обратитесь к Главе 7, ‘Использование аналитических инструментов при построении поверхностей’. Создание карты проинтерполированных значений с использованием функций RBF 1. В таблице содержания ArcMap выберите точечный слой, который будет исполь зован для интерполяции с ис пользованием радиальных ба зисных функций. 2. Запустите модуль Geostatistical Analyst. 3. В диалоге Выберите входные данные и метод в окне Атри бут определите показатель, на основе значений которого бу дет выполняться интерполя ция с использованием ради альных базисных функций. 4. Выберите метод Радиальные базисные функции. 5. Нажмите Далее. 6. В диалоге Задать параметры для интерполяции с использо ванием РБФ в открывающем ся списке Кернфункции вы берите нужную радиальную функцию. 7. В диалоге Задать параметры задайте необходимые параме тры для выбранной РБФ и на жмите Далее. 8. Изучите результаты в диалоге Перекрестная проверка и на жмите Готово. 9. В диалоге Информация о ре зультирующем слое нажмите OK. ДЕТЕРМИНИСТСКИЕ МЕТОДЫ ИНТЕРПОЛЯЦИИ ПРОСТРАНСТВЕННЫХ ДАННЫХ 3 4 5 6 7 129 s Построение поверхности с использованием методов геостатистики 6 В ЭТОЙ ГЛАВЕ • Что такое геостатистические методы интерполяции? • Изучение моделей кригинга • Изучение результирующих поверхностей • Создание карты с использованием параметров, предложенных по умолчанию • Изучение преобразований и трендов • Картографирование с применением методов: • Ординарного кригинга • Простого кригинга • Универсального кригинга • Индикаторного кригинга • Вероятностного кригинга • Дизъюнктивного кригинга • Кокригинга В предыдущей главе вы познакомились с детерминистскими методами интер поляции. Детермининистские методы используют взаимное расположение опорных точек для построения поверхности (Метод взвешенных расстояний) или на основе значений опорных точек подбирают математическую функцию, описывающую поверхность (глобальный и локальный полиномы и радиальные базисные функции). В этой главе будет дан обзор различных геостатистичес ких методов интерполяции. Как следует из их названия, геостатистические ме тоды строят поверхность с учетом статистических свойств используемых дан ных. Поскольку геостатистика основывается на статистике, эти методы позво ляют строить не только поверхности интерполируемых значений, но также по верхности ошибок и неопределенности интерполяции, что помогает вам оце нить ее качество. Многие методы связаны с геостатистикой, но все они относятся к семейству кригинга. В модуле Geostatistical Analyst возможно использование ординарно го, простого, универсального, вероятностного, индикаторного и дизъюнктивно го кригинга, наряду с дополняющим их кокригингом. Эти методы кригинга не только строят поверхности интерполируемых значений и ошибок, но они мо гут быть также использованы для создания карт вероятности и квантилей. Кригинг разделен на две отдельные задачи: количественная оценка пространст венной структуры данных и вычисление искомых значений. Количественная оценка структуры, известная как вариография, это подбор пространственно зависимой модели для ваших данных. Чтобы найти неизвестное значение в оп ределенной точке, кригинг воспользуется подобранной при вариографии моде лью, взаимным расположением (конфигурацией) пространственных данных и значениями опорных точек, находящихся в окрестностях искомой точки. Мо дуль Geostatistical Analyst предоставляет множество инструментов, которые помогают вам в определении требуемых параметров. Кроме того, вы можете воспользоваться параметрами, предлагаемыми по умолчанию. 131 Что такое геостатистические методы интерполяции? Геостатистика, в своем начальном понимании, означала статис тику “о Земле”, используемую в географии и геологии. Сейчас геостатистика широко используется во многих областях и обра зует ветвь пространственной статистики. Изначально, в прост ранственной статистике, понятие геостатистики было синони мом кригинга, являющегося статистической версией интерпо ляции. В настоящее время определение расширено и включает в себя не только метод кригинга, но и многие другие методы интерполяции, включая детерминистские методы, рассмотрен ные в Главе 5, ‘Детерминистские методы интерполяции прост ранственных данных ’. Модуль Geostatistical Analyst это реали зация такого расширенного определения геостатистики. Одна из существенных особенностей геостатистики состоит в том, что изучаемое явление имеет значение (не обязательно измерен ное) в любой точке изучаемой территории, например, количест во нитратов в почве или концентрация озона в атмосфере, т.е. является непрерывным. Важно уметь определить типы данных, которые могут быть соответственным образом проанализирова ны с использованием методов геостатистики. Предположим, что показанный внизу прямоугольник изучаемая нами террито рия. Точки на ней обозначены буквами s , а номер каждой кон i кретной точки нижним индексом i. жете поместить точку s0 в любой точке изучаемой территории, и в этой точке s данные имеют какое то действительное значе 0 ние. Например, если данные включают значения содержания нитратов s1, ..., s7, то в точке s0 содержание нитратов имеет какое то значение, которое вы не измерили, но хотите вычис лить. Обратите внимание, что данные отбираются так, как буд то вы измеряете точечные события, в то время как содержание нитратов имеет площадное распространение, то есть такие дан ные являются пространственно непрерывными. В статистике эти значения часто характеризуются, как относя щиеся к одному из следующих типов: • Непрерывное; любое число, например, 1.4789, 10965.6891, и т. п. • Целое, например, … 2, 1, 0, 1, 2, … • Ранжированное качественное значение; например, худший, средний, лучший • Неранжированное качественное значение; например, лес, сельскохозяйственные земли, городская застройка • Бинарное; например, 0 или 1 Слово “непрерывное” может вызвать в данном случае некото рую путаницу. Если данные пространственно непрерывны и имеют непрерывное значение при многомерном нормальном распределении, а также если вам известна корреляция много мерного распределения, в таком случае, кригинг является опти мальным интерполятором. Однако, если учесть, что различные формы кригинга разрабатывались так, чтобы вместить все пе речисленные выше типы данных, кригинг метод аппроксима ции, который хорошо работает на практике. Предположим, что вы отобрали данные в точках с s1 по s7, и хотите найти значение точки s , показанной красным цветом. 0 Это пример интерполяции. Кригинг предполагает, что вы мо 132 ARCGIS GEOSTATISTICAL ANALYST Изучение различных моделей кригинга Методы кригинга полагаются на математические и статистиче ские модели. Учет вероятности в статистической модели отлича ет методы кригинга от детерминистских методов, описанных в Главе 5, ‘Детерминистские методы интерполяции пространст венных данных’. При кригинге вы связываете некую вероят ность с выполняемой вами интерполяцией; это означает, что зна чения не могут быть получены по статистической модели абсо лютно точно. Рассмотрим пример с измеренными значениями содержания нитратов в почве. Очевидно, что даже при наличии большой выборки, вы не сможете вычислить точное значение содержания нитратов в какой нибудь конкретной точке, в ко торой измерения не проводились. Следовательно, вы можете только попытаться проинтерполировать ее значение, и при этом оценить ошибку интерполяции. Методы кригинга основываются на понятии корреляции. Кор реляцию часто определяют как тенденцию двух типов перемен ных к взаимозависимости. Например, уровень цен на фондовой бирже имеет тенденцию к позитивным изменениям при низком спросе, поэтому говорят, что они обратно коррелируют. Кроме того, можно утверждать, что уровень цен на бирже имеет поло жительную корреляцию, что означает, что он коррелирует сам с собой. На фондовом рынке два значения цены будут иметь тен денцию к совпадению, если они относятся к двум датам, следую щим одна за другой, в отличие от дат, которые разделяет год. Величина, при которой корреляция исчезает, может быть вы ражена как функция расстояния. На следующем рисунке корреляция показана как функция рас стояния. Это определяющая характеристика геостатистики. В классической статистике предполагается, что наблюдения явля ются независимыми; следовательно наблюдения не коррелиру ют между собой. В геостатистике, информация о положении точек наблюдения в пространстве позволяет вам вычислить рас стояния между точками наблюдения и смоделировать корреля цию как функцию расстояния. Кîððåëÿцèÿ ÀÂÒÎКÎРРÅËЯЦИЯ Ðàññтîÿíèå Также обратите внимание, что в целом, цены фондового рынка растут, и такая тенденция носит название “тренда”. Для гео статистических данных, вы оперируете теми же терминами, которые могут быть выражены простой математической фор мулой, Z(s) = µ(s) + ε(s), где Z(s) интересующая нас переменная, разложенная на де терминистский тренд m(s), и случайные, коррелирующие ошиб ки e (s). Символ s просто указывает на положение точки; то есть обладает координатами x (долгота) и y (широта). Различные варианты этой формулы образуют основу для различных типов кригинга, поэтому она стоит усилий, потраченных на ознаком ление с ней. Не имеет значения, насколько сложным в модели является тренд, составляющая m(s) все равно не сможет дать точных проинтерполированных значений. В этом случае, делаются не которые допущения относительно ошибки e (s); а именно, пред полагается, что среднее значение ошибки будет равно 0 и кор реляция между e (s) и e (s+h) не зависит от действительного положения точки s, а только от взаимного расположения двух точек, или расстояния h. Это необходимо ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 133 для оценки функции корреляции. Например, для примера на следующем рисунке, предполагается, что случайные ошибки для пар точек, соединенных стрелками, будут одинаково коррели ровать. s1+h s1 s2 s2+h Далее, изучите тренд. Он может быть простой константой; то есть, m(s) = m для всех точек , и если m известно, это и является моделью, на которой основан ординарный кригинг. Он также может быть представлен линейной функцией самих простран ственных координат, например, m(s) = b 0 + bx 1 + by 2 + b x2 3 + b y2 4 + b5xy, где поверхность тренда представлена полиномом второй степе ни и является линейной регрессией пространственных коорди нат x и y. Тренды, которые варьируют, и для которых коэффи циенты регрессии неизвестны, образуют модели универсально го кригинга. Если же полностью известен тренд (т.е., известны все параметры и ковариаты), независимо от того, является он постоянным или нет, он образует модель для простого кригинга. Теперь рассмотрим левую часть выражения, Z(s) =m (s) +e (s). Вы можете выполнить преобразования значения Z(s). На пример, вы можете изменить его на индикаторную перемен ную, то есть значениям Z(s) будет присвоен 0, если они ниже некоторой величины (например, 0.12 ppm для концентрации озона) или 1, если они превышают какое либо значение. Затем, вы можете спрогнозировать вероятность того, что значения Z(s) выше порогового, и такая интерполяция будет носить назва ние индикаторного кригинга. Вы можете также выполнить об щие преобразования для значений Z(s), назвав их функцией f (Z(s )) для i той переменной. Из функций переменных вы мо i i жете образовать интерполяторы; например, если вы хотите найти значение показателя в точке s0, вы формируете интерпо лятор дизъюнктивного кригинга из значений функции g(Z(s0)) с использованием данных функции fi(Z(s ) i ). В модуле Geostatistical Analyst, функция g либо индикаторное преобразо вание, либо отсутствие преобразования. И наконец, рассмотрим случай, когда у вас есть больше одного типа переменных, и вы формируете модели Zj(s) = mj (s) + ej (s) для j того типа переменной. Вы можете учесть различные трен ды для каждой переменной, и помимо этого, автокорреляцию для ошибок ej (s); существует также взаимная корреляция меж ду ошибками e (s) и e (s) для двух типов переменных. Напри j k мер, вы можете учесть взаимную корреляцию между двумя пе ременными, такими как концентрация озона и определенного вещества, и они необязательно должны быть измерены в одних и тех же точках. Модели, основанные на более чем одной пере менной, образуют базу для кокригинга. Вы можете создать ин дикаторную переменную для значений Z(s) и, если вы будете вычислять искомое значение с использованием исходных непре образованных данных Z(s) в модели кокригинга, вы получите вероятностный кригинг. Если изначально у вас есть более одной переменной, для которой вы хотите интерполировать поверх ность, вы можете рассматривать ординарный кокригинг, уни версальный кокригинг, простой кокригинг, индикаторный кок ригинг, вероятностный кокригинг и дизъюнктивный кокригинг, как многовариантные расширения различных типов кригинга, описанных ранее. 134 ARCGIS GEOSTATISTICAL ANALYST Изучение типов результирующих поверхностей Кригинг и кокригинг методы интерполяции, и их цель пост роить поверхность предполагаемых (проинтерполированных) значений. Вы можете также захотеть получить ответ на вопрос: “Насколько точны полученные значения?” Можно создать три типа карт предполагаемых значений, и два из них имеют свя занные с ними стандартные ошибки. На предыдущих страни цах, методы кригинга были сгруппированы по типу моделей, которые они используют; в этом разделе мы приводим их клас сификацию по целям использования. Рассмотрим следующий ри сунок. Предполагается, что искомые значения в трех точках под чиняются нормальному закону распределения. можно построить карту вероятности для всей поверхности. Рас смотрим три правых рисунка. Квантиль с пятью процентами вероятности в правой части распределения будет равен значе нию, полученному при пересечении пунктирной линией оси x. Снова заметим, что распределение проинтерполированных зна чений меняется с каждой точкой. Таким образом, сохраняя зна чение вероятности постоянным, для всей поверхности можно построить карту квантилей. Для карт проинтерполированных значений и для карт вероятности могут быть созданы карты стан дартных ошибок. В таблице даны различные методы и резуль тирующие карты, которые могут быть построены с их помо щью, а также основные ограничения для каждого из методов. Кригинг и Кокригинг Ординарный Универсальный Простой Показатель Вероятность Дизъюктивный Расчет √ √ √ Стандартная ошибка расчета √ √ √ Карта Квант илей √ * √ * √ * √ + √ + Карта вероятностей √ * √ * √ * √ √ √ + Стандартная ошибка показателей √ √ √ + * Требует многомерного нормального распределения + Требует парного двумерного нормального распределения В таком случае, искомое значение будет находиться в центре каждой кривой, и можно построить карту проинтерполирован ных значений для всей поверхности. Рассмотрим три левых ри сунка. Вероятность того, что значение в искомой точке превы сит пороговое значение, к примеру, равное 1, равна площади под кривой справа от пунктирной линии. Распределение проин терполированных значений меняется с добавлением каждой точ ки. Таким образом, сохраняя пороговое значение постоянным, ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 135 Создание карты по методу кригинга с использованием параметров, предложенных по умолчанию Использование параметров, предлагаемых по умолчанию 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить кригинг. Результирующая поверхность создается с использованием ме тода ординарного кригинга на основе параметров, предлагае мых по умолчанию. Воспользуйтесь этим методом, если вы незнакомы с геостатис тикой и многими параметрами, указанными в диалогах мастера операции; либо если вы хотите визуально изучить данные, пред ставив их в картографическом виде; и наконец, если вы хотите построить предварительную по верхность, которая позволит определить, как настройка па раметров может повлиять на результирующую поверхность. 2. Запустите Мастер операций геостатистики. 3. В окне Атрибут выберите по казатель, для которого вы хо тите выполнить интерполяцию по методу кригинга. 4. Из списка методов выберите Кригинг. 5. Нажмите Далее. 6. Во всех последующих диало гах нажимайте Далее. 7. В диалоге Перекрестная про верка нажмите Готово. 8. В диалоге с информацией о результирующем слое нажми те OK. Данные в опорных точках долж ны относиться к явлению, име ющему непрерывное распреде ление в пространстве. 4 Подсказка Использование кнопки Готово После того, как вы определили данные и метод в первом диало ге, вы можете нажать кнопку Готово. Модуль построит по верхность с параметрами, предложенными для данного ме тода по умолчанию. 136 1 2 3 5 ARCGIS GEOSTATISTICAL ANALYST Изучение преобразований и трендов Кригинг, как интерполятор, не выдвигает к данным требования нор мальности распределения. Однако, как вы видели в предыдущем разделе, подчинение данных закону нормального распределения обя зательно для создания карт вероятности и карт квантилей для орди нарного, простого и универсального кригинга. Если рассматривать только интерполяторы, которые образованы на основе взвешенных средних, кригинг лучший интерполятор, отвечающий условию не смещенности оценки, независимо от того, имеют ли ваши данные нормальное распределение. Однако, если данные подчиняются зако ну нормального распределения, кригинг является лучшим интерпо лятором среди всех несмещенных интерполяторов, а не только тех, которые основываются на использовании средневзвешенных значе ний. Кригинг также использует предположение, что все случайные ошибки обладают свойством стационарности второго порядка, что предполагает, что случайные ошибки имеют нулевое среднее значе ние, и что две случайные ошибки зависят только от расстояния, ко торое их разделяет, и направления вектора, соединяющего эти точ ки, а не от их точного местоположения. Преобразования и исключе ние тренда из данных может помочь подтвердить предположение о нормальности и стационарности. Интерполяция с использованием ординарного, простого и универсального кригинга для общих преоб разований по методу Box–Cox и с использованием арксинуса, носит название трансгауссова кригинга. Логарифмическое преобразование это особый случай преобразования по методу Box–Cox, оно облада ет специальными свойствами при интерполяции и носит название логарифмически нормального (или логнормального) кригинга. Здесь показаны опции преобразований и анализа тренда, которые доступ ны для каждого метода кригинга. В таблицах показано также, что выполняется в первую очередь: вычитание тренда или преобразова ние в том случае, если выбраны обе опции. Подробности о преобразо ваниях и трендах приведены в Главе 7, ‘Использование аналитичес ких инструментов при построении поверхностей’. Преобразование и тренд для первой переменной: Тип кригинга OK SK UK IK PK* DK BAL yes (1st if TR) yes yes (1st if T) no no yes (1st if TR) NST no yes no no no yes (2nd if TR) Тренд TR (2nd if BAL) no T (2nd if BAL) no no TR (1st if NST, 2nd if BAL) Преобразование и тренд для второй переменной (кокригинг): Тип кригинга OK SK UK IK PK DK BAL yes (1st if TR) yes yes (1st if T) no yes (1st if TR) yes (1st if TR) Определения NST no yes no no no yes (2nd if TR) Тренд TR (2nd if BAL) no T (2nd if BAL) no TR (2nd if BAL) TR (1st if NST, 2nd if BAL) Тренд: фиксированное воздействие, составленное из простран ственных координат, использованных в линейной модели Первая (первичная) переменная: переменная, для которой вы числяются значения с использованием кригинга или кокригинга Вторые (вторичные) переменные: сопеременные (значения ко торых не вычисляются) при использовании кокригинга Сокращения BAL—преобразования по методу Box–Cox, арксинуса и лога рифмические NST—преобразование по методу нормальных меток TR—вычитание тренда, или внешний тренд T—тренд, или внутренний тренд SV—вторичная переменная, или значения ковариат для кокри гинга *Примечание: Для PK (вероятностного кригинга), первичные перемен ные состоят из индикаторов исходной переменной —эта исходная пере менная затем рассматривается как вторая переменная для кокригинга. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 137 Что такое ординарный кригинг? Ординарный кригинг использует модель, Z(s) = µ + ε (s), где m неизвестная постоянная. Один из основных моментов, касающихся ординарного кригинга, является ли предположе ние о постоянном среднем оправданным. Иногда существуют веские научные причины для того, чтобы отбросить это предпо ложение. Однако, являясь простым методом интерполяции, он обладает удивительной гибкостью. Следующий рисунок при мер для одного пространственного измерения. стантой m ) или трендом (когда значение m(s) меняется с каж дой точкой s). Часто это решение зависит от решаемой научной задачи. Ординарный кригинг может использовать либо вариограмму, либо ковариационные функции (которые являются математи ческим описанием автокорреляции), он может использовать преобразования и вычитание тренда, и он может также допус тить наличие ошибок в измерениях; см. Главу 7, ‘Использование аналитических инструментов при построении поверхностей’, для более подробной информации. По рисунку можно предположить, что эти данные представляют собой отметки высот, полученные по линии, пересекающей до лину и гору. Также можно предположить, что данные имеют больший разброс слева и более сглажены справа. На самом деле, эти данные были получены с использованием модели ординарно го кригинга с постоянным средним m. Истинное, но неизвест ное среднее показано пунктирной линией. Таким образом, ор динарный кригинг может быть использован для данных, в кото рых, возможно, присутствует тренд. Нет способа решить, осно вываясь только на данных, является ли изучаемый участок ре зультатом только автокорреляции (между ошибками e (s) с кон 138 ARCGIS GEOSTATISTICAL ANALYST Создание карты с Создание карты использованием ординарного проинтерполированных значений кригинга 1. В таблице содержания ArcMap выберите точечный Используйте ординарный кри гинг для создания карт проинтер полированных значений, кванти лей, вероятности и карт стан дартных ошибок. Он учтет неиз слой, для которого вы хотите выполнить интерполяцию по методу ординарного кригинга. 2. Запустите модуль вестное постоянное значение. Geostatistical Analyst. Данные, полученные в опорных точках, должны относиться к не прерывному явлению. Подсказка 3. В окне Атрибут выберите по казатель, для которого вы хо тите выполнить интерполяцию по методу ординарного кри Важные параметры гинга. Соответствующее преобразова ние, возможное вычитание трен 4. Из списка методов выберите 4 да из поверхности, модели вари Кригинг. ограммы/ковариации и область 5. Нажмите Далее. поиска соседства. Подсказка 6. Из меню Ординарный кри 6 Использование файла базы данных вместо точечного слоя гинг выберите опцию Интер поляция. В диалоге Выберите входные дан 7. Нажмите Далее. ные и метод вместо слоя ArcMap может быть выбран файл базы 8. В диалоге Моделирование ва данных. Для этого надо нажать риограммы/ковариации за кнопку Пролистать и выбрать дайте требуемые параметры и соответствующий файл из базы данных. См. также Для дополнительной информации о преобразованиях, вычитании трен нажмите Далее. 9. В диалоге Поиск соседства задайте требуемые параметры поиска и нажмите Далее. да, определении параметров в диа 10. В диалоге Перекрестная про логах Моделирование вариограм мы/ковариации и Поиск соседства, а также для изучения диалога Пе рекрестная проверка, обратитесь к Главе 7, ‘Использование аналити ческих инструментов при постро верка изучите полученные результаты и нажмите Готово. 11. В диалоге с информацией о результирующем слое на жмите OK. ении поверхностей’. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 3 5 7 139 Подсказка Создание учебного и тестового наборов данных При выполнении проверки, ис пользуются два набора дан ных: учебный набор данных и тестовый набор данных. Учеб ный набор данных содержит опорные точки, по которым будет выполняться интерпо ляция. Тестовый набор данных будет использован для провер ки вычислений. Учебный набор данных вводится как Набор данных 1, а тестовый набор данных как Проверочный на бор данных. См. раздел ‘Выпол нение проверки для геостатис тического слоя, созданного из поднабора данных’ в Главе 9 для получения дополнительной ин формации о создании поднабо ров данных. Подсказка Использование проверки Убедитесь, что учебный набор данных содержит достаточ ное для точного представления поверхности количество опор ных точек. Если учебный набор слишком мал, экстремальные значения данных могут смес тить параметры модели и ис казить полученные результа ты. Создание карты стандартных ошибок интерполяции 1. В таблице содержания ArcMap на жмите правую клавишу мыши на поверхности проинтерполирован ных значений, построенной с ис пользованием ординарного кри гинга, и из контекстного меню выберите опцию Построить карту стандартных ошибок интерполя ции. Создание карты проинтер полированных значений с использованием проверки 1. В таблице содержания ArcMap выберите точечный слой, для ко торого вы хотите выполнить интер поляцию по методу ординарного кригинга. 2. Запустите модуль Geostatistical Analyst. 3. В окне Атрибут выберите показа тель, для которого вы хотите вы полнить интерполяцию по методу ординарного кригинга. 4. Из списка методов выберите Кри гинг. 5. Отметьте галочкой опцию Провер ка и задайте набор данных и пока затель, которые будут использова ны при проверке. 6. Нажмите Далее. 7. Повторите шаги с 6 по 10 упраж нения ‘Создание карты проинтер полированных значений’ с преды дущей страницы, изучите полу ченные результаты в диалоге Про верка и затем нажмите Готово. 140 1 35 4 6 ARCGIS GEOSTATISTICAL ANALYST Подсказка Создание карты Применение инструментов проинтерполированных ESDA для определения значений с параметров модели Воспользуйтесь инструмента ми исследовательского анализа применением преобразований пространственных данных (ESDA) для принятия решений по преобразованиям, вычита нию тренда и наличию эффек та выпадающих (экстремаль ных) значений в моделях варио граммы/ковариации. Подтвер дите свое решение с использо 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить интерполяцию по методу ординарного кригинга. 2. Запустите модуль Geostatistical Analyst. ванием проверки и перекрест 3. Выберите атрибут, для которо ной проверки. го вы хотите выполнить орди 4 См. также нарный кригинг. 4. Из списка методов выберите Для дополнительной информа Кригинг. ции о преобразованиях и опре 6 делении параметров в диалогах 5. Нажмите Далее. Моделирование вариограммы/ ковариации и Поиск соседства, а также для изучения диалога Перекрестная проверка, обра титесь к Главе 7, ‘Использова 6. Откройте список для строки Ординарный кригинг и выбе рите опцию Карта проинтер полированных значений. ние аналитических инструмен 7. Из меню Преобразование вы тов при построении поверхно берите требуемый метод пре стей’. образования. 8. Нажмите Далее. 9. Выполните шаги с 9 по 12 уп ражнения ‘Создание карты проинтерполированных зна чений с использованием ме тода вычитания тренда’, кото рое дано на следующей стра нице. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 3 5 7 8 141 Подсказка Вычитание тренда После того, как значение трен да будет вычтено из исходных данных, ординарный кригинг будет выполнен для значений остатков. См. также Для дополнительной информа ции о преобразованиях, вычи тании тренда, определении па раметров в диалогах Моделиро вание вариограммы/ковариации и Поиск соседства, а также для изучения диалога Перекре стная проверка, обратитесь к Главе 7, ‘Использование анали тических инструментов при построении поверхностей’. Создание карты проинтерполированных значений с использованием метода вычитания тренда 1. В таблице содержания ArcMap вы берите точечный слой, для которого вы хотите выполнить интерполяцию по методу ординарного кригинга. 2. Запустите модуль Geostatistical Analyst. 3. В окне Атрибут выберите показатель, для которого вы хотите выполнить интерполяцию по методу ординарно го кригинга. 4. Из списка методов выберите Кри гинг. 5. Нажмите Далее. 6. Из списка Ординарный кригинг вы берите опцию Карта проинтерполи рованных значений. 7. В окне Порядок вычитаемого тренда выберите необходимую опцию. 8. Нажмите Далее. 9. В диалоге Вычитание тренда задайте необходимые параметры и нажмите Далее. 10. Задайте необходимые параметры в диалоге Моделирование вариограм мы/ковариации и нажмите Далее. 11. Задайте необходимые параметры в диалоге Поиск соседства и нажми те Далее. 12. Изучите результаты в диалоге Пе рекрестная проверка и нажмите Го тово. 13. В диалоге с информацией о резуль тирующем слое нажмите OK. 142 3 4 6 5 7 8 ARCGIS GEOSTATISTICAL ANALYST Что такое простой кригинг? Простой кригинг использует модель, Z(s) = m + e(s) где m известная константа. Например, на следующем рисунке, который использует тот же набор данных, что и примеры для взять разницу между значениями этой модели и измеренными значениями, которая носит название остатков, и применить метод простого кригинга к этим значениям остатков, приняв за известное, что тренд в этих остатках равен нулю. Простой кригинг может использовать либо вариограммы, либо ковариационные функции (являющиеся математическим спо собом определения автокорреляции), он может использовать преобразования, и он может также допустить наличие ошибок в измерениях; см. Главу 7, ‘Использование аналитических инст рументов при построении поверхностей’, для более подробной информации. Измåðåííыå зíàчåíèÿ Кîîðäèíàтà X пояснения понятий ординарного и универсального кригинга, точки наблюдений даны черными кружочками. Известная кон станта —сплошная жирная линия—равна m. (Сравните с орди нарным кригингом.) Для простого кригинга, поскольку предпо лагается, то вы точно знаете значение m, точно известны также значения e (s) для ваших точек. При ординарном кригинге вы оцениваете значение m, следовательно, вы также оцениваете значение e (s). Если вам известно точное значение e (s), вы смо жете оценить автокорреляцию и сделать это лучше, чем если бы вы оценивали значения e (s). Предположение, что вам будет точно известно значение m , часто является нереалистичным. Однако, иногда имеет смысл предположить, что модель, имею щая физический смысл, дает известный тренд. Тогда вы можете ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 143 Создание карты с использова нием простого кригинга Используйте простой кригинг для создания карт проинтерпо лированных значений, кванти лей, вероятности и карт стан дартных ошибок. Он учтет из вестное постоянное значение. Данные, полученные в опорных точках, должны относиться к непрерывному явлению. См. также Для дополнительной информа ции о преобразованиях и опре делении параметров в диалогах Моделирование вариограммы/ ковариации и Поиск соседства, а также для изучения диалога Перекрестная проверка, обра титесь к Главе 7, ‘Использова ние аналитических инструмен тов при построении поверхно стей’. Создание карты проинтерполированных значений 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить интерполяцию по методу про стого кригинга. 2. Запустите модуль Geostatistical Analyst. 3. Выберите атрибут, для которо го вы хотите выполнить интер поляцию по методу простого кригинга. 4. Из списка методов выберите Кригинг. 5. Нажмите Далее. 6. Откройте список для строки Простой кригинг и выберите опцию Карта проинтерполиро ванных значений. 7. Задайте Среднее значение. 8. Нажмите Далее. 9. Задайте необходимые параме тры в диалоге Моделирование вариограммы/ковариации и нажмите Далее. 10. Задайте необходимые пара метры в диалоге Поиск сосед ства и нажмите Далее. 11. Изучите результаты в диало ге Перекрестная проверка и нажмите Готово. 12. В диалоге с информацией о результирующем слое нажми те OK. 144 3 4 5 6 7 8 ARCGIS GEOSTATISTICAL ANALYST Подсказка Проверка на двумерное распределение Проверяйте свои данные на дву мерную нормальность. См. Гла ву 7, ‘Использование аналити ческих инструментов при по строении поверхностей’. См. также Для дополнительной информа ции о преобразованиях и опре делении параметров в диалогах Моделирование вариограммы/ ковариации и Поиск соседства, а также для изучения диалога Перекрестная проверка, обра титесь к Главе 7, ‘Использова ние аналитических инструмен тов при построении поверхно стей’. Создание карты квантилей 1. Повторите шаги, описанные в уп ражнении ‘Создание карты проин терполированных значений’ с пре дыдущей страницы, но в шаге 6, выберите опцию Карта квантилей, а не Карта проинтерполированных значений. 2. В окне Квантиль с помощью стре лок поменяйте значение уровня квантилей. 3. Повторите шаги с 7 по 12, описан ные в упражнении ‘Создание кар ты проинтерполированных значе ний’ с предыдущей страницы. Создание карты вероятности 1. Повторите шаги, описанные в уп ражнении ‘Создание карты проин терполированных значений’ с пре дыдущей страницы, за исключе нием того, что в шаге 6, выберите опцию Карта вероятности, а не Карта проинтерполированных зна чений. 2. В диалоге Первичное пороговое значение введите пороговое значе ние или используйте для этого кнопку Задать... 3. Отметьте опцию Превышает или Не превышает. 4. Нажмите Далее. 5. Повторите шаги с 7 по 12, описан ные в упражнении ‘Создание кар ты проинтерполированных значе ний’ с предыдущей страницы. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 1 2 3 4 1 2 145 Подсказка Создание учебного и тестового наборов данных При выполнении проверки, ис пользуется два набора данных: учебный набор данных и тес товый набор данных. Учебный набор данных содержит опор ные точки, по которым будет выполняться интерполяция. Тестовый набор данных будет использован для проверки вы числений. Учебный набор дан ных вводится как Набор дан ных 1, а тестовый набор дан ных как Проверочный набор данных. См. раздел ‘Выполне ние проверки для геостатис тического слоя, созданного из поднабора данных’ в Главе 9, для получения дополнительной информации о создании подна боров данных. Создание карты стандартной ошибки интерполяции 1. В таблице содержания ArcMap нажмите правую кла вишу мыши на созданной с использованием простого кригинга поверхности проин терполированных значений и из контекстного меню выбе рите опцию Построить карту стандартных ошибок интер поляции. Подсказка Использование проверки Убедитесь, что учебный набор данных содержит достаточ ное для точного представления поверхности количество опор ных точек. Если учебный набор слишком мал, экстремальные значения данных могут смес тить параметры модели и ис казить полученные результа ты. 146 1 ARCGIS GEOSTATISTICAL ANALYST Подсказка Создание карты Инструменты проинтерполированных исследовательского анализа значений с 3 пространственных данных ESDA Воспользуйтесь инструмента применением преобразований ми исследовательского анализа 1. В таблице содержания пространственных данных ArcMap выберите точечный (ESDA) для принятия решений слой, для которого вы хотите по преобразованиям, и влиянию экстремальных значений на блюдений на модель варио граммы/ковариации. Подтвер дите свое решение с использо выполнить интерполяцию по методу простого кригинга. 2. Запустите модуль Geostatistical Analyst. ванием проверки и перекрест 3. Выберите атрибут, для кото ной проверки. рого вы хотите выполнить 4 5 интерполяцию по методу См. также простого кригинга. Для дополнительной информа 4. Из списка методов выберите 6 7 ции о преобразованиях и опре Кригинг. делении параметров в диалогах Моделирование вариограммы/ ковариации и Поиск соседства, а также для изучения диалога Перекрестная проверка, обра 5. Нажмите Далее. 6. Откройте список для строки Простой кригинг и выберите опцию Карта проинтерполи титесь к Главе 7, ‘Использова рованных значений. ние аналитических инструмен тов при построении поверхно стей’. 7. В окне Преобразование вы берите требуемый метод пре образования. 8. Нажмите Далее. 9. Повторите шаги с 9 по 12 уп ражнения ‘Создание карты проинтерполированных зна чений с использованием ме тода вычитания тренда’, при 8 веденного ранее в этой гла ве. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 147 Подсказка Использование декластеризации Если вы используете преобра зование по методу нормальных меток, и ваши данные были из начально отобраны с различной густотой для различных уча стков территории, попробуй те выполнить декластериза цию данных. См. Главу 7, ‘Ис пользование аналитических ин струментов при построении поверхностей’. См. также Для дополнительной информа ции о преобразованиях и опре делении параметров в диалогах Моделирование вариограммы/ ковариации и Поиск соседства, а также для изучения диалога Перекрестная проверка, обра титесь к Главе 7, ‘Использова ние аналитических инструмен тов при построении поверхно стей’. Создание карты проинтерполированных значений с применением преобразований с декластеризацией 1. В таблице содержания ArcMap выберите точечный слой, для ко торого вы хотите выполнить ин терполяцию по методу простого кригинга. 2. Запустите модуль Geostatistical Analyst. 3. Выберите атрибут, для которого вы хотите выполнить интерполя цию по методу простого кригинга. 4. Из списка методов выберите Кригинг. 5. Нажмите Далее. 6. Откройте список для строки Про стой кригинг и выберите опцию Карта проинтерполированных значений. 7. В окне Преобразование выберите опцию По методу нормальных меток. 8. Отметьте галочкой опцию Декла стеризация перед преобразовани ем. 9. Нажмите Далее. 10. В диалоге Декластеризация за дайте требуемые параметры и нажмите Далее. 11. Задайте требуемые параметры в диалоге Преобразование по мето ду нормальных меток и нажмите Далее. 12. Повторите шаги с 9 по 12 упраж нения ‘Создание карты проин терполированных значений’, приведенного ранее в этой главе. 148 3 4 5 6 7 8 9 ARCGIS GEOSTATISTICAL ANALYST Подсказка Двумерное распределение Проверяйте свои данные на дву мерную нормальность. См. Главу 7, ‘Использование анали тических инструментов при построении поверхностей’. Изучение двумерного распределения при создании карты проинтерполированных значений 1. В таблице содержания ArcMap выберите точечный слой, для ко торого вы хотите выполнить ин См. также терполяцию по методу простого кригинга. Для дополнительной информа 2. Запустите модуль Geostatistical ции об определении параметров Analyst. в диалогах Вычитание тренда, Моделирование вариограммы/ 3. Выберите атрибут, для которого вы ковариации и Поиск соседства, хотите выполнить интерполяцию а также для изучения диалога по методу простого кригинга. 4 5 Перекрестная проверка, обра 4. Из списка методов выберите Кри титесь к Главе 7, ‘Использова гинг. ние аналитических инструмен 5. Нажмите Далее. 6 тов при построении поверхно 6. Откройте список для строки Про стей’. стой кригинг и выберите опцию Карта проинтерполированных значений. 7. Отметьте галочкой опцию Иссле довать двумерное распределение. 8. Задайте Среднее значение и ко личество проверяемых квантилей. 9. Нажмите Далее. 10. Задайте необходимые параметры в диалоге Моделирование варио граммы/ковариации и нажмите Далее. 11. Изучите диалог Исследовать дву мерное распределение и нажми те Далее. 9 12. Повторите шаги с 10 по 12 упраж нения ‘Создание карты проинтер полированных значений’, приве денного ранее в этой главе. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 3 8 7 8 149 Что такое универсальный кригинг? Универсальный кригинг предполагает модель, Z(s) = m(s) + e(s), где m(s) некая детерминистская функция. Например, на сле дующем рисунке, данные для которого совпадают с использо ванными в примере для ординарного кригинга, опорные точки даны черными кружочками. ный нами при рассмотрении ординарного кригинга: нет способа принять решение о правильном разделении значения на состав ляющие, основываясь только на одних данных. Универсальный кригинг может использовать либо вариограм мы, либо ковариационные функции (являющиеся математиче ским способом определения автокорреляции), он может исполь зовать преобразования для данных, из которых должны быть вычтены тренды, и он может также допустить наличие ошибок в измерениях. См. Главу 7, ‘Использование аналитических ин струментов при построении поверхностей’, для более подроб ной информации. Тренд представлен полиномом второго порядка (длинная пунк тирная линия) и равен m(s). Если вы вычтете полином второ го порядка из ваших данных, вы получите ошибки, e (s), кото рые считаются случайными. Среднее значение всех e (s) равно 0. Автокорреляция моделируется из случайных ошибок e (s). Рисунок вверху выглядит как пример полиномиальной регрес сии из любого базового курса статистики. В действительности, он показывает, что представляет собой универсальный кригинг. Вы выполняете регрессию для пространственных координат, как для объяснительных переменных. Однако, вместо того, что бы рассматривать ошибки e (s) как независимые величины, вы моделируете их как автокоррелирующие. Повторим совет, дан 150 ARCGIS GEOSTATISTICAL ANALYST Создание карты с Создание карты использованием проинтерполированных значений 3 универсального 1. В таблице содержания ArcMap вы кригинга берите точечный слой, для которо го вы хотите выполнить интерпо Используйте универсальный кригинг для создания карт про ляцию по методу универсального кригинга. интерполированных значений, 2. Запустите модуль Geostatistical квантилей, вероятности и карт Analyst. стандартных ошибок интерполя ции. Он учтет среднее значение тренда. Данные, полученные в опорных точках, должны отно 3. Выберите поле атрибута, для кото рого вы хотите выполнить универ сальный кригинг. ситься явлению, имеющему не 4. Из списка методов выберите Кри прерывное распространение. гинг и нажмите Далее. 4 5. Откройте список для строки Уни версальный кригинг и выберите См. также опцию Карта проинтерполирован 5 Для дополнительной информации ных значений. о преобразованиях, вычитании 6. В окне Порядок тренда выберите тренда, определении параметров требуемый порядок полинома для в диалогах Моделирование варио тренда. граммы/ковариации и Поиск со 7. Нажмите Далее. седства, а также для изучения диалога Перекрестная проверка, 8. Задайте требуемые параметры в обратитесь к Главе 7, ‘Исполь зование аналитических инстру диалоге Вычитание тренда и на жмите Далее. 6 ментов при построении поверх 9. Задайте необходимые параметры в ностей’. диалоге Моделирование варио граммы/ковариации и нажмите Далее. 10. Задайте необходимые параметры в диалоге Поиск соседства и на жмите Далее. 11. Изучите результаты в диалоге Пе рекрестная проверка и нажмите 7 Готово. 12. В диалоге с информацией о ре зультирующем слое нажмите OK. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 151 Подсказка Создание карты Применение инструментов стандартных ошибок ESDA для определения интерполяции преобразований Воспользуйтесь инструмента ми исследовательского анализа 1. В таблице содержания ArcMap нажмите правую пространственных данных клавишу мыши на поверхно (ESDA) для принятия решений сти проинтерполированных по преобразованиям, вычита значений, построенной с ис 1 нию тренда и наличию эффек пользованием универсально та выпадающих (экстремаль го кригинга, и из контекст ных) значений в моделях варио ного меню выберите опцию граммы/ковариации. Подтвер Построить карту стандарт дите свое решение с использо ных ошибок интерполяции. ванием проверки и перекрест ной проверки. 152 ARCGIS GEOSTATISTICAL ANALYST Что такое пороговые значения? Переменная, которая имеет непрерывные значения, может быть преобразована в бинарную (0 или 1) переменную путем выбора некоего порогового (критического) значения. В модуле Geostatistical Analyst, если значения в опорных точках выше по рогового, им присваивается 1, если значения в опорных точках ниже порогового, им присваивается 0. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 153 Что такое индикаторный кригинг? Индикаторный кригинг предполагает модель, I(s) = m + e(s), где m неизвестная константа , а e (s) бинарная переменная. Бинарные данные могут быть созданы для непрерывных дан ных с использованием порогового (критического) значения, либо значения в опорных точках могут изначально, при выполнении наблюдений, фиксироваться как 0 или 1. Например, у вас мо жет быть набор данных, который содержит информацию о том, расположена точка в лесу или нет, и бинарная переменная в данном случае будет означать принадлежность к определенному классу. Используя бинарные переменные, индикаторный кри гинг действует так же, как и ординарный кригинг. Например, на следующем рисунке, для которого использованы те же дан ные, что и для ординарного, универсального и простого кригин га, данные были преобразованы в бинарные с использованием порогового значения, аналогично тому, как было описано в пре дыдущем разделе ‘Что такое пороговые значения?’. ных показано пунктирной линией, и равно m. (Сравните с орди нарным кригингом.) Как и для ординарного кригинга, вы пред полагаете, что значения e (s) автокоррелируют. Обратите вни мание, что поскольку индикаторные переменные равны 0 или 1, значения, полученные в результате интерполяции по методу индикаторного кригинга , будут находиться в диапазоне между 0 и 1 и могут быть интерпретированы, как вероятности того, что переменная будет равна 1 или попадет в класс, обозначен ный как 1. Если для создания индикаторной переменной ис пользовалось пороговое значение, то на карте с результатами интерполяции будут показаны вероятности того, что пороговое значение будет превышено (или наоборот, искомые значения будут ниже порогового). Возможно также создание нескольких индикаторных перемен ных для одного и того же набора данных путем выбора несколь ких пороговых значений. В таком случае, первое пороговое зна чение образует первичную индикаторную переменную, а другие индикаторные переменные используются в кокригинге как вто ричные переменные. Индикаторный кригинг может использовать либо вариограм мы, либо ковариационные функции (являющиеся математиче ским способом определения автокорреляции); см. Главу 7, ‘Ис пользование аналитических инструментов для построения по верхностей’, для более подробной информации. Измåðåííыå зíàчåíèÿ I Кîîðäèíàтà X Бинарные данные в опорных точках показаны прямоугольни ками. Неизвестное среднее для всех индикаторных перемен 154 ARCGIS GEOSTATISTICAL ANALYST Создание карты с использованием индикаторного кригинга Используйте индикаторный кри гинг для создания карт вероятнос ти и карт стандартных ошибок ин дикаторов. Индикаторный кригинг учитывает неизвестное постоянное среднее. Данные, полученные в опорных точках должны относить ся к непрерывному явлению. Подсказка Важные параметры Заданное пороговое значение (ко торое определяет, каким интер полированным значениям будет присвоен “0”, а каким “1”), мо дели ковариации/вариограммы, и область поиска соседства. Подсказка Выбор порогового значения Оценка вариограммы/ковариации затруднительна, когда индика торные переменные изначально все равны нулю или единице. Вы бирайте пороговое значение, ко торое позволит создать набор индикаторных значений, в кото ром будут и нули, и единицы. См. также Для дополнительной информа ции о преобразованиях и опреде лении параметров в диалогах Моделирование вариограммы/ко вариации и Поиск соседства, а также для изучения диалога Пе рекрестная проверка, обрати тесь к Главе 7, ‘Использование аналитических инструментов при построении поверхностей’. Создание карты вероятности 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить интерполяцию по методу индикаторного кри гинга. Запустите модуль Geostatistical Analyst. 2. Выберите атрибут, для которо го вы хотите выполнить интер поляцию по методу индика торного кригинга. 3. Из списка методов выберите Кригинг. 4. Нажмите Далее. 5. Откройте список для строки Индикаторный кригинг и вы берите опцию Карта вероятно сти. 6. В диалоге Первичное порого вое значение введите порого вое значение или используй те для этого кнопку Задать... 7. Отметьте опцию Превышает или Не превышает. 8. Нажмите Далее. 9. В диалоге Дополнительные отсекатели определите допол нительные отсекатели. 10. Задайте необходимые пара метры в диалогах Моделиро вание вариограммы/ковари ации и Поиск соседства и в каждом из них нажмите Да лее. 11. Изучите результаты в диало ге Перекрестная проверка и нажмите Готово. 12. В диалоге с информацией о результирующем слое на жмите OK. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 3 4 5 7 8 2 6 155 Что такое вероятностный кригинг? Вероятностный кригинг предполагает модель, I(s) = I(Z(s) > ct) = m1 + e1(s) Z(s) = m + e (s), 2 2 где m и m неизвестные константы, а I (s) бинарная пере 1 2 менная, созданная с использованием порогового индикатора I(Z(s) > ct). Обратите внимание, что теперь существует два типа случайных ошибок, e (s) и e (s), и, следовательно, существует 1 2 автокорреляция для каждой из них и взаимная корреляция меж ду ними. Вероятностный кригинг пытается делать то же самое, что и индикаторный кригинг, но для того, чтобы выполнить ра боту лучше, он использует кокригинг. Например, на следующем рисунке, для которого использованы те же данные, что и для ординарного, универсального, простого и индикаторного кри гинга, обратите внимание на точку Z(u=9), индикаторная пе ременная которой равна I(u) = 0, и Z(s=10), индикаторная переменная которой равна I(s) = 1. Если бы вы захотели вычислить значение посередине между ними (для координаты x= 9.5), тогда использование только индика торного кригинга дало бы значение около 0.5. Однако, вы може те заметить, что значение Z(s) едва превышает пороговое зна чение, а Z(u) гораздо меньше него. Следовательно, у вас есть причины предположить, что индикаторное значение в точке 9.5 должно быть меньше 0.5. Вероятностный кригинг пытается учи тывать дополнительную информацию в исходных данных, по мимо бинарной переменной. Однако, это имеет свою цену. Вам необходимо выполнить гораздо больше оценок, включая оценку автокорреляции для каждой переменной, наряду с их взаимной корреляцией. Каждый раз, когда вы оцениваете неизвестные параметры автокорреляции, вы вносите большую неопределен ность, поэтому, возможно, вероятностный кригинг не стоит за трачиваемых на него дополнительных усилий. Вероятностный кригинг может использовать либо вариограм мы, либо ковариационные функции (являющиеся математиче ским способом определения автокорреляции), в также взаим ную ковариацию (являющуюся математическим способом опре деления взаимной корреляции); см. Главу 7, ‘Использование аналитических инструментов для построения поверхностей’, для более подробной информации. 156 ARCGIS GEOSTATISTICAL ANALYST Создание карты с использованием вероятностного кригинга Используйте вероятностный кригинг для создания карт ве роятности и карт стандартных ошибок индикаторов. Данные, полученные в опорных точках, должны относиться к непре рывному явлению. Подсказка Важные параметры Заданное пороговое значение (которое определяет, каким вычисленным значениям будет присвоен “0”, а каким “1”), модели ковариации/вариограм мы, и область поиска соседст ва, используемая в модели. Подсказка Выбор порогового значения Оценка вариограммы/ковариа ции затруднительна, когда ин дикаторные переменные изна чально все равны нулю или еди нице. Если возможно, выбирай те пороговое значение, которое позволит создать набор инди каторных значений, в котором будут и нули, и единицы. См. также Для дополнительной информа ции о преобразованиях, вычи тании тренда, определении па раметров в диалогах Моделиро вание вариограммы/ковариации и Поиск соседства, а также для изучения диалога Перекре стная проверка, обратитесь к Главе 7, ‘Использование анали тических инструментов при построении поверхностей’. Создание карты вероятности 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить интерполяцию по методу вероятностного кри гинга. 2. Запустите модуль Geostatistical Analyst. 3. Выберите поле атрибута, для которого вы хотите выпол нить вероятностный кригинг. 4. Из списка методов выберите Кригинг. 5. Нажмите Далее. 6. Откройте список для строки Вероятностный кригинг и выберите опцию Карта веро ятности. 7. В диалоге Первичное порого вое значение введите поро говое значение или исполь зуйте для этого кнопку За дать... 8. Отметьте опцию Превышает или Не превышает. 9. Нажмите Далее. 10. Задайте необходимые пара метры в диалогах Моделиро вание вариограммы/ковари ации и Поиск соседства и в каждом из них нажмите Да лее. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 4 5 6 8 9 3 7 157 12. Изучите результаты в диало ге Перекрестная проверка и нажмите Готово. 13. В диалоге с информацией о результирующем слое на жмите OK. 158 ARCGIS GEOSTATISTICAL ANALYST Что такое дизъюнктивный кригинг? Дизъюнктивный кригинг предполагает модель, f(Z(s)) = m 1 + e(s) где m1 неизвестная константа и f(Z(s)) некая произвольная функция Z(s). Обратите внимание, что вы можете записать выражение f(Z(s)) = I(Z(s) > ct), поэтому индикаторный кри гинг является частным случаем дизъюнктивного кригинга. В модуле Geostatistical Analyst с помощью дизъюнктивного кригин га вы можете вычислить либо само проинтерполированное зна чение, либо его индикаторное значение. Сравним ординарный и индикаторный кригинг с дизъюнктив ным. Ординарный кригинг использует линейную комбинацию данных, и окончательная формула интерполятора выглядит сле дующим образом: n ∑ Z€(s0 ) = λi Z (si ), i =1 где Z€(s0 ) проинтерполированное значение, {Z(si)} исходные данные, а {l } веса кригинга. Задача ординарного кригинга i найти оптимальные веса, {l }. Индикаторный кригинг образует i интерполятор, n ∑ I€(Z (s0 ) > ct ) = λi I (Z (si ) > ct ), i =1 и, также пытается найти оптимальные веса, {l }. Однако воз i можно, вам удастся найти большее количество общих функций для данных, которые помогут вам вычислить некую функцию переменной в искомой точке. Дизъюнктивный кригинг генерализирует индикаторный кри гинг, чтобы сформировать интерполятор, n ∑ g€(Z (s 0 )) = fi (Z (si )), i =1 В модуле Geostatistical Analyst доступные функции g(Z(s )) это 0 просто сами значения Z(s0) и I(Z(s0) > ct). В целом, дизъюнк тивный кригинг пытается сделать больше, чем ординарный кри гинг. Поскольку награда может быть большей, то и затраты соответственно возрастают. Дизъюнктивный кригинг предпо лагает наличие двумерного нормального распределения данных (см. Главу 7, ‘Использование аналитических инструментов при построении поверхностей’) и аппроксимаций функций f (Z(s )); i i эти ограничения трудно проверяемы, и поэтому решения явля ются математически и вычислительно сложными. Дизъюнктивный кригинг может использовать либо вариограм му, либо ковариационные функции (которые являются матема тическим описанием автокорреляции), и он также может ис пользовать преобразования данных и вычитание тренда; см. Главу 7, ‘Использование аналитических инструментов при построе нии поверхностей’, для более подробной информации. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 159 Создание карты с использованием дизъюнктивного кригинга Используйте дизъюнктивный кригинг для создания карт про интерполированных значений, вероятности и карт стандартных ошибок индикаторов или стан дартных ошибок интерполяции. Данные, полученные в опорных точках, должны относиться к непрерывному явлению и под чиняться закону двумерного нормального распределения. Подсказка Важные параметры Соответствующее преобразова ние и вычитание тренда, модели вариограммы/ковариации и поиск соседства. Подсказка Использование файла базы данных вместо точечного слоя В диалоге Выберите входные дан ные и метод вместо слоя ArcMap может быть выбран файл базы данных. Для этого надо нажать кнопку Пролистать и выбрать соответствующий файл из базы данных. См. также Для дополнительной информа ции о преобразованиях, вычи тании тренда, определении па раметров в диалогах Моделиро вание вариограммы/ковариации и Поиск соседства, а также для изучения диалога Перекре стная проверка, обратитесь к Главе 7, ‘Использование анали тических инструментов при построении поверхностей’. Создание карты проинтерполированных значений 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить интерполяцию по методу дизъ юнктивного кригинга. 2. Запустите модуль Geostatistical Analyst. 3. В окне Атрибут выберите по казатель, для которого вы хо тите выполнить интерполяцию по методу дизъюнктивного кригинга. 4. Из списка методов выберите Кригинг. 5. Нажмите Далее. 6. Откройте список для строки Дизъюнктивный кригинг и выберите опцию Карта проин терполированных значений. Задайте Среднее значение. Помимо этого, задайте преоб разование по методу нормаль ных меток и нажмите Далее. 7. Если указано преобразование по методу нормальных меток, определите требуемые параме тры в диалоге Преобразование по методу нормальных меток и нажмите Далее. 8. В диалоге Моделирование ва риограммы/ковариации за дайте требуемые параметры и нажмите Далее. 9. В диалоге Поиск соседства за дайте требуемые параметры поиска и нажмите Далее. 10. В диалоге Перекрестная про верка изучите полученные ре зультаты и нажмите Готово. 11. В диалоге с информацией о результирующем слое нажми те OK. 160 4 6 3 5 ARCGIS GEOSTATISTICAL ANALYST Подсказка Карта стандартных ошибок интерполяции Карта стандартных ошибок количественно определяет нео пределенность вычислений. Если данные подчиняются за кону нормального распределе ния, истинное значение будет находиться в интервале, опре деляемом вычисленным значе нием ± двукратная стандарт ная ошибка интерполяции в примерно 95 процентах случа ев. См. также Для дополнительной информа ции о преобразованиях, вычи тании тренда, определении па раметров в диалогах Моделиро вание вариограммы/ковариации и Поиск соседства, а также для изучения диалога Перекре стная проверка, обратитесь к Главе 7, ‘Использование анали тических инструментов при построении поверхностей’. Создание карты вероятности 1. Повторите шаги упражнения ‘Создание карты проинтерпо лированных значений’, при веденного на предыдущей странице, за исключением того, что в шаге 6 вместо оп ции Карта проинтерполиро ванных значений выберите опцию Карта вероятности. 2. В диалоге Первичное порого вое значение введите порого вое значение или используй те для этого кнопку Задать... 3. Отметьте опцию Превышает или Не превышает. 4. Определите Среднее значение и задайте преобразование по методу нормальных меток. Нажмите Далее. 5. Повторите шаги с 7 по 11 уп ражнения ‘Создание карты проинтерполированных зна чений’, приведенного ранее в этой главе. Создание карты стандартных ошибок интерполяции 1. В таблице содержания ArcMap нажмите правую клавишу мыши на поверхности проин терполированных значений, построенной с использовани ем дизъюнктивного кригинга, и из контекстного меню вы берите опцию Построить кар ту стандартных ошибок интер поляции. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 1 2 3 4 1 161 Создание карты стандартной ошибки индикаторов 1. Повторите шаги упражнения ‘Создание карты вероятнос ти’, приведенного ранее в этой главе, за исключением того, что в шаге 6 вместо опции 1 Карта проинтерполированных значений выберите опцию Карта стандартной ошибки индикаторов. 162 ARCGIS GEOSTATISTICAL ANALYST Подсказка Создание карты Использование декластеризации Если вы используете преобра проинтерполированных значений с применением декластеризации зование по методу нормальных меток, и ваши данные были из начально отобраны с различной густотой для различных уча стков территории, попробуй те выполнить декластериза цию данных. См. Главу 7, ‘Ис пользование аналитических ин струментов при построении поверхностей’. 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить интерполяцию по методу дизъюнктивного кри гинга. 2. Запустите модуль Geostatistical Analyst. 3. Выберите атрибут, для кото рого вы хотите выполнить интерполяцию по методу дизъюнктивного кригинга. 4 5 4. Из списка методов выберите Кригинг. 5. Нажмите Далее. 6. Откройте список для строки 6 Дизъюнктивный кригинг и выберите опцию Карта проин терполированных значений. 7. В окне Преобразование выбе рите опцию По методу нор мальных меток. 8. Отметьте галочкой опцию Де кластеризация перед преобра зованием. 9. Нажмите Далее. 10. В диалоге Декластеризация задайте требуемые парамет ры и нажмите Далее. 11. Задайте требуемые парамет ры в диалоге Преобразование по методу нормальных меток и нажмите Далее. 12. Повторите шаги с 8 по 11 уп 9 ражнения ‘Создание карты проинтерполированных зна чений’, приведенного ранее в этой главе. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 3 7 8 163 Подсказка Изучение двумерного распределения Проверяйте свои данные на дву мерную нормальность. См. Гла ву 7, ‘Использование аналити ческих инструментов при по строении поверхностей’. См. также Для дополнительной информа ции о преобразованиях, вычи тании тренда, определении па раметров в диалогах Моделиро вание вариограммы/ковариации и Поиск соседства, а также для изучения диалога Перекре стная проверка, обратитесь к Главе 7, ‘Использование анали тических инструментов при построении поверхностей’. Изучение двумерного распределения при создании карты проинтерполированных значений 1. В таблице содержания ArcMap выберите точечный слой, для которого вы хотите выполнить интерполяцию по методу дизъюнктивного кри гинга. 2. На панели Geostatistical Analyst выберите опцию Мас тер операций геостатистики. 3. Выберите атрибут, для которо го вы хотите выполнить интер поляцию по методу дизъюнк тивного кригинга. 4. Из списка методов выберите Кригинг. Нажмите Далее. 5. Откройте список для строки Дизъюнктивный кригинг и выберите опцию Карта проин терполированных значений. 6. Отметьте галочкой опцию Ис следовать двумерное распре деление и задайте Среднее значение или Преобразование по методу нормальных меток. 7. Задайте необходимые пара метры в диалоге Моделирова ние вариограммы/ковариа ции и нажмите Далее. 8. Изучите диалог Исследовать двумерное распределение и нажмите Далее. 9. Повторите шаги с 9 по 11 уп ражнения ‘Создание карты проинтерполированных зна чений’, приведенного ранее в этой главе. 164 4 5 3 6 ARCGIS GEOSTATISTICAL ANALYST Что такое кокригинг? Кокригинг использует информацию для нескольких типов перемен ных. Для нахождения более точных искомых значений применяется первая рассматриваемая переменная Z1, наряду с автокорреляцией для значений Z и взаимной корреляцией между значениями Z и все 1 1 ми другими типами переменных. Кокригинг обращается к информа ции, заключенной в других переменных, чтобы помочь в нахождении искомых значений, но столь сложный процесс имеет свою цену. Кок ригинг требует намного большего количества оценок, которые вклю чают как оценку автокорреляции для каждой переменной, так и вза имной корреляции для всех переменных. Теоретически, вы не можете ухудшить значения, полученные с помощью кригинга, поскольку если в данных нет взаимной корреляции между переменными, вы можете вернуться к автокорреляции между значениями Z1. Однако, каждый раз, когда вы оцениваете неизвестные параметры автокорреляции, вы вводите большую неопределенность, поэтому цели повышения точ ности могут не оправдать затрачиваемых на них дополнительных уси лий. Ординарный кокригинг предполагает модели, Z1(s) = m1 + e1(s) Z2(s) = m2 + e2(s), где m1 и m2 неизвестные константы. Обратите внимание, что теперь у вас есть два типа случайных ошибок, e1(s) и e2(s), и следовательно, для каждой из них существует автокорреляция и взаимная корреля ция между ними. Ординарный кокригинг пытается вычислить значе ния Z1(s0), так же, как и ординарный кригинг, но в своей попытке выполнить работу лучше, он использует информацию ковариаты {Z2(s)}. Например, на рисунке показаны те же данные, что были ис пользованы для примера с ординарным кригингом, но здесь в них добавлена вторая переменная. Обратите внимание, что значения Z1 и Z2 автокоррелируют. Также заметьте, что когда Z ниже среднего m , Z часто превышает свое 1 12 среднее m , и наоборот. Таким образом, Z и Z обладают отрицатель 2 1 2 ной взаимной корреляцией. В этом примере, каждая точка s имеет значения Z (s) и Z (s); однако это условие является необязатель 1 2 ным, и часто каждому типу переменных может соответствовать свой набор данных. Главная интересующая нас переменная это Z1, и для Зíàчåíèÿ + ++ ++++ + + + + + ++ + + + + + + +++ + + + + ++ + Кîîðäèíàтà X более точного вычисления искомых значений учитывается и автокор реляция, и взаимная корреляция. Другие методы кокригинга, включая методы универсального, про стого, индикаторного, вероятностного и дизъюнктивного кокригин га, это все обобщение соответствующих методов кригинга для слу чаев, когда вы работаете с несколькими наборами данных. Напри мер, индикаторный кокригинг может быть осуществлен путем исполь зования нескольких пороговых значений для ваших данных. А затем, для того, чтобы вычислить пороговое значение, интересующее вас в первую очередь, можно воспользоваться бинарными данными. При таком способе, индикаторный кокригинг будет аналогичен вероятно стному кригингу, но он может быть более чувствителен к экстремаль ным значениям и другим непонятным (с возможными ошибками) дан ным. Кокригинг может использовать либо вариограммы, либо ковариаци онные функции (которые являются математическим описанием авто корреляции) и взаимную ковариацию (которая является математи ческой формой выражения взаимной корреляции), он может исполь зовать преобразования и вычитание тренда, и он может также допус тить наличие ошибок в измерениях в тех же ситуациях, что и различ ные методы кригинга (ординарный, простой и универсальный кри гинг); см. Главу 7, ‘Использование аналитических инструментов при построении поверхностей’, для более подробной информации. ПОСТРОЕНИЕ ПОВЕРХНОСТИ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ГЕОСТАТИСТИКИ 165 Создание карты с Создание карты использованием проинтерполированных значений кокригинга 1. В таблице содержания ArcMap выберите точечный слой, для Используйте метод кокригинга для создания карт проинтерпо лированных значений, вероятно сти, квантилей, стандартной ошибки индикаторов и стандарт ной ошибки интерполяции, при которого вы хотите выполнить кокригинг. 2. На панели Geostatistical Analyst выберите опцию Мас тер операций геостатистики . 3. Из списка методов выберите Кокригинг. сохранении тех же условий, что 4. Выберите атрибут, для которо и для каждого из методов кри го вы хотите выполнить кок гинга из обсуждавшихся в этой ригинг для всех наборов дан главе. ных (переходите от закладки одного набора данных к за См. также кладке другого набора дан 3 ных, чтобы задать параметры). Для дополнительной информа 5. Нажмите Далее. ции о преобразованиях, вычи тании тренда, определении па 6. Выберите требуемый тип ко кригинга и тип результирую 6 раметров в диалогах Моделиро щий карты в диалоге Выбор вание вариограммы/ковариации геостатистического метода. и Поиск соседства, а также Нажмите Далее. для изучения диалога Перекре стная проверка, обратитесь к Главе 7, ‘Использование анали 7. В диалоге Вычитание тренда определите параметры, если для всех наборов данных был задан порядок полинома для тических инструментов при вычитаемого тренда. Нажми построении поверхностей’. те Далее. 8. В диалоге Моделирование ва риограммы/ковариации за дайте требуемые параметры для всех наборов данных. На жмите Далее. 9. В диалоге Поиск соседства за дайте требуемые параметры поиска и нажмите Далее. 10. В диалоге Перекрестная про верка изучите полученные ре зультаты и нажмите Готово. 11. В диалоге с информацией о результирующем слое нажми те OK. 166 4 5 ARCGIS GEOSTATISTICAL ANALYST 7 Использование аналитических инструментов при построении поверхностей В ЭТОЙ ГЛАВЕ • Исследование пространственной структуры: вариография • Определение области поиска соседства • Выполнение перекрестной проверки для оценки выбранных параметров • Оценка протокола решений с использованием проверки • Сравнение моделей • Моделирование распределений и определение преобразований • Проверка данных на соответствие двумерному нормальному распределению • Применение декластеризации для определения выборки • Вычитание трендов из данных При построении поверхности вы проходите через многие стадии. На каждой из этих стадий вы определяете целый ряд параметров. Модуль Geostatistical Analyst предоставляет серии диалогов подсказок, содержа щих аналитические инструменты, которые призваны помочь вам в опре делении этих параметров. Некоторые из этих диалогов и инструментов, например, определение области поиска опорных точек для вычислений, перекрестная проверка и проверка, применимы практически к всем мето дам интерполяции. Другие, например, моделирование вариограмм, пре образования, вычитание тренда, декластеризация и проверка данных на соответствие двумерному нормальному распределению, применяются только для геостатистических методов (кригинга и кокригинга). В каждый диалог помощник включены серии задач, которые могут быть выполнены с использованием этих инструментов. В этой главе обсужда ются понятия, используемые для наиболее часто выполняемых задач, а также стадии их выполнения. Необходимо ли использовать эти инстру менты все, или следует применить только некоторые из них, зависит от ваших данных. Для всех параметров модуль Geostatistical Analyst предо ставляет надежные значения по умолчанию, некоторые из которых рас считываются на основе ваших конкретных данных. Таким образом, вы можете получить расширенное представление об изучаемом вами явле нии, отличное от первоначального и основывающееся на данных, полу ченных с помощью инструментов исследовательского анализа модуля Geostatistical Analyst. Эти представления вы можете использовать для уточнения параметров, что поможет вам построить более точную поверх ность. 167 Исследование пространственной структуры: вариография Вариограммы и ковариационные функции Функции вариограммы и ковариации (известные также как структурные функции) количественно характеризуют предпо ложение о том, что чем ближе точки расположены друг к другу, тем они более похожи. И вариограмма, и ковариация определя ют меру статистической корреляции как функцию расстояния. Вариограмма определяется следующим образом, g(si,sj) = Ѕ var(Z(si) Z(sj)), где var дисперсия. Если две точки s и s расположены близко друг к другу, и эта i j близость определяется расстоянием d(s , s ), ожидается, что эти ij точки будут похожи, и разность их значений, Z(si) Z(sj), будет маленькой. По мере удаления друг от друга точек s и s , они i j становятся все менее похожи друг на друга, и следовательно разность их значений , Z(si) Z(sj), будет расти. Это можно увидеть на следующем рисунке, который показывает анатомию типичной вариограммы. γ(si,sj) Чàñтèчíый пîðîг Пîðîг Ñàмîðîäîк Ðàäèóñ âëèÿíèÿ 0 Ðàññтîÿíèå Обратите внимание, что дисперсия разности возрастает с рас стоянием, поэтому вариограмму можно рассматривать как функ цию различия. Существует несколько терминов, часто ассоции рующихся с этой функцией, и они также используются в модуле Geostatistical Analyst. Значение (высота графика), начиная с которого вариограмма выравнивается, носит название порога. Оно часто состоит из двух частей: разрыва в начале графика, который носит название эф фекта самородка, и частичного порога, которые вместе и обра зуют порог. Эффект самородка далее может быть разделен на ошибку измерений и вариацию на микроуровне, и в силу того, что любой из этих компонентов может быть равен нулю, эффект самородка может быть отнесен целиком за счет одного из них. Расстояние, при котором вариограмма выравнивается до значе ния порога, носит название радиуса влияния. Ковариационная функция определяется следующим образом: C(si,sj) = cov(Z(si), Z(sj)), где cov ковариация. Ковариация это масштабируемая версия корреляции. Следо вательно, когда две точки, s и s , расположены поблизости, и i j предполагается, что они имеют сходные значения, значения их ковариации (корреляции) будут большими. По мере того, как si и s удаляются друг от друга, они становятся все менее похожи, j и их ковариация стремится к нулю. Это можно увидеть на следу ющем рисунке, который показывает анатомию типичной кова риационной функции. C(si,sj) Ñàмîðîäîк Ðàäèóñ âëèÿíèÿ Чàñтèчíый пîðîг Пîðîг 0 Ðàññтîÿíèå 168 ARCGIS GEOSTATISTICAL ANALYST Обратите внимание, что функция ковариации уменьшается с расстоянием, поэтому ее можно рассматривать как функцию сходства. Между вариограммой и ковариационной функцией существует связь, которая может быть выражена, как g(s ,s ) = порог C(s ,s ), ij ij и эту связь можно увидеть по рисункам. Поскольку эти функции равноценны, в модуле Geostatistical Analyst при выполнении ин терполяции вы можете использовать любую из них. (Напом ним, что все вариограммы в модуле Geostatistical Analyst имеют значение порога.) Вариограммы и ковариации не могут быть просто какими то функциями. Для того, чтобы интерполяция имела неотрица тельные стандартные ошибки кригинга, только некоторые функ ции могут быть использованы в качестве ковариационной или функции вариограммы. Модуль Geostatistical Analyst предлагает несколько функций, которые вы можете применить для анали за данных. Вы можете также воспользоваться моделями, со ставленными из нескольких—такая конструкция часто дает бо лее достоверные модели (в модуле Geostatistical Analyst возмож но составить комбинацию из не более, чем четырех функций). В некоторых случаях бывает так, что вариограммы есть, а кова риационных функций нет. Например, существует линейная ва риограмма, но у нее нет порога, и, следовательно, нет соответст вующей ковариационной функции. В модуле Geostatistical Analyst используются только модели с порогами. Не существует правил, которые без труда и быстро позволили бы вам выбрать “луч шую” модель вариограммы. Чаще всего вы подбираете модель для эмпирической вариограммы или ковариационной функции визуально. В качестве помощников вы можете использовать про верку или перекрестную проверку. Что такое ошибка измерений? Три метода кригинга—ординарный, простой и универсальный— позволяют использовать модели ошибок измерения. Ошибка из мерения может быть получена, когда в одной и той же точке выполнено несколько наблюдений, и их значения отличаются друг от друга. Например, вы можете получить образец в опор ной точке с пробами грунта или воздуха, а затем разделить этот образец на несколько проб. Потребность в этом может возник нуть, если используемый вами инструмент для выполнения ана лиза дает некую погрешность. Другой пример: вы можете на править почву, разделив пробу, на анализ в различные лаборато рии. В некоторых случаях, для прибора могут быть задокумен тированы отклонения в точности измерений. В таком случае, вы можете просто включить известные отклонения в измерени ях в вашу модель. Модель ошибки измерения выглядит следую щим образом: Z(s) = m (s) + e (s) + d (s), где d (s) где ошибка измерений, а m (s) и e (s) аналогичны значениям, используемым в модели кригинга, приведенной в Главе 6. В этой модели, эффект самородка состоит из дисперсии e (s) (которая носит название вариации на микроуровне) и дис персии d (s) (которая носит название ошибки измерений). В модуле Geostatistical Analyst вы можете определить, в какой про порции в эффекте самородка присутствуют вариация на микро уровне и вариация, вызванная ошибкой измерений; либо вы можете использовать модуль Geostatistical Analyst для оценки ошибки измерений, если у вас есть множественные измерения для каждой точки; либо вы можете ввести известное значение погрешности (вариации), вызванной измерениями. По умолча нию предлагается отсутствие (ноль) погрешности, вызванной измерениями. Когда в данных нет ошибки измерений, кригинг является жестким интерполятором, что означает, что если вы полнить интерполяцию для точки, в которой были отобраны данные, вычисленное значение совпадет с измеренным. Однако, ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 169 если существуют ошибки измерений, вы должны учитывать, что проинтерполированное значение будет фильтрованным, m (s ) o +e (so), с невыраженной ошибкой измерения. В точках, где отбирались данные, фильтрованное значение не равно измерен ному значению. Эффект от выбора моделей ошибки измерений состоит в том, что ваша окончательная карта может быть более сглаженной и иметь меньшие стандартные ошибки, чем при ис пользовании версии жесткого кригинга. Это проиллюстрирова но с помощью примера на нижнем рисунке; жесткий кригинг и сглаженный кригинг показаны для случая, когда есть только две опорные точки (1 и 2) со значениями 1 и 1 для модели, постро енной без учета изменчивости, вызванной измерениями, и для модели, в которой эффект самородка полностью состоит из ва риации, вызванной измерениями. Иíтåðпîëÿцèÿ Дàí íыå 1 Тîчíà ÿ Ñгë àæåíí àÿ 0 -1 0 1 2 3 x 1.5 1.0 0.5 0.0 0 Тîчíàÿ Ñгëàæåíí àÿ 1 2 3 x Анизотропия: Вариограммы и ковариационные функции по направлениям Поскольку вы работаете в двумерном пространстве, вы можете предположить, что вариограмма и ковариационная функция меняются не только с расстоянием, но и с направлением. Такое свойство носит название анизотропии. Рассмотрим две точки, si и s , и вектор между ними, который обозначим как s s . Этот j i j вектор будет иметь значение расстояния не только по оси x, но и по оси y. Помимо этого, вы можете рассматривать вектор в по лярных координатах, то есть учитывать его длину и угол на правления. Здесь анизотропия описана для вариограммы; оче видно, что те же самые соображения применимы и для ковари ационной функции. Вариограмма, отображенная на двумерной плоскости с осями координат, выглядит следующим образом: Порог Изотропная Анизотропная Радиус влияния Большой радиус влияния Малый радиус влияния Угол направления Изотропная модель выглядит одинаково во всех направлениях, тогда как анизотропная модель достигает порога быстрее в од них направлениях, чем в других. Длина большой (длинной) оси, при которой достигается порог, носит название большого радиу са влияния, а длина короткой оси малого радиуса влияния; также вам известен угол поворота отрезка, образующего боль шой радиус влияния. В модуле Geostatistical Analyst, контур об ласти влияния показан голубой линией (окружность или контур эллипса) на поверхности эмпирической вариограммы. 170 ARCGIS GEOSTATISTICAL ANALYST Эмпирические вариограммы и ковариационные функции Вариограмма и функции ковариации это теоретические величины, которые вы не можете наблюдать, поэтому оцениваете их, исходя из ваших данных, с использованием так называемых эмпирических вариограмм и эмпирических ковариационных функций. Часто, вы можете постичь величины, изучив то, каким образом они оценива ются. Сначала взгляните на эмпирическую вариограмму. Предполо жим, вы возьмете все пары точек, расположенных друг от друга на примерно одинаковом расстоянии и примерно в одном и том же на правлении, как и пары точек, соединенных на следующем рисунке зелеными отрезками. Посмотрите на ковариационную функцию. Для всех пар точек si и sj, соединенных отрезками, вы вычисляете среднее[ (z(si ) − z)(z(s j ) − z ) ], где z(si) измеренное значение в точке s , а i z среднее из всех значений опорных точек. Если все пары si и sj расположены близко друг к другу, предполагается, что либо оба значения z(s ) и z(s ) i j будут выше среднего z , либо оба будут ниже среднего. В любом случае, результат выражения будет положительным, поэтому при нахождении среднего значения всех произведений вы получите по ложительное значение. Если же si и sj удалены друг от друга, ожида ется, что примерно в половине случаев произведения будут отрица тельными, а в половине случаев положительными, следовательно, их среднее будет стремиться к нулю. В модуле Geostatistical Analyst средние значения, вычисленные по формуле, приведенной выше, для всех пар точек, удаленных на оди наковое расстояние и в одинаковым направлении, наносятся на по верхность вариограммы или ковариации. Например, здесь приведе на поверхность эмпирической вариограммы. Размер ячеек носит название размера лага, а количество ячеек носит название количества лагов, и их можно задать в модуле Geostatistical Для всех пар точек s и s , соединенных отрезками, вычислим i j среднее[(z(s ) z(s ))2], i j где z(si) измеренное значение в точке s . Если все пары точек s и s i i j расположены близко друг к другу, предполагается, что значения z(si) и z(sj) будут иметь сходные значения, следовательно, когда вы най дете их разности и вычислите их квадрат, среднее значение квадра тов разностей должно быть маленьким. По мере удаления si и sj , предполагается, что их значения будут сильнее отличаться друг от друга, следовательно, когда вы найдете их разности и вычислите их квадрат, среднее значение квадратов разностей должно стать боль ше. Analyst. Количество лагов в данном примере равно 12, и подсчитыва ется как число соседних ячеек по прямой горизонтальной или верти кальной линии от центра до края изображения поверхности. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 171 Использование эмпирических данных для оценки теоретических моделей Теперь для оценки теоретических моделей, которые и будут в действительности использованы для интерполяторов по методу кригинга и вычисления стандартных ошибок, вам необходимо воспользоваться вариограммами и ковариационными функция ми. На следующем рисунке показаны и оцененная теоретичес кая модель и эмпирические значения. Перед нами трудно уловимый и часто сбивающий с толку факт: Ckm(si,sj) может быть асимметричной. В целом, Ckm(si,sj) № Cmk(si,sj) (обратите внимание на перемену мест в индексах). Чтобы понять, почему это происходит, обратимся к следующему примеру. Z1(s1) Z1(s2) Z1(s3) Z1(s4) Эмпèðèчåñкèå зíàчåíèÿ Тåîðåтèчåñкàÿ мîäåëь Модели взаимной ковариации Если у вас есть несколько наборов данных, и вы хотите исполь зовать кокригинг, тогда вам необходимо разработать модели вза имной ковариации. Поскольку у вас есть несколько наборов дан ных, вы храните последовательность (ряд) переменных с ин дексами, где Z (s ) показывает случайную переменную из набо kj ра данных k в точке s. i Тогда функция взаимной ковариации между типами данных k и m будет определяться как, Ckm(si,sj) = cov(Zk(si), Zm(sj)). Z2(s1) Z2(s2) Z2(s3) Z2(s4) Предположим, что у вас есть данные, расположенные в одном измерении, вдоль линии, и они выглядят следующим образом: В этом примере, переменные для типа 1 и 2 расположены вдоль линии равномерно, на одинаковом расстоянии; толстой красной линией показано самое высокое значение взаимной ковариации, зеленой линией меньшие значения взаимной ковариации, а тонкой синей линией наименьшие значения взаимной ковари ации; если линия отсутствует, это означает нулевую взаимную ковариацию. На рисунке видно, что Z1(si) и Z2(sj) имеют макси мальное значение взаимной ковариации, когда s = s , и это зна i j чение уменьшается по мере удаления s i и s j друг от друга. В этом примере, C (s ,s ) = C (s ,s ). Однако, взаимная ковариация km i j mk i j может быть “смещена”: C12(s2,s3) C21(s2,s3) Z1(s1) Z1(s2) Z1(s3) Z1(s4) Z2(s1) Z2(s2) Z2(s3) Z2(s4) 172 ARCGIS GEOSTATISTICAL ANALYST Теперь, к примеру, обратите внимание, что C12(s2,s3) имеет ми нимальное значение взаимной ковариации (тонкая синяя ли ния), в то время, как C21(s2,s3) имеет максимальное значение взаимной ковариации (толстая красная линия), поэтому здесь Ckm(si,sj) № Cmk(si,sj). Относительно Z, 1 взаимные ковариации Z2 были смещены на 1. Если вы выберите опцию отображения параметров смещения, модуль Geostatistical Analyst оценит лю бое смещение во взаимной ковариации между двумя наборами данных в двух измерениях. Эмпирические взаимные ковариации рассчитываются по фор муле: среднее[ (z1(si ) − z1)(z2 (s j ) − z2 ) ], где Zk(si) измеренное значение для набора данных k в точке si, zk среднее для набора данных k; среднее взято для всех si и sj , удаленных друг от друга в определенном направлении на опре деленное расстояние. Что касается вариограмм, модуль Geostatistical Analyst показывает и эмпирическую, и подобран ную модель для взаимной ковариации. Тåîðåтèчåñкàÿ мîäåëь Выбор различный моделей ковариации, использование состав ных моделей ковариации, и выбор анизотропии, приведет к из менению теоретической модели. Вы можете сделать предвари тельный выбор модели, визуально определив, насколько хоро шо она описывает эмпирические значения. Изменение размера лага и количества лагов и добавление смещений изменит эмпи рическую поверхность ковариации, что приведет к соответству ющим изменениям в теоретической модели. Модуль Geostatistical Analyst вычисляет значения по умолчанию. Однако, вы не долж ны ограничивать себя рамками этих параметров и воспользо ваться возможностями по подбору различных значений. Для оценки достоверности результатов выполните также проверку и перекрестную проверку моделей и попробуйте найти научное обоснование для выбора наиболее подходящей модели. Нàèбîëьшàÿ кîâàðèàцèÿ ñäâèíóтà íà Зàпàä Эмпèðèчåñкèå зíàчåíèÿ ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 173 Диалог моделирования вариограммы/ковариации Модель, действующая по всем направлениям Облако вариограммы Возможные модели вариограммы Значение вариограммы Расстояние для лага Эмпирическая поверхность вариограммы Значения связанных параметров 174 ARCGIS GEOSTATISTICAL ANALYST Моделирование вариограмм и функций ковариации Моделирование вариограмм и ковариации состоит в подборе функций, описывающих ваши данные. Цель такого моделиро вания подобрать лучшую модель (отображаемую на диаграмме желтой линией) для вариограм мы. Модель затем будет исполь зована при интерполировании значений. Изучите автокорреляцию своих данных по направлениям. По рог, радиус влияния и самородок важные характеристики моде ли. Если в ваших данных есть ошибка измерений, используйте модели ошибки измерений. Подсказка Выбор модели Выберите модель вариограм мы, которая на ваш взгляд под ходит для описания эмпиричес кого облака вариограммы. Для помощи при выборе между сходными моделями используй те проверку и перекрестную проверку. См. также В Главе 3, ‘Принципы геоста тистического анализа’, даны общие представления о прост ранственной автокорреляции и моделировании вариограмм и ковариаций. Формулы приведе ны в Приложении A. Выбор модели 1. В диалоге Моделирование ва риограммы/ковариации выбе рите требуемую модель вари ограммы. Вы увидите, что желтая линия в диалоге Вариограмма будет меняться в соответствии с выбранной вами моделью. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 11 175 Подсказка Изучение Автокорреляция ваших данных автокорреляции по направлениям Рассмотрите положение то чек вариограммы относитель но желтой линии (модели). Если точки расположены близ 1. Отметьте галочкой опцию По казывать направление поис ка. ко к линии в одном направлении 2. В окне Угол направления про и разбросаны в другом, в ваших крутите значения стрелочка 1 данных может быть автокор реляция в одном из направлений. ми вверх вниз, чтобы опреде лить требуемый угол направ 2 ления. 3 Подсказка Или на карте вариограммы, Это только визуальное выбрав мышью и удерживая исследование среднюю синюю линию, ме Исследование направленной ав няйте направление указателя. 4 токорреляции с использованием инструмента направления по иска наряду с указателем на правления на поверхности ва 3. В окне Угол захвата прокру тите значения вверх вниз, что бы подобрать угловой допуск. риограммы является исключи Или на карте вариограммы, тельно визуальным (вокруг по добранной изотропной модели). Чтобы подобрать модель с уче том автокорреляции по на правлению, отметьте галоч кой опцию Анизотропия. выберите и удерживайте лю бую из двух красных линий и растяните угол поиска по тре буемой величины. 4. Поменяйте с помощью стре лок ширину полосы. Или на карте вариограммы выберите и удерживайте лю бую из двух фиолетовых ли ний, ограничивающих указа тель направления поиска. Уве личьте или уменьшите шири ну полосы поиска. 176 ARCGIS GEOSTATISTICAL ANALYST Подсказка Выбор опции анизотропии Обратите внимание, что если выбрана опция анизотропии, вме сто одной желтой линии будет отображаться несколько линий. Желтые линии показывают мо дели вариограммы для нескольких различных направлений. Модели (желтые линии) теоретические “наилучшим образом подобран ные” модели эмпирической варио граммы. Модуль Geostatistical Analyst автоматически вычисля ет оптимальные параметры (на пример, большой радиус влияния, малый радиус влияния, и угол на правления) для учета анизотроп ного влияния. Подсказка Проверка вариограммы после того, как выбрана опция анизотропии После выбора опции Анизотро пия отметьте галочкой опцию Показывать направление поис ка. Если модель подобрана пра вильно, желтая линия будет меняться по мере того, как в зависимости от угла направле ния поиска, меняется график эмпирической вариограммы. Подсказка Вычисление оптимальных параметров Иконка с изображением каран даша, расположенная над окош ками для ввода значений большо го и малого радиусов влияния и угла направления, позволяет вам редактировать вводимые значения. Если вы нажмете на иконку калькулятора слева от карандаша, будут вычислены оптимальные значения, кото рые отобразятся в соответст вующих окошках вводимых па раметров. Моделирование анизотропии 1. Отметьте галочкой опцию Анизотропия в диалоге Моде лирование вариограммы/ко вариации. Обратите внимание, что ког да выбрана опция анизотро пии, на графике вместо одной отображается несколько жел тых линий. Изменение параметров анизотропии 1. Отметьте опцию Анизотропия в диалоге Моделирование варио граммы/ковариации. Примечание: Активируются опции Малый радиус влияния и Направ ление. 2. Чтобы изменить большой радиус влияния, нажмите на иконку с изображением карандаша над окошком, использующимся для ввода значения большого радиуса влияния (что сделает окно ввода активным) и впечатайте требуе мое значение. 3. Чтобы изменить малый радиус влияния, нажмите на иконку с изображением карандаша, распо ложенную над окошком для ввода значения малого радиуса влияния (что позволит активировать окно ввода) и введите требуемое значе ние. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 1 2 1 3 4 177 4. Чтобы изменить угол направ ления, нажмите на иконку с изображением карандаша, расположенную над окошком для ввода значения угла на правления (что позволит акти вировать окно ввода) и введи те требуемое значение. 178 ARCGIS GEOSTATISTICAL ANALYST Подсказка Выбор размера лага Правило большого пальца со стоит в том, что размер лага, умноженный на количе ство лагов, должен быть мень ше, чем половина максимально го расстояния между точками для вашего набора данных. Подсказка Вычисление оптимальных параметров Иконка с изображением каран даша, расположенная над окошками для ввода значений частичного порога и самородка позволяет вам редактировать вводимые значения. Если вы на жмете на иконку калькулято ра слева от карандаша, будут вычислены оптимальные значе ния, которые отобразятся в соответствующих окошках вводимых параметров. Изменение размера лага и количества лагов 1. В диалоге Моделирование ва риограммы/ковариации впе чатайте требуемое значение размера лага. 2. Поменяйте значение количе ства лагов, уменьшая или уве личивая его с помощью про крутки, или введите необхо димое значение в окне Коли чество лагов. Изменение значений частичного порога и самородка 1. В диалоге Моделирование ва риограммы/ковариации на жмите иконку с изображени ем карандаша, расположен ную над окошком для ввода значения частичного порога (которая активирует окно вво да) и введите необходимое значение. 2. Отметьте опцию Самородок, нажмите иконку с изображе нием карандаша, располо женную над окошком для вво да значения самородка (кото рая активирует окно ввода) и введите необходимое значе ние. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 2 1 1 2 179 Подсказка Работа с ошибкой Множественные измерения измерений Если у вас есть множествен ные измерения для опорных то чек, позвольте модулю Geostatistical Analyst вычислить для вас ошибку измерений. Для 1. Отметьте опцию Моделирова ние ошибки. 2. Перемещайте движок, чтобы определить процентное соот этого отметьте опцию ОИ ношение вариации на микро (Ошибка измерений) и нажми уровне (или микроструктуры) те кнопку Оценить. и ошибки измерений для зна 1 чения эффекта самородка. Подсказка Инструментальная ошибка Для многих научных приборов может быть известна точ ность измерений. Основываясь на этой информации, вы може те ввести эти известные зна чения ошибки измерений. Или введите проценты или значения в окошках для ввода данных. Подсказка Нулевая ошибка измерений Если ошибка измерений равна нулю, вы получите “жесткий” кригинг. 2 180 ARCGIS GEOSTATISTICAL ANALYST Определение размера области поиска соседства Объекты, расположенные ближе друг к другу, должны быть более похожими—по мере удаления опорных точек от точки с неизвест ным значением, они могут оказаться не слишком полезными для вычисления значения в искомой точке. При некотором расстоянии опорные точки не будут коррелировать с искомой точкой, и воз можно, что они будут даже расположены в области, которая сильно отличается от той, где находится искомая точка. Поэтому, обще принятым является определение области поиска соседства, огра ничивающей количество и расположение точек, которые будут ис пользованы при интерполяции. Существует два механизма кон троля используемых точек, один из которых определяет форму области соседства, а другой устанавливает ограничения на выбор точек, попадающих в эту область. Форма области будет диктоваться исходными данными. Напри мер, если ваши данные отобраны равномерно, и нет автокорреля ции, связанной с направлением (данные изотропны), вы захотите включить в вычисления точки, расположенные одинаково во всех направлениях от искомой. Для этого, вы, возможно, захотите оп ределить область поиска соседства в форме круга. Однако, если вам известно, что существует автокорреляция, связанная с направле нием (анизотропия), к примеру, вызванная ветровым переносом загрязнителей, при интерполяции поверхности в качестве области поиска соседства вы можете использовать эллипс, большая ось ко торого параллельна направлению ветра. Вы поступите таким об разом, поскольку вам известно, что точки, расположенные по на правлению ветра от искомой, даже на значительных расстояниях будут больше похожи на точку, для которой мы интерполируем значение, чем те, которые расположены в направлении, перпенди кулярном направлению ветра. Форма области поиска соседства должна определяться на основе понимания пространственного расположения опорных точек и про странственной автокорреляции набора данных. Изучение прост ранственного расположения опорных точек и автокорреляции вы полняется при помощи инструментов ESDA (Исследовательского анализа пространственных данных), включенных в Мастер опера ций геостатистики. Например, на изображении диалога, приве денном на этой странице, вы можете видеть, что автокорреляция, связанная с направлением (т.е., анизотропия), влияет на форму вариограммы. Кривая вариограммы медленно растет в направле нии северо северо запад (примерно 340o) и достигает значения, определяющего радиус влияния, примерно на расстоянии 114 км (самая нижняя желтая линия на вариограмме). В западно юго западном направлении, кривая вариограммы растет быстрее (са мая верхняя желтая линия). Радиус влияния в этом направлении составляет примерно 84 км. Поскольку точки, отстоящие друг от друга на расстояние, превышающее радиус влияния, не коррели руют, информация может быть использована для определения стра тегии поиска. Отметьте опцию Анизотропия, чтобы показать конверт вариограммы (т.е., то как кривая Конверт модели вариограммы меняется в зависимости вариограммы от направления) Используйте инструмент направления поиска для определения значения радиуса влияния для конкретного направления ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 181 Область поиска соседства в данном примере может быть опреде лена как эллипс, с размерами большой и малой полуосей 128 и 74 км, соответственно, и углом поворота, равным 340°. 403o40° NN 7840 kKmm 122080 Kkmm После того, как определена форма области, с помощью второго механизма, контролирующего поиск соседства, можно задать ограничения на выбор точек внутри области. Во первых, необ ходимо установить число точек, попадающих в область соседст ва, которые вы будете использовать при выполнении интерпо ляции. Модуль Geostatistical Analyst позволяет вам выбрать же лательное и минимальное количество используемых точек. Во вторых, во избежание смещения в определенном направлении, окружность или эллипс могут быть поделены на сектора, для каждого из которых будет выбираться одинаковое количество точек. Диалог Поиск соседства позволяет вам определить размеры боль шой и малой полуосей и направление большой полуоси. Окруж ность будет иметь одинаковые значения размера большой и ма лой полуоси. Угол оси Размер оси Один сектор Восемь секторов Эллипс с четырьмя секторами Особенно полезно это делать, когда опорные точки располагают ся в узлах регулярной сетки. На диаграмме внизу показан слу чай, при котором точки, расположенные ближе всего к искомой, относятся к одному и тому же поперечному разрезу. Ограниче ния, заданные областью поиска в форме круга, состоят в том, что значение искомой точки будет определяться по пяти сосед ним точкам. Неизвестное значение показано зеленым цветом, а пять ближайших соседних точек, желтым цветом. Другие точ ки внутри окружности не включаются в вычисления, поскольку расположены дальше от искомой точки. 182 ARCGIS GEOSTATISTICAL ANALYST Интерполяция может быть более точной, если в вычислениях бу дут использованы точки и из других рядов. На диаграмме внизу показана область соседства с четырьмя секторами, в которую долж но быть включено по меньшей мере три точки из каждого секто ра, но не больше пяти. Для вычисления неизвестного значения в искомой точке (которая показана зеленым цветом) будет исполь зовано всего 16 точек. Точки каждого сектора, включаемые в ин терполяцию, показаны по секторам разными цветами. Количество используемых точек и секторов должно определяться объективно и основываться на пространственном распределении опорных точек. С одной стороны, вам необходимо иметь доста точное количество точек, чтобы получить достоверный результат для любой искомой точки; с другой стороны, вы не захотите вклю чать в вычисления точки, расположенные слишком далеко от ис комой. Например, если вы выберите максимальное количество точек, равное пяти, а минимальное равное двум (т.е., в вычис лениях должно участвовать по крайней мере две точки) и четыре сектора, общее количество используемых точек будет равно 20. Если в любом из секторов нет минимально необходимого количе ства точек, программа выбирает ближайшие возможные точки за пределами этого сектора. Однако, поиск вне пределов сектора может быть лимитирован областью, образующейся при продле нии линий, ограничивающих сектор, на бесконечное расстояние. Если в любом из расширенных секторов поиска нет пяти точек, общее количество точек будет меньше 20. Цветом обозначены абсолютные значения весов точек, выделен ных в окне вида данных, которые будут присвоены каждой точке при вычислении искомого значения (точка соответствует центру окружности или эллипса). В приведенном примере, ис комая точка находится на пересечении секторов, и четыре точ ки (показанные красным цветом) будут иметь веса более чем10 процентов. Чем больше абсолютное значение веса, тем большее влияние точка будет иметь при интерполяции значения иско мой точки. Если в область соседства не попадает достаточное количество точек, программа выбирает ближайшие возможные точки (точка, показанная на рисунке желтым цветом будет включена в верхний правый сектор). В этот сектор попадают только две точки. Помимо использования вариограммы, существует еще несколь ко средств для определения формы области соседства и ограни чений на использование опорных точек. Изучение пространст венного распределения опорных точек в ArcMap может также помочь в определении соседства. Например, опорные точки мо гут быть отобраны вдоль линий, образующих грид с точками, которые в направлении восток запад расположены ближе друг к другу, чем в направлении север юг. В этой ситуации, большая полуось соответствующего эллипса области поиска может быть направлена с юга на север. Размеры осей эллипса могут быть определены таким образом, чтобы примерно равное количество точек попадало в границы этого эллипса в обоих направлениях. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 183 Диалог Поиск соседства Используемые точки и присвоенные им весовые значения. Перекрестье соответствует искомой точке. 184 Количество точек, используемое при интерполировании значения в искомой точке Минимальное количество используемых точек (они могут находиться за пределами эллипса). Геометрия области и количество секторов, используемых в поиске. Значение в искомой точке Выберите опцию для предварительного просмотра интерполируемой поверхности. ARCGIS GEOSTATISTICAL ANALYST Определение размера области поиска соседства Размер области поиска соседст ва определяет форму области и ограничение на использование точек, попадающих в эту об ласть и применяемых при ин терполировании неизвестного значения в искомой точке. Вы задаете параметры соседст ва путем определения положе ния точек в окне вида данных и использования начальных зна ний, полученных при работе с инструментами ESDA и модели ровании вариограммы/ковари ации. Изменение числа точек, включаемых в область соседства 1. В диалоге Поиск соседства при помощи стрелочек поме няйте количество учитывае мых соседей (включаемых в поиск соседних точек). Или впечатайте требуемое значение. 2. Чтобы определить минималь ное количество точек, вклю чаемых в область соседства, отметьте опцию Учитывать по меньшей мере и с помощью стрелочек определите требуе мое значение. Или впечатайте значение в поле ввода. Подсказка Оценка соседства Влияние использования облас ти соседства может быть оценено с использованием инст рументов перекрестной про верки и проверки, которые включены в модуль Geostatistical Analyst. При необходимости, область поиска соседства мо жет быть переопределена, и на ее основе построена новая поверхность. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 1 2 185 Подсказка Весовые значения Веса отображаются абсо лютными значениями, то есть значения 6 процентов и 6 процентов будут “равны”. Подсказка Значение малой полуоси может быть задано большим, чем зна чение большой полуоси. Изменение формы области соседства 1. В диалоге Поиск соседства выберите иконку с изображе нием нужного эллипса, чтобы изменить форму области со седства, предложенную по умолчанию. 2. Отметьте опцию Форма. Параметры диалога станут активными. 3. С помощью стрелочек задай те значение угла, чтобы изме нить угол направления боль шой оси эллипса. 4. В окошках для ввода данных напечатайте требуемые раз меры большой и малой полу осей, что приведет к измене нию формы эллипса. В окне диалога отразятся вне сенные вами изменения. 2 1 3 4 186 ARCGIS GEOSTATISTICAL ANALYST Подсказка Проинтерполированное значение В диалоге Поиск соседства най дите рамку Искомая точка; значения полей X и Y соответ ствуют координатам искомой точки на карте (которая так же является центром эллипса в окне отображения данных). Определение проинтерполированного значения в определенной точке 1. Число соседей, используемых 1 для интерполяции, и проин терполированное значение показаны ниже полей для вво да данных (в нижней правой 2 части диалога). Чтобы опреде лить новую искомую точку, нажмите на нее в области ото бражения данных диалога. 2. Или введите значения коор динат X и Y. Проинтерполированное зна чение и количество соседей будут тут же обновлены в со ответствии с вновь выбранной точкой. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 187 188 Изменение вида карты 1. Чтобы увеличить масштаб отображения карты в диалоге Поиск соседства нажмите 1 кнопку Увеличить, затем рас 3 тяните прямоугольник на ту область, изображение которой вы хотите увеличить. 2. Чтобы уменьшить изображе ние, нажмите на кнопку Уменьшить. 3. Чтобы двигаться по изображе нию карты, нажмите кнопку Переместить, расположите курсор на изображении кар ты и, удерживая левую клави шу мыши, меняйте положе ние курсора. Карта будет смещаться в со ответствии с движением кур сора. 4. Чтобы отобразить карту для всей исследуемой территории, нажмите кнопку Полный экс тент. 5. Чтобы осуществить предвари тельный просмотр результиру ющей поверхности, выберите в меню Тип предварительного 5 просмотра опцию Поверх ность. Чтобы вернуться к пре дыдущему виду, выберите оп цию Соседи. 24 ARCGIS GEOSTATISTICAL ANALYST Выполнение проверки и перекрестной проверки Перед построением окончательной поверхности, вы должны соста вить себе некое представление о том, насколько хорошо подобран ная вами модель интерполирует значения в искомых точках. Пе рекрестная проверка и проверка помогают вам принять обосно ванное решение о том, какая из моделей наилучшим образом вы полняет интерполяцию значений. Вычисление статистики служит диагностикой, которая показывает, являются ли модель и связан ные с ней параметры приемлимыми. Перекрестная проверка и проверка убирают из набора данных одну или несколько опорных точек, а затем для этой точки вычис ляют значение. Таким способом, вы можете сравнить проинтерпо лированное и измеренное значение и на основе этого получить по лезную информацию о модели кригинга (например, параметрах вариограммы и поиске соседей). Далее мы рассмотрим разницу между проверкой и перекрестной проверкой. Перекрестная проверка использует все данные для оценки модели автокорреляции. Затем она последовательно, по одной, убирает опорную точку и интерполирует для этого местоположения соот ветствующее значение. Например, на диаграмме внизу показаны 10 опорных точек, распределенных случайным образом. Перекре стная проверка пропускает точку (показанную красным цветом) и интерполирует значение показателя для этого местоположения с использованием остающихся девяти точек (показанных синим цве том). Вычисленное и действительное значение пропущенной опор ной точки сравниваются. Эта процедура повторяется для второй точки, и так далее. Для всех точек, перекрестная проверка срав нивает измеренные и проинтерполированные значения. По сути, перекрестная проверка несколько “мошенничает”, используя все данные для оценки модели автокорреляции. После завершения перекрестной проверки, некоторые из опорных точек могут быть “отодвинуты в сторону” как необычные, требующие повторного подбора модели автокорреляции. Проверка сначала исключает из вычислений часть данных —назовем ее “тестовый набор данных”—а затем использует оставшиеся данные—назовем их “учебный набор данных”—для создания моделей тренда и авто корреляции, которые будут использованы в интерполяции. В мо дуле Geostatistical Analyst вы создаете тестовый и учебный набор данных с использованием инструмента Создать поднаборы данных. Однако, типы графиков и суммарная статистика, используемые для сравнения проинтерполированных и истинных значений, ана логичны и для перекрестной, и для простой проверки. Проверка создает модель только для поднабора данных, поэтому она напря мую не проверяет вашу окончательную модель, которая должна использовать полный набор опорных точек. Скорее, проверка вы числяет, является ли правильным “протокол” решений, напри мер, выбор модели вариограммы, выбор размера лага, выбор усло вий поиска соседей, и т.д. Если протокол решений хорошо работа ет для набора данных, используемого при проверке, вы можете с уверенностью предположить, что он будет также хорошо работать и для всего набора данных. В модуле Geostatistical Analyst есть несколько графиков и данных суммарной статистики, позволяющих сравнить измеренные и про интерполированные значения. Начнем с графика рассеивания, на котором по одной оси нанесены проинтерполированные значения, а по другой измеренные значения. Можно ожидать, что точки будут лежать вблизи линии 1:1 (черная пунктирная линия внизу). Однако, наклон обычно меньше единицы. Это является свойством кригинга, который имеет тенденцию к завышению маленьких зна чений и занижению высоких значений (см. нижний рисунок). И так далее для всех точек ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 189 Подобранная модель, проходящая через точки, показана синим цветом, а уравнение этой прямой приведено под графиком. Гра фик ошибок аналогичен графику интерполяции, за исключением того, что здесь истинные значения вычтены из проинтерполиро ванных значений. Для графика нормированных ошибок, измерен ные значения вычтены из проинтерполированных, а затем поделе ны на оцененные стандартные ошибки кригинга. Все эти три гра фика позволяют увидеть, насколько хорошо кригинг выполняет интерполяцию. Если все данные были независимыми (нет авто корреляции), все проинтерполированные значения будут одними и теми же (каждое проинтерополированное значение будет сред ним из измеренных), следовательно, голубая линия будет горизон тальной. При наличии автокорреляции и хорошей модели кригин га, голубая линия должна располагаться близко к линии 1:1 (чер ной пунктирной линии). Вы также можете видеть точки, рассеян ные около линии (некоторые показаны на предыдущем рисунке на стр. 172). Чем ближе точки расположены к линии 1:1, тем лучше. Окончательный график является графиком КК (Квантиль кван тиль). Он показывает квантили разности между проинтерполиро ванными и измеренными значениями, деленными на оцененные стандартные ошибки кригинга и соответствующие квантили из стан дартного нормального распределения. Если ошибки интерполяции (отклонения от истинных значений) подчиняются нормальному распределению, точки должны лежать примерно вдоль пунктир ной линии. При этом вы с уверенностью можете пользоваться ме тодами, основывающимися на нормальности распределения (на пример, для создания карты квантилей с использованием ординар ного кригинга). См. Главу 4, ‘Исследовательский анализ пространственных дан ных’, для более подробной информации о графиках КК. И наконец, в левом нижнем углу дана суммарная статистика по ошибкам интерполяции с использованием кригинга. Вы воспользу етесь этими данными для диагностики по трем основным момен там: 1. Вы захотите, чтобы проинтерполированные вами значения ока зались несмещенными (центрированными по измеренным зна чениям). Если ошибки вычислений не смещены, средняя ошиб ка интерполяции должна быть примерно равной нулю. Однако, это значение зависит от масштаба данных, поэтому чтобы их стандартизировать, используют нормированные ошибки интер поляции, которые получаются при делении ошибок интерполя ции на их стандартные ошибки. Среднее значение нормиро ванных ошибок интерполяции должно быть примерно равно нулю. 2. Вы бы хотели, чтобы проинтерполированные вами значения были как можно ближе к измеренным значениям. Среднеквад ратичные ошибки интерполяции вычисляются как корень ква дратный из среднего квадратов расстояний (размеров зеленых отрезков), показанных на диаграмме интерполяции, приведен ной выше. Чем короче зеленые отрезки, тем ближе проинтер полированные значения к своим истинным значениям, и тем меньше среднеквадратичные ошибки интерполяции. Эта ста тистика может быть использована для сравнения различных моделей путем визуального анализа близости проинтерполиро ванных и измеренных значений. Чем меньше среднеквадра тичная ошибка интерполяции, тем лучше. 3. Вы захотите, чтобы ваша оценка неопределенности, или стан дартные ошибки интерполяции, были достоверными. Каждая из моделей кригинга дает оцененные стандартные ошибки ин терполяции. Помимо выполнения интерполяции, мы оценива ем отклонение проинтерполированных значений от измерен ных. Важно получить корректные отклонения. Например, в ординарном кригинге (предполагающем, что отклонения под чиняются закону нормального распределения), карты кванти лей и вероятности зависят от стандартных ошибок кригинга в такой же степени, как и сами проинтерполированные значе ния. Если средние стандартные ошибки близки к среднеквад ратичной ошибке интерполяции, тогда вы сможете корректно оценить неопределенность при интерполировании значений. 190 ARCGIS GEOSTATISTICAL ANALYST Если средние стандартные ошибки больше, чем среднеквадра тичные ошибки интерполяции, вы завышаете оценку отклоне ний в ваших вычислениях; если средние стандартные ошибки меньше, чем среднеквадратичные ошибки интерполяции, вы занижаете оценку отклонений в ваших вычислениях. Другой способ разделить каждую ошибку вычислений на оцененную стандартную ошибку интерполяции. В среднем, они должны быть похожи, и следовательно, среднеквадратичные нормиро ванные ошибки должны быть близки к единице, если стандарт ные ошибки интерполяции достоверны. Если среднеквадратич ные нормированные ошибки больше 1, вы занижаете оценку неопределенности проинтерполированных значений; если же среднеквадратичные нормированные ошибки меньше 1, вы за вышаете оценку неопределенности проинтерполированных зна чений. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 191 Диалог Cross Validation and Validation (Перекрестная проверка и проверка) Наилучшим образом подобранная линия График рассеяния перекрестной проверки Линия 1:1 Суммарная статистика 192 Сохранение результатов в файле Результаты перекрестной проверки или простой проверки ARCGIS GEOSTATISTICAL ANALYST Выполнение перекрестной Изучение полученной модели 1 проверки для 1. В диалоге Перекрестная про верка выберите одну из закла оценки выбранных док Проинтерполированные значения, Ошибка, Нормиро ванная ошибка, или График параметров КК в зависимости от метода, который вы хотите использо Перекрестная проверка позво ляет вам определить “насколь вать для просмотра результа тов. ко хороша” ваша модель. Ваша цель получить нормированное среднее ошибки вычислений, примерно равное 0, небольшие среднеквадратичные ошибки интерполяции, среднюю стан дартную ошибку близкую к среднеквадратичным ошибкам Выбор определенной точки интерполяции, и нормирован ные среднеквадратичные ошибки интерполяции, при мерно равные 1. Точки должны быть расположе ны как можно ближе к серой пунктирной линии. Обратите внимание на точки, которые сильно отклоняются от линии. 1. В диалоге Перекрестная про верка в таблице, данной в правой нижней части диало га, выберите строку, соответ ствующую интересующей вас точке. Когда строка выбрана, точка выделяется цветом на диа грамме в верхней части диа Подсказка лога. Выбор точек Когда в таблице результатов выбрана строка, точка на гра фике выделяется цветом. Для сортировки значений выберите столбец. Это поможет найти определенные точки на графи ке. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 1 193 Подсказка Сохранение Просмотр всех строк и столбцов статистики перекрестной Используйте линейки прокрут проверки в файл ки для просмотра всех строк и столбцов таблицы. 1. Нажмите кнопку Сохранить результаты перекрестной про Подсказка верки. Просмотр сохраненной таблицы Чтобы просмотреть сохранен 2. Перейдите к папке на диске, в которой вы хотите сохранить набор данных. ную в файле таблицу, выберите 3. Наберите название набора Добавить на стандартной па данных. нели инструментов, перейдите 4. Выберите тип набора данных. к базе данных, дважды щелкни 1 те по иконке, а затем добавь 5. Нажмите Сохранить. те таблицы. В таблице содер жания ArcMap выберите таб лицу и, нажав правую клавишу 2 мыши, перейдите к опции От крыть. 5 3 4 194 ARCGIS GEOSTATISTICAL ANALYST Оценка протокола решений с использованием проверки Проверка позволяет оценить полученные вами результаты интерполяции. Ваша цель получить нормиро ванное среднее ошибок вычис лений, примерно равное 0, не большие среднеквадратичные ошибки вычислений, средние стандартные ошибки около сред неквадратичных ошибок вычис лений, и нормированные сред неквадратичные ошибки интер поляции, примерно равные 1. Точки должны быть расположе ны как можно ближе к серой пунктирной линии. Обратите внимание на точки, которые сильно отклоняются от линии. Подсказка Разделение набора данных на тестовый и учебный поднаборы Установите движок посереди не, чтобы разбить данные при мерно поровну между тесто вым и учебным набором. См. также См. раздел ‘Выполнение пере крестной проверки и проверки для оценки выбранных параме тров’ (предваряющего данные упражнения) для сравнения по нятий проверки и перекрестной проверки. Создание поднаборов данных для использования их в проверке модели 1. Добавьте набор данных, для которого вы хотите создать поднаборы, в ArcMap. 2. Выберите опцию Создать под наборы данных. 3. Из списка выберите набор данных, для которого вы хо тите создать поднабор. 4. Нажмите Далее. 5. Необязательный шаг: измени те местоположение результи рующего файла базы геодан ных на диске и/или его назва ние. 6. Необязательный шаг: изме ните названия поднаборов, предложенные по умолчанию. 7. Удерживая движок, пере двиньте его в требуемое поло жение. 8. Нажмите Готово. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 2 3 4 7 5 6 8 195 Подсказка Выполнение проверки 34 5 Просмотр всех строк и 1. Нажмите на кнопку Добавить столбцов данные и перейдите к тесто Используйте линейки прокрут вому и учебному набору дан 6 ки для просмотра всех строк и ных (созданных при выполне 7 столбцов таблицы. нии предыдущего упражне Подсказка ния). Нажмите Добавить. Выделение значений Когда в таблице результатов 2. Запустите Мастер операций геостатистики. выбрана строка, точка на гра 3. В окне Входные данные вы фике выделяется цветом. Для берите учебный набор данных сортировки значений выберите (созданный в предыдущем столбец. Это поможет найти упражнении). определенные точки на графи ке. 4. В окне Атрибут выберите по казатель, значения которого Подсказка вы хотите использовать в ин Просмотр сохраненной терполяции. 8 9 таблицы Чтобы просмотреть сохранен ную в файле таблицу, выберите кнопку Добавить на стандарт ной панели инструментов, пе рейдите к базе данных, дважды 5. Отметьте опцию Проверка. 6. В окне Входные данные вы берите тестовый набор данных (созданный в предыдущем упражнении). щелкните по иконке, а затем добавьте таблицы. В таблице содержания ArcMap выберите таблицу и, нажав правую кла вишу мыши, перейдите к опции 7. В окне Атрибут выберите тот же самый атрибут, который вы выбирали для учебного набо ра данных. Открыть. 8. Выберите метод, который вы хотите использовать. 9. Нажимайте Далее в этом и во всех последующих диалогах до тех пор, пока вы не дойде те до диалога Проверка. 10. Необязательный шаг: сохра 10 ните таблицу с результатами проверки в базе данных. 196 ARCGIS GEOSTATISTICAL ANALYST Сравнение моделей Сравнение помогает вам определить, насколько модель, кото рая использовалась для создания геостатистического слоя, луч ше, чем какая либо другая модель. Два геостатистических слоя, которые вы сравниваете, могут быть созданы с использованием двух различных моделей (например, по методу взвешенных рас стояний IDW и ординарного кригинга), либо они могут быть созданы с использованием одной и той же модели, но с различ ными параметрами. В первом случае, вы сравниваете, какой из методов лучше подходит для использования с вашими данными, во втором вы изучаете влияние различных исходных парамет ров на модель при построении результирующей поверхности. Диалог Сравнение использует статистику перекрестной провер ки аналогично тому, как было рассказано в предыдущем разде ле. Однако, он позволяет вам изучить статистику и графики для различных моделей совместно, в одном окне. В целом, лучшая модель это та модель, нормированная средняя ошибка которой близка к нулю, и которая характеризуется наименьшей средне квадратичной ошибкой интерполяции, имеет значение средней стандартной ошибки, близкое к среднеквадратичной ошибке вычислений, и нормированную среднеквадратичную ошибку, близкую к единице. Как правило, перед тем, как одна из поверхностей будет при знана “лучшей” и будет либо сама использоваться как оконча тельная, либо войдет в другую, “большую” модель, предназна ченную для решения существующей проблемы (например, мо дель условий строительства новых домов), создается несколько поверхностей. Вы можете последовательно сравнивать каждую из поверхностей с другой, исключая “худшую” из двух сравни ваемых, до тех пор, пока не останутся две “лучшие” поверхно сти, и вы не перейдете к сравнению их друг с другом. Вы може те прийти к заключению, что для данного конкретного анализа, лучшая из двух окончательных поверхностей и является “луч шей” из возможных. Что следует учитывать при сравнении методов и моделей Существует два момента, на которые следует обратить внима ние при сравнении результатов различных методов и/или моде лей: один из них оптимальность, второй достоверность. Например, для определенной модели среднеквадратичная ошиб ка интерполяции может быть очень маленькой. Исходя из это го, вы можете прийти к заключению, что это и есть “оптималь ная” модель. Однако, при сравнении с другой моделью, может оказаться, что среднеквадратичная ошибка интерполяции бли же к средней оцененной стандартной ошибке интерполяции. Это более достоверная модель, потому что когда вы интерполи руете значение в точке, не имея данных, у вас есть только оце ненные стандартные ошибки, которые и используются для оцен ки неопределенности ваших вычислений. Когда средние оце ненные стандартные ошибки интерполяции близки к ее средне квадратичным ошибкам, полученным в результате перекрест ной проверки, вы уверены, что стандартные ошибки интерпо ляции являются удовлетворительными. Наряду со статистикой, приведенной в диалоге Сравнение, вы должны также использовать первичную информацию, имеющу юся в вашем наборе данных и извлеченную вами с помощью ин струментов ESDA (Исследовательского анализа пространствен ных данных) при оценке того, какая из моделей является “луч шей”. Обратитесь к предыдущему разделу по перекрестной про верке и проверке для более подробной информации о том, как была получена статистика, и как она должна использоваться в анализе. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 197 Диалог Сравнение результатов перекрестной проверки Модель, подобранная для слоя 1 График рассеяния перекрестной проверки для слоя 2 График рассеяния перекрестной проверки для слоя 1 Линия 1:1 для слоя 1 Суммарная статистика для слоя 1 Линия 1:1 для слоя 2 Модель, подобранная для слоя 2 Суммарная статистика для слоя 2 198 ARCGIS GEOSTATISTICAL ANALYST Сравнение моделей При сравнении моделей вы долж ны искать ту, нормированное среднее которой ближе к нулю, а также имеющую наименьшую среднеквадратичную ошибку интерполяции, среднюю стан дартную ошибку вычислений, ближайшую к среднеквадратич ной ошибке интерполяции, и нормированную среднеквадра тичную ошибку, значение кото рой ближе всего к единице. Чтобы иметь возможность срав нить модели, у вас должно быть два геостатистических слоя (со зданных с использованием моду ля Geostatistical Analyst). Эти два слоя могут быть созданы с исполь зованием различных методов интерполяции (например, мето да взвешенных расстояний IDW и ординарного кригинга), либо с использованием одного и того же метода, но различных парамет ров. Выполнение сравнения 1. Выберите в таблице содержа ния ArcMap один из слоев, который вы будете сравнивать, нажмите правую клавишу мыши и выберите опцию Сравнить. 2. В меню С: выберите второй слой, с которым вы будете сравнивать первый. 3. Выберите различные заклад ки для просмотра некоторых результатов сравнения. 4. Нажмите Закрыть, чтобы за крыть диалог Сравнение ре зультатов перекрестной про верки. См. также См. раздел ‘Выполнение пере крестной проверки и проверки для оценки выбранных параме тров’ (предваряющего данные упражнения) для сравнения по нятий проверки и перекрестной проверки. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 1 2 3 4 199 Моделирование распределений и определение методов преобразований Преобразования по методу Box–Cox, арксинуса и логарифмические Модуль Geostatistical Analyst дает возможность использовать не сколько методов преобразований, включая метод Box–Cox (так же известный как степенные преобразования), логарифмичес кие преобразования, и преобразования по методу арксинуса. Предположим, что у вас есть данные наблюдений в опорных точках Z(s), и есть некое преобразование Y(s) = t(Z(s)). Как правило, вы хотите найти преобразование, которое приведет к тому, что значения Y(s) будут подчиняться закону нормального распределения. Часто результатом преобразований является по стоянная дисперсия данных для всей изучаемой территории. Теперь рассмотрим каждое преобразование. Преобразование по методу Box–Cox выглядит следующим об разом: Y(s) = (Z(s)λ 1)/λ для λ ≠ 0. Например, предположим, что ваши данные состоят из подсчетов встречаемости какого либо явления. Для этих типов данных, дисперсия часто соотносится со средним значением. Это означает, что если для части изучаемой территории количество подсчетов мало, изменчивость в этом районе будет меньше, чем изменчивость в другом районе, в котором количество подсчетов больше. В этом случае, преобразование, использующее квадрат ный корень, поможет вам сделать дисперсии более постоянны ми для всей изучаемой территории и, кроме этого, оно часто приводит данные к нормальному распределению. Преобразова ние по методу квадратного корня является частным случаем преобразования Box–Cox ( λ = Ѕ). Логарифмическое преобразование, по сути, является также ча стным случаем преобразования по методу Box–Cox при l = 0; формула преобразования имеет следующий вид: Y(s) = ln(Z(s)) где Z(s) > 0, а ln натуральный логарифм. Следствием логариф мического преобразования является метод интерполяции, изве стный как логнормальный кригинг, тогда как для всех осталь ных значений l, соответствующий метод интерполяции известен как трансгауссов кригинг. Логарифмическое преобразование часто используется в тех случаях, когда данные имеют асиммет ричное распределение, и в них есть несколько очень больших значений. Эти большие значения могут быть локализованы на изучаемой территории, и логарифмическое преобразование по может вам сделать дисперсии более постоянными и нормализо вать ваши данные. Преобразование по методу арксинуса выглядит следующим об разом: Y(s) = sin 1(Z(s)) где Z(s) лежат в интервале между 0 и 1. Преобразование по методу арксинуса может быть использовано для относительных данных или данных, выраженных в процентах. Часто, когда данные относительные, дисперсия наименьшая для значений близких к 0 и 1 и наибольшая, когда значения близки к 0.5. Тогда преобразование по методу арксинуса часто приводит к тому, что дисперсии постоянны для всей изучаемой территории и, кроме того, часто его результатом является нормальное рас пределение данных. 200 ARCGIS GEOSTATISTICAL ANALYST Преобразование по методу нормальных меток Преобразование по методу нормальных меток ранжирует зна чения вашего набора данных от самых маленьких до самых боль ших и сопоставляет эти классы с соответствующими классами графика нормального распределения. Затем преобразование осуществляется следующим образом: значения берутся из соот ветствующего класса нормального распределения. Это можно видеть на следующих диаграммах. На первой показана гисто грамма, которая обычно строится при проведении исследова тельского анализа данных. По другому данные можно отобра зить, воспользовавшись графиком кумулятивного распределе ния, который показан на правом рисунке. деления. Это хорошо видно при рассмотрении процедуры сопо ставления графиков, показанной на рисунке. В данном примере, значение исходных данных, равное 0.09 по методу нормальных меток преобразуется в значение, примерно равное нулю. В модуле Geostatistical Analyst можно использовать три метода аппроксимации: прямой, линейный и Гауссовых керн функций. Прямой метод использует наблюдаемое кумулятив ное распределение; линейный метод подбирает линии между каждым “шагом” кумулятивного распределения; и метод Гаус совых кернфункций аппроксимирует вероятностное распреде ление путем подбора линейной комбинации из кумулятивных распределений плотности. После выполнения интерполяции в преобразованном масштабе, необходимо выполнить обратное преобразование, чтобы привести вычисленные значения к ис ходному масштабу. Например, если вы используете прямую аппроксимацию нормального распределения, обратное преоб разование будет выглядеть следующим образом: 1 Чтобы получить преобразование по методу нормальных меток, воспользуйтесь кумулятивным распределением. Возьмите ку мулятивное распределение наблюдений и сопоставьте его с ку мулятивным распределением стандартного нормального распре 1 0 -3 0 3 Normal Scores 0 -3 0 3 Normal Scores Выбор метода аппроксимации зависит от допущений, сделан ных вами, и от степени сглаживания аппроксимации. Прямой метод наименее сглаженный и характеризуется наименьшим количеством допущений; линейный метод занимает промежу точное положение, а метод Гауссовых кернфункций обладает самым сглаженным обратным преобразованием, но наряду с этим и самые серьезные допущения (например, то, что распределе ние данных может быть аппроксимировано с помощью сочета ния ограниченного количества нормальных распределений). ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 201 Диалог Преобразования по методу нормальных меток Подобранная плотность вероятности (только для метода Гауссовых кернфункций) Набор данных Подобранная функция кумулятивного распределения (красная линия) Метод аппроксимации: Прямой (по умолчанию), Линейный, Гауссовых кернфункций 202 Выберите количество Гауссовых кернфункций Гистограмма данных, представляющая плотность вероятности Количество столбцов гистограммы Эмпирическая функция кумулятивного распределения ARCGIS GEOSTATISTICAL ANALYST Сравнение преобразований по методу нормальных меток с другими преобразованиями Преобразования по методу нормальных меток могут быть сопо ставлены с преобразованиями по методу Box–Cox, арксинуса, и логарифмическими преобразованиями. Наиболее существенная разница между ними состоит в том, что функция преобразова ний NST меняет каждый определенный набор данных, в то вре мя как преобразование BAL не делает этого (например, функ ция логарифмического преобразования всегда натуральный логарифм). Однако цель преобразований по методу NST сде лать случайные ошибки всей совокупности (а не только опорных точек) нормально распределенными. Таким образом, важно, что кумулятивное распределение опорных точек отражает истин ное кумулятивное распределение всей совокупности данных. С точки зрения классической статистики, преобразование NST, примененное к непространственным данным, может рассмат риваться как метод, основанный на ранжировании. Однако, метод нормальных меток может быть полезен в геостатистике, потому что, когда данные зависимы, с использованием метода нормальных меток легче определить и смоделировать автокор реляцию. По этой причине, преобразование по методу нормаль ных меток должно осуществляться после вычитания тренда, поскольку ковариация и вариограммы рассчитываются для ос татков (значений, оставшихся после вычитания тренда). Сопо ставьте это с логарифмическим преобразованием, когда исклю чаются любые связи между дисперсией и трендом. Следователь но, после логарифмических преобразований вычитаются тренд и модель автокорреляции (необязательно). Часто вследствие этого появляется примерно нормальное распределение остат ков, но в целом это не является специфической целью логариф мических преобразований, в отличие от преобразований по ме тоду нормальных меток. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 203 Использование преобразований (логарифмического, по методу Box– Cox и арксинуса) Использование преобразований позволяет сделать дисперсии по стоянными для всей изучаемой территории и привести данные ближе к нормальному распреде лению. Воспользуйтесь гистограммой и нормальными графиками КК в инструментах ESDA, чтобы, ис пытав различные методы преоб разований, получить нормальное распределение данных. Некоторые методы геостатисти ки решающим образом зависят от данных, подчиняющихся нор мальному распределению,—на пример, дизъюнктивный кри гинг, карты квантилей и веро ятности для ординарного, про стого и универсального кригин га. Поэтому выполнение преоб разований может привести дан ные к распределению, которое ближе к нормальному, чем у ис ходных данных. Подсказка Когда вы можете выполнять преобразования Опция выполнения преобразова ний может быть использова на, когда в диалоге Выберите входные данные и метод вы вы бираете методы кригинга и ко кригинга. Использование преобразований 1. В диалоге Выбор геостатисти ческого метода выберите нуж ный метод преобразований из меню Преобразование. 2. Нажмите Далее. 3. Переходите от диалога к диа логу для того, чтобы постро ить поверхность. 204 1 2 ARCGIS GEOSTATISTICAL ANALYST Использование преобразований по методу нормальных меток По методу нормальных меток данные будут преобразованы и приведены к одномерному нор мальному распределению, что позволит применить к ним ме тоды простого и дизъюнктивно го кригинга. Желательно сравнить подоб ранную модель с эмпирической функцией кумулятивного рас пределения для каждого из трех методов аппроксимации, ис пользуемых в преобразованиях по методу нормальных меток. Моделирование распределений 1. Для исследования распреде ления выберите интерполя цию по методу простого или дизъюнктивного кригинга. 2. В диалоге Выбор геостатисти ческого метода, из меню Пре образование выберите опцию По методу нормальных меток. 3. Нажмите Далее. 4. Или, чтобы поменять способ отображения графика, выбе рите опцию Кумулятивное рас пределение. 5. Или, задайте количество столбцов, которое должно быть отображено на гисто грамме. 6. В окне Выбор набора данных выберите другой набор данных (только для кокригинга, ког да у вас есть два или большее количество наборов данных). ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 1 2 3 6 5 4 205 Проверка на двумерное нормальное распределение Дизъюнктивный кригинг требует соблюдения условия подчинения данных двумерному нормальному распределению. Помимо этого, для того, чтобы создать карты вероятности и квантилей, предполо жим, что данные подчиняются полному многомерному нормально му распределению. Чтобы проверить данные на одномерное нор мальное распределение, вы можете воспользоваться нормальными графиками КК. Теперь проверим данные на двумерное нормаль ное распределение. (Ни одна из этих проверок не гарантирует, что данные подчиняются полному многомерному нормальному распре делению, но иногда разумно выдвинуть это предположение, осно вываясь на использовании этих инструментов диагностики.) Рас смотрим следующее вероятностное утверждение: f(p,h) = Prob[Z(s) ≤ zp, Z(s + h) ≤ zp] где zp стандартный нормальный квантиль для некоей вероятнос ти p. Например, известны значения стандартных нормальных кван тилей: при p = 0.975, zp = 1.96; при p = 0.5, zp = 0; а при p = 0.025, z = 1.96. Выражение вероятности, приведенное выше, берет зна p чение переменной Z в точке s и другой переменной Z в некоей точке s + h, и дает значение вероятности того, что оба этих значе ния меньше z . Эта формула вероятности является функцией p f(p,h), зависящей от p (и, соответственно, z ) и h. Функция будет p также зависеть от степени автокорреляции между Z(s) и Z(s + h). Теперь предположим, что Z(s) и Z(s + h) подчиняются двумерно му нормальному распределению. Если значение автокорреляции известно, для функции f(p,h) существуют формулы. Предполо жим, что h константа, и только значение p меняется. Тогда мож но предположить, что функция будет выглядеть следующим обра зом: 1.0 1.0 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 ) h, p(f ) h, p(f 0.2 0.4 0.6 0.8 1.0 p -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 yp Правый график похож на график кумулятивного распределения вероятности. Теперь предположим, что значение p остается посто янным, и функция f(p,h) меняется в зависимости от h. Предположим, что значение h очень мало. В этом случае, вероят ность Prob[Z(s) ≤ z , Z(s + h) ≤ z ] очень близка к вероятности p p Prob[Z(s) ≤ z ] = p. Далее, предположим, что значение h очень p велико. В этом случае, вероятность Prob[Z(s) ≤ z , Z(s + h) ≤ z ] p p очень близка к вероятности Prob[Z(s) ≤zp]ґProb[Z(s + h) ≤ zp] = p2 (потому что значения Z(s) и Z(s + h) практически независимы). Таким образом, для фиксированного значения p, следует ожидать, что значения функции f(p,h) будут меняться от p до p2. Теперь рассмотрим выражение f(p,h) как функцию обоих параметров p и расстояния h, вы можете наблюдать нечто похожее на следующем рисунке. Эта функция может быть конвертирована в вариограммы и кова риационные функции для индикаторов. Если вероятность Prob[Z(s) ≤ zp, Z(s + h) ≤ zp] = E[I(Z(s) ≤ zp)ґI(Z(s + h) ≤ zp)], где I(утверждение) индикаторная функция, которая равна 1, если утверждение истинно, или 0, если утверждение ложно, тогда ковариационная функция для индикаторов с фиксированным зна чением p выглядит следующим образом: CI(h;p) = f(p,h) – p2 а вариограмма для индикаторов с фиксированным p: gI(h;p) = p f(p,h) 206 ARCGIS GEOSTATISTICAL ANALYST Следовательно, вы можете оценить вариограмму и ковариационную функцию индикаторов исходных данных и использовать эту оценку для получения ожидаемых вариограмм и ковариационных функций индикаторов для различных значений p. Например, они могут выглядеть следующим образом: Красные точки на верхнем рисунке (в диалоге Моделирование вариограммы/ковариации) это значения эмпирической ковариации и вариограммы для индикаторных переменных. Зеленая линия это кривая, построенная теоретическим способом, для индикатор ной вариограммы или индикаторной ковариации, предполагающая, что используемые данные подчиняются двумерному нормально му распределению, а желтая линия модель, подобранная для исходных индикаторных данных. Таким образом, зеленая линия и желтая линия должны совпасть, если данные имеют двумерное нормальное распределение. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 207 Диалог Исследовать двумерное распределение Теоретическая кривая ковариации индикаторов, предполагающая, что используемые данные подчиняются двумерному нормальному распределению (зеленая линия) Подобранная ковариационная функция для эмпирической ковариации индикаторов (желтая линия) Эмпирическая ковариация для индикаторов 208 ARCGIS GEOSTATISTICAL ANALYST Проверка двумерного распределения Это средство проверить, подчи няются ли данные двумерному нормальному распределению. Желтая и зеленая линии долж ны располагаться близко друг к другу, если данные подчиняют ся закону двумерного нормаль ного распределения. Чтобы можно было применить дизъюнктивный кригинг, необ ходимо, чтобы используемые данные имели двумерное нор мальное распределение. Созда ние карт вероятности и кван тилей с использованием метода простого кригинга требует ус ловия соответствия данных многомерному нормальному распределению, и проверка двумерного распределения мо жет помочь подтвердить пред положение о многомерном нор мальном распределении. Подсказка Методы, которые позволяют проверить двумерное распределение В диалоге Выбор геостатис тического метода выберите метод кригинга или кокригин га, а затем метод простого кригинга/кокригинга или дизъ юнктивного кригинга/кокри гинга. Проверка двумерного распределения 1. На панели инструментов ArcMap нажмите кнопку До бавить данные и добавьте слой, данные которого вы хо тите проверить на двумерное распределение. 2. Запустите Мастер операции геостатистики. 3. Выберите метод кригинга или кокригинга. 4. Нажмите Далее в диалоге Вы берите входные данные и ме тод. 5. Выберите метод простого кри гинга/кокригинга или дизъ юнктивного кригинга/кокри гинга. 6. Отметьте опцию Исследовать двумерное распределение и выберите опцию Преобразова ние по методу нормальных ме ток. 7. Выберите комбинацию набо ров данных, которую вы хоти те использовать (только для кокригинга). 8. Наберите значение количест ва проверяемых квантилей. 9. Нажмите Далее. 10. Выберите Метод аппроксима ции, задайте параметры, и от метьте либо опцию Плотность вероятности либо Кумулятив ное распределение в диалоге Преобразование по методу нормальных меток. Нажмите Далее. f ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 5 6 7 8 9 209 11. Задайте необходимые пара метры в диалоге Моделиро вание вариограммы/ковари ации и нажмите Далее. 12. Изучите двумерное распреде ление в диалоге Исследова ние двумерного распределе ния. Нажмите Далее. 210 ARCGIS GEOSTATISTICAL ANALYST Применение декластеризации для данных, отобранных с различной густотой Очень часто опорные точки не распределены в пространстве равномерно или случайным образом. По разным причинам, данные могут отбираться в одних районах с большей густотой, чем в других. Как вы убедились в предыдущем разделе, для правильного применения преобразований по методу нормальных меток важно, чтобы гистограмма (и кумулятивное распределение) выборки правильно отражала гистограмму для всей совокупности данных. Если данные неравномерно распределены в пространстве и при этом пространственно автокоррелируют, результирующая гистограмма выборки может не соответствовать гистограмме для данных всей совокупности. На следующих рисунках приведен пример, иллюстрирующий это утверждение. 15 5 0 10 Зíàчåíèÿ value -5 5 -10 0 10 20 30 40 50 60 70 80 90 100 x 5 0 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 Зíàчvåaíluèeÿ 15 0 10 Зíàчåíèÿ value -5 5 -10 0 10 20 30 40 50 60 70 80 90 100 x 0 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 Зíàчvåalíueèÿ На левом верхнем рисунке, вся совокупность значений в 100 точках вдоль линии показана черными точками. Эти значения были получены с использованием пространственно коррелированного процесса с постоянным средним значением и сильной позитивной корреляцией. Выборка это все другие точки, начиная с первой, показанные маленькими окружностями. Справа показаны гисто граммы: синим цветом гистограмма совокупности, малиновым цветом гистограмма выборки. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 211 Поскольку выборка равна примерно половине всей совокупности, столбики гистограммы выборки должны быть равны половине вы соты столбиков гистограммы совокупности, с некоторыми отклоне ниями. На левом нижнем рисунке на стр.211 выборка сделана с различной густотой: до 34 ой точки отобрана каждая пятая, затем до 70 ой отобраны все точки, а затем до конца снова каждая пя тая. В конечном итоге выборка снова включает половину точек популяции. Выборка с различной густотой до середины опорных точек приводит к тому, что выборка содержит высокую долю значе ний, близких к среднему, и, следовательно, столбики гистограммы примерно равны столбикам гистограммы для всей популяции для значений от 3 до 1. Вследствие этого, на гистограмме выборки плохо представлены очень низкие и очень высокие значения. Одно из решений, которое может быть использовано для выборки с различной густотой, состоит во взвешивании данных; при этом опор ным точкам, расположенным на участках с высокой густотой то чек, присваиваются меньшие веса (что приведет к уменьшению высоты столбиков гистограммы выборки для значений от 3 до 1 для данных, отобранных с различной густотой, из предыдущего примера), а точкам, расположенным по территории разреженно, присваиваются большие веса (что приведет к увеличению высоты столбиков гистограммы для низких и высоких значений данных). Модуль Geostatistical Analyst позволяет использовать два метода. Метод, предложенный по умолчанию, это декластеризация по ячейкам ). При использовании этого метода, прямоугольные ячей ки образуют грид, совмещаемый с опорными точками, и каждой точке ячейки присваивается вес, обратно пропорциональный ко личеству точек, попадающих в эту ячейку. Пример приведен на следующем рисунке. Вес 1 Вес 1/4 Вес 1/2 Все, что остается сделать вам, это выбрать размер грида. Можно принять несколько схем, и для того, чтобы выбрать какую из этих схем лучше применить, вы можете обратиться к справочной лите ратуре. Один из инструментов модуля Geostatistical Analyst позволя ет построить график, на котором показано взвешенное среднее значение для всех данных при различных размерах ячеек. Предла гается выбрать размер ячейки, соответствующий минимальному взвешенному среднему, если данные были отобраны с различной густотой в районах с высокими значениями, и, напротив, выбрать размер ячейки, соответствующий максимальному взвешенному среднему, если данные были отобраны с различной густотой в рай онах с низкими значениями. Другая схема использует полигональный метод, при котором для каждой опорной точки полигон определяется таким образом, что бы все точки, попадающие внутрь этого полигона, были бы ближе к этой точке, чем к любой другой опорной точке (см. рисунок). Опорные точки показаны маленькими точками, а вокруг них нари сованы полигоны, цвет которых соответствует размеру полигонов. Идея состоит в том, чтобы присвоить каждой опорной точке вес, пропорциональный площади, которую он “образует”. Проблема этого метода состоит в том, что для краевых точек трудно коррект но определить значения весов. Краевым точкам часто могут быть присвоены завышенные значения весов, так как полигон прости рается до границы области исследования. В модуле Geostatistical Analyst, граница это прямоугольник, что часто приводит к тому, что краевым точкам присваиваются высокие значения. 212 ARCGIS GEOSTATISTICAL ANALYST Диалог Декластеризация Соотношение “высоты” и Задайте “ширины” размер ячейки ячейки Цветовая шкала цветом показан размер полигонов Ориентация грида (сетки) Грид, показывающий размер ячеек График взвешенных средних в зависимости от размера ячеек грида ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 213 Декластеризация данных, отобранных с различной густотой Существует два способа выпол нить декластеризацию ваших данных: методом подбора гри да и методом полигонов Воро ного. Выборка должна быть сформи рована таким образом, чтобы быть репрезентативной для всей поверхности. Однако, час то выборка осуществляется в местах с наибольшей концент рацией точек, что приводит к искажению отображения по верхности. Декластеризация учитывает неравномерное рас положение опорных точек пу тем их соответствующего взве шивания, что приводит к воз можности более точного постро ения поверхности. Подсказка Использование декластеризации Декластеризация может быть применена только в том случае, если используется преобразование по методу нормальных меток. Чтобы иметь возможность вос пользоваться преобразованием по методу нормальных меток, выби райте методы вероятностного, простого или дизъюнктивного кригинга/кокригинга. Выполнение декластеризации по методу ячейки 1. В диалоге Выберите входные данные и метод выберите кри гинг или кокригинг. 2. Выберите один из методов кри гинга или кокригинга: вероят ностный, дизъюнктивный, или простой. 3. В диалоге Преобразование вы берите преобразование по ме тоду нормальных меток. 4. Выберите опцию Декластери зация перед преобразованием. 5. Нажмите Далее. 6. В меню Выбор набора данных определите набор данных, ко торый вы хотите отобразить (только для кокригинга). 7. Задайте необходимые параме тры. 8. Выбирайте различные заклад ки для того, чтобы просмотреть диаграммы, отражающие изме нение выборки в зависимости от Размера ячейки, Анизотро пии и Угла наклона ячейки. 9. Измените размер ячейки, ани зотропию, смещение и угол на клона ячейки, чтобы опреде лить экстремум графика. 10. Или из меню Метод декласте ризации выберите Полигоны, чтобы отобразить полигоны, по которым будет выполняться декластеризация. 11. Нажмите Далее. f 214 3 2 4 5 6 10 9 8 11 ARCGIS GEOSTATISTICAL ANALYST 12. Из меню Аппроксимация вы берите метод аппроксимации, определите параметры, и от метьте опцию Плотность ве роятности или Кумулятивное распределение в диалоге Преобразование по методу нормальных меток. Нажмите Далее. 13. В диалоге Моделирование ва риограммы/ковариации за дайте требуемые параметры и нажмите Далее. 14. Определите параметры в ди алоге Поиск соседства и на жмите Далее. 15. Изучите результаты в диало ге Перекрестная проверка и нажмите Готово. 16. В диалоге Информация о ре зультирующем слое нажмите OK. ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ 215 Вычитание трендов из данных Иногда вам может понадобиться вычесть тренд поверхности из данных и применить кригинг или кокригинг для данных с вы чтенным трендом, которые носят название остатков. Рассмотрим аддитивную модель, Z(s) = m(s) + e(s) где m(s) некая детерминистская поверхность (которая носит название тренда) и e (s) пространственно коррелированная ошибка. Теоретически, тренд зафиксирован, что означает, что если вы будете моделировать данные снова и снова, тренд менять ся не будет. Однако, вы увидите флуктуации в моделируемых поверхностях, что вызвано начилием автокоррелированных слу чайных ошибок. Обычно тренд в пространстве меняется посте пенно, в то время как случайные ошибки меняются быстрее. Ме теорологическим примером тренда может быть наблюдаемое вами (и известное из теории) постепенное изменение температуры в зависимости от широты. Однако, метеорологические наблюдения для каждого конкретного дня отражают локальные отклонения, которые возникают вследствие движения фронтальных масс, раз личий в подстилающей поверхности, облачности, и т.п. и являют ся труднопредсказуемыми, следовательно, локальные отклоне ния моделируются как автокоррелирующие. К сожалению, нет никакого магического способа однозначно раз ложить данные на тренд и случайные ошибки. Изложенные далее соображения могут помочь вам в этом процессе. На следующем рисунке показаны данные, полученные при помощи двух моде лей. Одна из них ординарный кригинг, где Z(s) = m + e (s) и ошибки e (s) коррелируют. Процесс имеет среднее m = 0 и экс поненциальную вариограмму. Другой набор данных был смоде лирован с использованием универсального кригинга: m(s) = b0 + b1x(s) + b2x2(s) (сплошная линия на рисунке); но ошибки были независимы, со средним значением, равным 0, и дисперсией, рав ной 1. Как видите, трудно определить, какие точки соответствуют ка кой модели (синие точки соответствуют значениям, полученным при использовании ординарного кригинга, а красные точки уни версального кригинга с независимыми ошибками). Пространст венная автокорреляция может позволить строить различные по верхности интерполяции, и этот пример демонстрирует, что 6 4 Зíàчåíèÿ 2 Value 0 -2 0 5 10 15 20 25 30 x часто может быть трудно выбрать между моделями, основанными только на данных. В целом, вы должны придерживаться орди нарного кригинга до тех пор, пока у вас не возникнут серьезные причины для вычитания поверхности тренда. Это вызвано тем, что лучше использовать простые модели. Если вы вычитаете по верхность тренда, параметров, которые вам необходимо оце нить, больше. Двумерная поверхность второй степени к отсекаю щему параметру добавляет еще пять параметров, требующих оценки. Чем большее количество параметров оценивается, тем менее точной становится модель. Однако, в некоторых случаях пространственные координаты служат как заменитель для неко его известного тренда в данных. Например, урожайность может меняться в зависимости от широты—причиной этого являются не сами координаты, а такие показатели, меняющиеся с широтой, как температура, влажность, осадки и т.д. В данном случае, вы читание поверхностей тренда может иметь смысл. Повторим сно ва, что чем проще поверхность (полином первой или второй сте пени), тем лучше. В модуле Geostatistical Analyst возможно также применение локального полиномиального сглаживания как оп ции вычитания тренда. Существует реальная опасность слишком точного подбора данных при использовании трендов и сохране нии слишком маленькой дисперсии в отклонениях, что приводит к ошибкам и некорректному учету неопределенности интерполя ции. При применении моделей, учитывающих тренд, всегда про веряйте их с использованием перекрестной проверки и особенно проверки. 216 ARCGIS GEOSTATISTICAL ANALYST Диалог Вычитание тренда (Стандартная опция) Набор данных, из которых вычитается тренд Размер области поиска соседства Настройка параметров поиска соседства Регулировка отображения поверхности тренда Отображение оцененного тренда Степень полинома ИСПОЛЬЗОВАНИЕ АНАЛИТИчЕСКИХ ИНСТРУМЕНТОВ ПРИ ПОСТРОЕНИИ ПОВЕРХНОСТЕЙ Легенда карты 217 Удаление глобальных и локальных трендов из данных: вычитание тренда Чтобы определить присутству ет ли в ваших данных глобаль ный тренд, воспользуйтесь ин струментом ESDA, который но сит название Анализ тренда (см. Главу 4, ‘Исследовательский анализ пространственных дан ных’). По существу, вы раскладываете свои данные на детерминист скую составляющую тренд, и случайную автокоррелирован ную составляющую. После вы читания тренда, кригинг будет выполнен для остатков. Перед выполнением окончательной интерполяции, тренд снова при бавляется к результирующей поверхности. Подсказка Степень трендов Для определения поверхности тренда используйте глобаль ные полиномы низких степе ней, если только у вас нет се рьезных оснований поступить по другому. Интерактивная оценка тренда 1. В диалоге Выбор геостатисти ческого метода выберите ор динарный, универсальный или дизъюнктивный кригинг и нужный тип результирую щей поверхности в диалоге Геостатистические методы. 2. В меню Порядок вычитаемо го тренда задайте степень по линома. 3. Нажмите Далее. Примечание: Если вы задади те какую либо степень поли нома (все опции, кроме Нет), после нажатия кнопки Далее появится диалог Вычитание тренда. 4. В диалоге Вычитание тренда, перемещая движок между двумя крайними положения ми, вы определяете размер окна, позволяющего перейти от глобального к локальному полиному. Вы можете также задать па раметры поиска соседства, нажав на кнопку Расширен ные опции. 5. Нажмите Далее. 218 1 2 3 4 5 ARCGIS GEOSTATISTICAL ANALYST Отображение геостатистических слоев и управление ими 8  ÝÒÎÉ ÃËÀÂÅ • Что такое геостатистический слой? • Добавление слоев • Работа со слоями на карте • Управление слоями • Просмотр геостатистических слоев в ArcCatalog • Представление геостатистического слоя • Изменение символики геостатистического слоя • Классификация данных • Определение масштаба, при котором будет отображаться геостатистический слой • Экстраполяция значений точек, находящихся за пределами исследуемой территории • Сохранение и экспорт геостатистических слоев ArcMap и модуль Geostatistical Analyst предлагают множество инструмен тов, с помощью которых вы можете отображать данные и управлять ими. Воспользовавшись инструментами отображения, вы можете получить пре красную карту и, проанализировав ее, глубже понять свои данные с тем, чтобы иметь возможность принимать более эффективные решения. Иссле дование данных особенно важно при использовании модуля Geostatistical Analyst, поскольку через понимание вы приходите к созданию более пра вильных моделей и построению более точных поверхностей. Хотя инструменты управления и не помогают напрямую при построении поверхностей в модуле Geostatistical Analyst, эти инструменты незаменимы для организации вашей работы с картой и могут помочь вам в процессе об думывания решений. Многие из инструментов отображения данных и управления ими, исполь зуемые для работы с любым из слоев ArcMap, применимы также для рабо ты с геостатистическим слоем. В этой главе, мы рассмотрим только основ ные инструменты работы со слоями данных, наиболее часто используемые в модуле Geostatistical Analyst, и те инструменты, которые используются только для работы с геостатистическими слоями. Обратитесь, пожалуйста, к книге “ArcMap. Руководство пользователя” для информации о других ин струментах, применимых ко всем типам слоев данных, включая геостатис тические слои. 219 Что такое геостатистический слой? В ArcMap географические данные организованы по слоям. Для представления различных данных существуют различные типы слоев. Слой пространственных объектов ArcMap может содер жать полигоны, соответствующие типам почв, точки, определя ющие объем биомассы, величина которого измерена в опреде ленных местах на поверхности Земли, или линии, которыми показаны, к примеру, тропы. Растровый слой может представ лять собой аэрофотографию или грид расстояний от дорог. Дру гие типы слоев это слои TIN для трехмерных поверхностей, слой CAD для хранения листов карты CAD и геостатистический слой, в котором хранятся результаты анализа, проведенного с помощью модуля Geostatistical Analyst. Функциональность геостатистического слоя аналогична функ циональности любого слоя ArcMap. Вы можете добавлять его в ArcMap, удалять его, отображать и менять символогию. Однако, геостатистический слой отличается от других слоев способом со здания и хранения. Геостатистический слой может быть создан только при использовании модуля Geostatistical Analyst. Боль шинство типов слоев ArcMap хранят ссылку на источник дан ных, символогию отображения слоя и другие характеристики. Геостатистический слой хранит источник данных, с использова нием которых он был создан (обычно точечный слой простран ственных объектов), символогию и другие характеристики, наряду с параметрами модели интерполяции. В диалоге Свойст ва геостатистического слоя вы можете просмотреть данные об исходном источнике данных и о параметрах модели. Помимо определения источника исходных точек и параметров модели, вы можете также получить общую информацию о слое в закладке Общие, просмотреть и изменить область отображения карты в закладке Экстент, изменить символогию в закладке Сим волы, установить степень прозрачности слоя и определить необ ходимость отображения всплывающих подсказок в закладке Отображение. Геостатистический слой можно отобразить четырьмя следующи ми способами: контурами с заливкой, изолиниями, гридом или растяжкой цвета. Вы можете комбинировать несколько спосо бов при отображении одного слоя для достижения различных эффектов. Полный диапазон символов и контролирующих па раметров существует для каждого из возможных форматов. Контура с заливкой 220 ARCGIS GEOSTATISTICAL ANALYST Изолинии Грид Растяжка Сочетание изолиний, контуров с заливкой и растяжки ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 221 Добавление слоев Добавление слоев В ArcMap географические данные организованы по слоям. Существу ет несколько различных типов сло ев, но при использовании модуля Geostatistical Analyst наибольший интерес представляют точечный, полигональный и растровый. 1. На стандартной панели инстру ментов ArcMap нажмите кноп ку Добавить данные. 2. В меню Искать в... перейдите к папке, в которой хранится нуж ный слой. 3. Выберите слой. 4. Нажмите Добавить. Слой пространственных объектов может содержать полигональные пространственные объекты, такие как типы почв или землепользова Добавление группы слоев ния, линейные пространственные 1. В таблице содержания ArcMap объекты, такие как дорожная сеть, нажмите правую клавишу или точечные пространственные мыши на строке Слои и выбе объекты, такие как места преступ рите опцию Новый составной лений или точки отбора проб на слой. 1 загрязняющие вещества. В модуле 2. В таблице содержания выбери Geostatistical Analyst в качестве ис те созданный новый составной ходного чаще всего используется слой, правой клавишей мыши точечный слой. Геостатистический откройте контекстное меню и слой представляет собой поверх выберите опцию Свойства. ность, созданную в результате ана 3. Отобразите содержимое заклад лиза, выполненного с использова ки Общие. нием модуля Geostatistical Analyst. Растровый слой может содержать изображение, полученное со спут 4. Необязательный шаг: назовите составной слой. 5. Необязательный шаг: отметьте галочкой опцию Видимый, что 3 4 ника, отсканированный снимок или бы сделать составной слой ви изображение типов леса при помо димым. щи грида. Часто, для последующе 6. Необязательный шаг: определи го анализа, геостатистический слой те диапазон масштабов. конвертируется в растровый слой. 7. Откройте закладку Группиро Подсказка вать. 8. Нажмите кнопку Добавить и Отображение “спрятанных“ слоев перейдите к набору данных, ко торый вы хотите добавить в со Слои, которые вы добавляете, ставной слой. могут быть “спрятаны”. Чтобы отобразить слой, ко торый вы не видите, нажмите 9. Нажмите Добавить. 10. Продолжайте добавлять в груп 5 6 на нем правой клавишей мыши и пу требуемые наборы данных, выберите опцию Приблизить к повторяя шаги 8, 9. слою. 11. Нажмите OK. 1 2 3 4 2 7 8 11 222 ARCGIS GEOSTATISTICAL ANALYST Работа со Включение и слоями на карте выключение слоя 1 1. Поставьте галочку в окошке, В ArcMap существует множест расположенном слева от на во инструментов, которые поз звания слоя, чтобы отобразить воляют вам работать со слоями его, и уберите галочку, чтобы на карте. Некоторые из наибо выключить отображение слоя. лее часто употребляемых и осо бенно полезных для пользова теля, работающего с модулем Geostatistical Analyst, включе ние и выключение отображе Перемещение слоя с ния слоя, контроль за поряд целью изменения ком отображения слоев, изме нение масштаба и области ото порядка отображения 2 бражения слоя. Эти инструмен данных ты могут быть использованы для 1. В таблице содержания выде анализа или для создания каче ственного картографического лите слой и, удерживая, пере 1 тащите его вверх или вниз. материала. При использовании этих инст рументов для анализа вы може Черная линия показывает, куда будет помещен слой. те изучить исходный точечный 2. Отпустите клавишу мыши в слой, значения которого будут том месте, где вы хотите по проинтерполированы, а также местить слой. исследовать результирующий геостатистический слой. Масштабирование и Если вы удовлетворены пред изменение области ставлением результатов, вы мо жете сохранить их в виде кар ты. отображения слоя 1. Откройте меню Вид на пане ли меню ArcMap, выберите См. также опцию Панели инструментов и отметьте опцию Инструмен См. также книгу Использова ты. ние ArcMap для информации о дополнительных инструмен тах, которые регулируют отображение слоя на карте. 2. Для исследования карты мо гут быть использованы раз личные инструменты данной панели. ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 223 Управление слоями Изменение названия слоя 22 1. Выберите слой в таблице со ArcMap предоставляет набор ин держания. струментов для управления сло ями данных. Хотя эти инстру менты не помогают в исследова нии данных или их анализе, они помогают упорядочить работу с 2. Повторно нажмите на назва нии слоя. Название будет выделено, что позволит изменить его. картой. Наиболее полезны при 3. Напечатайте новое название. работе с модулем Geostatistical Analyst следующие функции: со хранение, переименование, ко пирование и удаление геостати стических слоев. Вы можете захотеть переимено Копирование слоя вать геостатистический слой, по скольку по умолчанию он созда ется с названием, совпадающим с методом, использованным при его создании и соответствующим 1. Нажмите правую клавишу мыши, выбрав слой, который вы хотите скопировать, и вы берите опцию Копировать. порядковым номером (напри 2. Нажмите правую клавишу мер, Ординарный кригинг_2). мыши на строке Слои. Это может привести к путанице, 3. Выберите Вставить слой(и). если вы строите несколько по верхностей с применением одного метода, но различных парамет ров, или одного метода для раз личных наборов данных. Копирование геостатистическо го слоя особенно полезно, когда вы хотите создать результирую щую поверхность другого типа с теми же параметрами модели. Полезно также удалять проме жуточные геостатистические слои, которые вы использовали при исследовании параметров модели. Удаление слоя 1. Нажмите правую клавишу мыши, выбрав слой, который вы хотите удалить и восполь зуйтесь опцией Удалить. 224 1 23 1 ARCGIS GEOSTATISTICAL ANALYST Просмотр Запуск ArcCatalog и геостатистических модуля Geostatistical Analyst 3 слоев в 1. Нажмите кнопку Пуск на па ArcCatalog нели задач Windows. 2. Перейдите в меню Програм В ArcCatalog можно просмот мы. 2 реть существующие геостатис тические слои и выполнить над 3. Выберите ArcGIS. ними определенные операции. 4. Выберите ArcCatalog. ArcCatalog позволяет быстро пролистать данные и установить связи с базами данных и папка ми, размещенными как на ва шем компьютере, так и на се тевых ресурсах. Откроется окно ArcCatalog. В ArcCatalog, в меню Инстру 1 менты выберите опцию До полнительные модули и от метьте галочкой модуль Geostatistical Analyst. Нажми В ArcCatalog вы можете выпол те Закрыть. нить предварительный про смотр отображения геостатис тического слоя, либо увидеть связанные с ним метаданные. Предварительный просмотр данных Подсказка 1. Запустите ArcCatalog. 3 Метаданные Стратегия исчерпывающих ме 2. В таблице содержания перей таданных существенна для дите к нужному геостатисти отслеживания географических ческому слою или геостатистических дан ных. 3. Выберите закладку Просмотр. 2 Подсказка Доступ к ArcCatalog Открыть ArcCatalog можно также, нажав на соответст вующую иконку на стандарт ной панели инструментов ArcMap. ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 44 225 См. также Просмотр метаданных Обратитесь к книге Using слоя ArcCatalog (Использование 1. Откройте ArcCatalog. ArcCatalog) для дополнитель ной информации о метаданных 2. В таблице содержания перей 4 и способах их создания. дите к нужному геостатисти ческому слою. 3. Выберите закладку Метадан ные. 4. Выберите закладку Описа ние, чтобы просмотреть общее описание слоя. 5. Выберите закладку Простран ственная привязка, чтобы изу чить пространственные харак теристики слоя, такие как координаты границ области отображения. 6. Выберите закладку Атрибуты, чтобы получить другую ин формацию о слое. 7. Введите любые метаданные или измените существующие. 35 6 226 ARCGIS GEOSTATISTICAL ANALYST Отображение геостатистического слоя Отображение геостатистического слоя методом контуров с заливкой Геостатистический слой может быть отображен четырьмя спо собами. 1. В таблице содержания ArcMap выберите геостатис 3 Контура с заливкой это поли гональное представление гео тический слой, нажмите пра вую клавишу мыши и выбе статистического слоя. При та рите опцию Свойства. ком графическом отображении предполагается, что все точки, 2. Откройте закладку Символы. находящиеся внутри полигона, 3. В меню Показать: выберите имеют одно и то же значение. способ отображения Контура Грид это растровое представ с заливкой и поставьте галоч ление геостатистического слоя. Предполагается, что интерпо ляция выполняется для точки, ку напротив соответствующей строки. являющейся центром каждой 4. Определите требуемые пара ячейки, или для каждой ячейки вычисляется среднее значение. метры. Для отображения геостатисти 5. Нажмите OK. ческого слоя могут также ис пользоваться изолинии. Вы мо жете показывать линии с раз личным качеством (черновик Отображение геостатистического или чистовое оформление). слоя в виде грида При использовании растяжки (отмывки) создается рельефное 1. В таблице содержания изображение геостатистическо ArcMap выберите геостатис 3 го слоя. тический слой, нажмите пра Одновременно можно приме нять несколько способов отобра жения. вую клавишу мыши и выбе рите опцию Свойства. 2. Откройте закладку Символы. Подсказка Отображение нескольких наборов данных Чтобы видеть одновременно два набора данных, отобрази те один из них изолиниями и на ложите их на поверхность, построенную для другого набо ра данных. 3. В меню Показать: выберите способ отображения Грид и поставьте галочку напротив соответствующей строки. 4. Определите требуемые пара метры. 5. Нажмите OK. ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 2 5 2 5 227 Подсказка Фактор Z (высота), используемый при отмывке Увеличение фактора Z увели чит пропорцию единиц измере ния z относительно единиц из мерения x и y. Если значения z очень маленькие, а x и y боль шие, вам необходимо будет за дать большое значение факто ра Z, чтобы увидеть какие либо изменения. Подсказка Совместное отображение нескольких способов Если использовать одновремен но контура с заливкой и от мывку, можно получить очень эффектное отображение дан ных. Панель инструментов Эффекты и опции свойств слоя позволяют определить различные дополнительные па раметры для отображения данных. Подсказка Быстрый доступ к свойствам слоя Чтобы быстро открыть диа лог Свойства слоя сделайте двойной щелчок мышью на на звании слоя в таблице содержа ния ArcMap. Отображение геостатистического слоя способом отмывки 3 1. В таблице содержания ArcMap выберите геостатистический слой, нажмите правую клави шу мыши и выберите опцию Свойства. 2. Откройте закладку Символы. 3. В меню Показать: выберите способ отображения Растяж ка и поставьте галочку напро тив соответствующей строки. 4. Определите требуемые пара метры. 5. Нажмите OK. Отображение геостатистического слоя способом изолиний 3 1. В таблице содержания ArcMap выберите геостатистический слой, нажмите правую клави шу мыши и выберите опцию Свойства. 2. Откройте закладку Символы. 3. В меню Показать: выберите способ отображения Изоли нии и поставьте галочку на против соответствующей стро ки. 4. Определите требуемые пара метры. 5. Нажмите OK. 228 2 5 2 5 ARCGIS GEOSTATISTICAL ANALYST Изменение символогии Изменение цветовой схемы геостатистического 1. Выберите геостатистический слоя слой и, нажав правую клави шу мыши, откройте диалог 4 ArcMap предоставляет множе Свойства. 3 ство инструментов, которые по 2. Откройте закладку Символы. могут вам при отображении сло ев. Воспользовавшись этими ин струментами, вы сможете созда вать красиво оформленные кар ты, и, что более важно, изучать 3. В списке Показать: выберите способ отображения Изоли нии, Грид или Контура с за ливкой. и анализировать данные слоя 4. В меню Цветовая шкала вы различными способами. берите цветовую схему. ArcMap отображает слой с ис 5. Нажмите OK. пользованием параметров, опре деляемых системой по умолча нию. Однако, вы можете подо брать другое оформление, заме нив символы, предложенные по умолчанию. Цветовая схема ото бражения данных может быть выбрана из набора существую щих цветовых схем, или созда Интерактивное изменение цвета на в интерактивном режиме. 1. Сделайте щелчок правой кла Подсказка вишей мыши на изображении 1 Масштабирование Если вы увеличиваете масштаб символа в легенде геостатис тического слоя. отображения карты, размер 2. Выберите цвет для символа. градуированных символов ис ходного слоя точечных прост ранственных объектов не бу дет меняться. Если вы хоти те, чтобы они увеличивались с Все значения на изображе нии, показанные этим сим 2 волом, изменят цвет на вы бранный. увеличением масштаба, вам не обходимо определить базовый масштаб. В контекстном меню выберите опцию Диапа зон видимых масштабов. ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 2 5 229 Классификация данных Когда вы осуществляете классификацию данных, вы группиру ете сходные пространственные объекты в классы путем присво ения одного и того же символа каждому объекту, попадающему в один и тот же класс. Объединение пространственных объектов в классы позволяет вам легче опознавать участки данных. Диа пазоны значений определяют, какие пространственные объек ты попадут в класс, что в свою очередь влияет на отображение данных на карте. Меняя границы класса, вы можете создавать карты, на которых одни и те же пространственные явления будут выглядеть по разному. Вы можете установить границы классов вручную или воспользоваться стандартной схемой клас сификации. Почему нужно устанавливать границы класса вручную? Устанавливайте границы классов вручную, если вы хотите отоб разить на карте объекты, отвечающие какому либо определен ному критерию, или если вы сравниваете значения пространст венных объектов с какой либо специфической, значимой вели чиной. Для этого, вам необходимо вручную задать верхнюю и нижнюю границу для каждого класса. Вы можете также вручную классифицировать данные в том слу чае, если хотите усилить какой либо определенный диапазон значений, например, превышающих пороговое (критическое) значение или находящихся ниже этого порогового значения. Например, перед вами может стоять задача особенным образом выделить участки, высота которых ниже определенного уров ня, и вследствие этого они подвержены затоплению. Интерактивное присвоение границ классов может быть также полезным при обособлении и выделении диапазонов данных. Например, если значения вашего набора данных колеблются от 0.0465 до 0.1736, и вы хотите отделить высокие значения, вы можете отнести все значения, меньше 0.15 к одному классу, а все значения, больше 0.15 ко второму классу. На рисунке показано как выбранный диапазон данных может быть выделен цветом с использованием интерактивного опреде ления границ классов. Использование стандартной схемы классификации То, как установлен диапазон значений класса и его границы, определяет, сколько данных попадет в каждый класс и как бу дет выглядеть результирующая карта. В схеме классификации существует два главных компонента: количество классов, на ко торые будут разбиты значения и метод, по которому устанавли ваются границы классов. Количество классов зависит от цели исследования. Правила, по которым значения относятся к тому или иному классу, однако требуют некоторого разъяснения. Для геостатистического слоя существуют три стандартных способа разбиения значений на классы: • Метод равных интервалов • Равновеликая классификация (метод квантилей) • Метод регулируемых, “умных” квантилей Описание этих методов приведено на следующих страницах. 230 ARCGIS GEOSTATISTICAL ANALYST Метод равных интервалов При этом методе все возможные значения разбиваются на интервалы с равным диапазоном значений. Поскольку обычно в наборе данных мало очень низких и очень высоких значений, в краевые классы попадает меньшее количество объектов. Эту опцию целесо образно использовать для того, чтобы подчеркнуть изменения в краевых классах. Возможно, его лучше применять к таким диапазо нам значений, как процентное соотношение или температура. Эта опция наиболее используется для карт вероятности и стандартной ошибки интерполяции. 0.0465 0.0719 0.0973 0.1227 0.1481 0.0719 0.0973 0.1227 0.1481 0.1736 Равновеликая классификация квантиль Диапазон возможных значений делится на интервалы таким образом, чтобы в каждый интервал попадало одинаковое количество значений. Классы, расположенные как по краям, так и в середине, имеют одинаковое количество значений. Поскольку, как правило, интервалы имеют более широкий диапазон значений для краевых классов, эта опция полезна для выделения изменений в средних значениях распределения. 0.0465 0.0807 0.0923 0.1035 0.1164 0.0807 0.0923 0.1035 0.1164 0.1736 ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 231 Регулируемые квантили Регулируемые квантили используются для описания классов, основанных на естественном объединении значений данных. Границы классов (точки прерывания) определяются при анализе групп и свойств, присущих данным. Пространственные объекты делятся на классы, границы которых устанавливаются в тех местах, где есть относительно большие скачки в значениях данных, и следователь но, группы со сходными значениями попадают в один класс. Этот метод является компромиссом между методами равных интервалов и квантилей. Интервалы, образующиеся при использовании этого метода, не равновеликие и в отличие от квантилей, диапазон которых растянут для крайних классов, содержат меньшее количество значений. Эта опция пытается найти баланс между выделе нием изменений в средних значениях и в экстремальных значениях. Этот метод следует использовать для таких наборов данных, как, например, данные о количестве осадков, более половины значений которого может быть равно нулю. 0.0465 0.0869 0.1056 0.1144 0.1331 0.0869 0.1056 0.1144 0.1331 0.1736 232 ARCGIS GEOSTATISTICAL ANALYST Классификация данных Когда вы классифицируете дан ные, вы можете воспользовать ся одной из стандартных схем классификации, используемых для работы с геостатистически ми слоями, или создать пользо вательские классы, границы ко торых будут определены вами. Если вы хотите воспользовать ся одним из стандартных мето дов, просто выберите схему классификации и установите количество классов. Если вы хотите определить свои собственные классы, вы може те вручную изменить границы классов или задать точные зна чения границ классов, подходя щие для ваших данных. Применение стандартного метода классификации 1. В таблице содержания выбе рите геостатистический слой и, нажав правую клавишу мыши, откройте диалог Свой ства. 2. Откройте закладку Символы. 3. Нажмите кнопку Классифи цировать. 4. Из меню Метод выберите ме тод классификации. 5. В окне Классы измените зна чение на необходимое коли чество классов. 6. Нажмите OK в диалоге Клас сификация. 7. Нажмите OK в диалоге Свой ства слоя. 5 ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 1 2 3 7 4 6 233 234 Изменение границ класса вручную 1. В таблице содержания выбе рите геостатистический слой и, нажав правую клавишу мыши, откройте диалог Свой ства. 2. Откройте закладку Символы. 3. Нажмите кнопку Классифи цировать. 4. Из меню Метод выберите Вручную. 5. В окне Классы измените зна чение на необходимое количе ство классов. 6. Передвиньте границы класса в требуемое положение (синие отрезки). 7. Или наберите точные значе ния границ классов. 8. Или отметьте опцию Пользо вательские Min и Max, затем наберите минимальное и мак симальное значения, включа емые в классификацию. 9. Нажмите OK в диалоге Клас сификация. 10. Нажмите OK на закладке Символы. 5 8 1 2 3 10 6 7 4 9 ARCGIS GEOSTATISTICAL ANALYST Определение Определение масштабов, при диапазона масштаба которых будет 1. На выбранном геостатистиче ском слое нажмите правую отображаться геостатистический клавишу мыши и выберите опцию Свойства. 2. Откройте закладку Общие. слой 3. Отметьте опцию Показывать ArcMap не отображает ланд шафт один к одному, с сохране нием его природных размеров; это означает, что масштаб отоб слой в диапазоне масштабов: 4. Установите диапазон масшта ба, введя значения в окошках “мельче” и “крупнее”. ражения ландшафта должен 5. Нажмите OK. соответствовать размеру экра 2 на. Километр на поверхности земли может соответствовать одному сантиметру на экране. Масштаб уменьшение (или увеличение), необходимое для отображения интересующей вас территории. 3 Если вы уменьшаете или увели 4 чиваете масштаб карты, мас штаб отображения меняется. Возможно, что вам не нужно, чтобы все слои отображались для всех масштабов. Напри мер, при отображении карты мира необязательно показывать границы округов. Вы можете контролировать то, какие слои отображаются при определенном масштабе, уста новив диапазон масштаба для каждого слоя в диалоге Свойст ва. ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 1 5 235 Экстраполяция значений в точках, расположенных за пределами изучаемой территории По умолчанию, модуль Geostatistical Analyst интерполирует значения пе ременной во всех точках, попадаю щих внутрь минимального ограни чивающего пространство прямо угольника. Минимальный ограни чивающий пространство прямо угольник это наименьший из воз можных прямоугольник, ограничи вающий все исходные опорные точ ки. Однако, этот прямоугольник мо жет не накрывать целиком исследу емую территорию. Процесс созда ния карты проинтерполированных значений, выходящей за пределы этой ограничивающей рамки, носит название экстраполяции. Результи рующий геостатистический слой, по лученный в результате экстраполя ции, будет накрывать ту область, ко торую определите вы. Обратите внимание, что не рекомен дуется экстраполировать значения для точек, удаленных на значитель ное расстояние. Допустимо экстра полировать значения, расположен ные близко к действительным опор ным точкам (например, вокруг гра ницы геостатистического слоя), но любая дальнейшая экстраполяция может привести к недостоверным ре зультатам. Подсказка Чтобы вернуться к области отображения, предложенной по умолчанию, после определе ния новой области отображе ния, нажмите По умолчанию в закладке Экстент. Экстраполяция значений 1. В таблице содержания ArcMap выберите геостатистический слой, значения которого вы хотите экстраполировать, на жмите правую клавишу мыши и выберите опцию Свойства. 2. Откройте закладку Экстент. 3. В меню Установить экстент равным: выберите опцию “пользовательский экстент, определенный ниже”. 4. В окне Видимый экстент вве дите новые значения. Или используйте область ото бражения любого из исполь зуемых слоев. 5. Нажмите OK. 236 1 2 3 4 5 ARCGIS GEOSTATISTICAL ANALYST Сохранение и экспорт геостатистических слоев Геостатистический слой ArcMap включает ссылку на данные, которые хранятся на диске, символогию, используемую для отображения слоя, и другую информацию, относящуюся к способу создания слоя. Если сеанс ArcMap сохранен, слои в таблице содержания и их сопутствующие характеристи ки хранятся в файле с расши рением .mxd. Однако, если вы хотите использовать геостати стический слой в другом сеансе ArcMap с сохранением символо гии, слой может быть сохранен в файл с расширением .lyr. Файл с расширением .lyr не ко пирует источник данных, а только ссылается на него. Чтобы сделать геостатистичес кий слой постоянным, копия может быть записана на диске (за исключением характерис тик слоя) либо как грид ArcInfo, либо как шейп файл. Подсказка Передача геостатистического слоя третьим лицам Если вы планируете переда вать свою карту третьим ли цам, им понадобится не толь ко документ карты, но и дан ные, на которые ссылаются ваши слои. Сохранение композиции карты 1. В меню Файл выберите опцию Сохранить как. 2. Перейдите в директорию, в которой вы хотите сохранить карту. 3. Измените название карты, если это необходимо. 4. Нажмите Сохранить. Сохранение индивидуальных слоев 1. В таблице содержания ArcMap выберите геостатис тический слой, который вы хотите сохранить, нажмите правую клавишу мыши и вы берите опцию Сохранить как файл слоя.... 2. Перейдите в директорию, в которой вы хотите сохранить слой. 3. Измените название слоя, если это необходимо. 4. Нажмите Сохранить. ОТОБРАЖЕНИЕ ГЕОСТАТИСТИчЕСКИХ СЛОЕВ И УПРАВЛЕНИЕ ИМИ 1 2 3 4 1 2 3 4 237 238 Экспорт геостатистического слоя в растровый формат 1. В таблице содержания ArcMap нажмите правую клавишу мыши на выбранном геостати стическом слое, выберите оп цию Данные, а затем Экспорт в растровый формат. 2. Установите необходимые свой ства результирующего растро вого изображения, такие как число строк и столбцов, размер ячейки, количество интерпо лируемых значений для каж дой ячейки в меню Блоковая интерполяция при выполне нии блоковой интерполяции, а также название и место рас трового файла на диске. 3. Нажмите OK. Экспорт геостатистического слоя в векторный формат 1. В таблице содержания ArcMap нажмите правую клавишу мыши на выбранном геостати стическом слое, выберите оп цию Данные, а затем Экспорт в векторный формат. 2. Задайте требуемый формат (на пример, шейп файл, персо нальная база геоданных, база данных SDE). 3. В меню Экспорт выберите Изо линии или Контура с заливкой. 4. Нажмите OK. 1 3 1 3 4 ARCGIS GEOSTATISTICAL ANALYST Дополнительные инструменты геостатистического анализа 9 В ЭТОЙ ГЛАВЕ • Изменение параметров геостатистического слоя: свойства метода • Интерполирование значений для заданных точек • Выполнение проверки геостатистического слоя, созданного из поднабора данных • Наложение данных для выполнения более точной интерполяции В ArcMap и в модуль Geostatistical Analyst включено множество инстру ментов, призванных помочь в выполнении геостатистического анализа. Вы можете менять параметры модели, найти значения интерполируемого по казателя в заданной точке, выполнить проверку для поднаборов данных, пространственно разделить свои данные, выполнить интерполяцию для каждого из выделенных наборов, а затем скомбинировать результаты. В этой главе мы не приводим исчерпывающий список инструментов, кото рые могут помочь вам при выполнении геостатистического анализа. Вмес то этого, в ней дано описание наиболее часто используемых при осуществ лении анализа инструментов. Но при этом вы должны отдавать себе отчет в том, что поскольку модуль Geostatistical Analyst интегрирован в ArcMap, существует бесконечное множество функций, которые вы можете и будете использовать при анализе. По мере того, как вы будете узнавать ArcMap и модуль Geostatistical Analyst, вы будете открывать для себя все большее количество инструментов, отвечающих вашим потребностям в построении точных поверхностей. 239 Изменение параметров геостатистического слоя: свойства метода После построения поверхности в модуле Geostatistical Analyst, вы имеете возможность про смотреть его в ArcMap. Вос пользовавшись многочисленны ми инструментами отображе ния геостатистического слоя, вы можете обнаружить, что не которые участки вновь создан ной поверхности не отвечают вашим представлениям об изу чаемой территории. Вы може те принять решение усовер шенствовать поверхность, изме нив параметры, использован ные для ее построения, а не со здавать новую поверхность. Через свойства метода вы мо жете вернуться к диалогам, из менить любые параметры мо дели и проанализировать вновь полученные результаты. Подсказка Изучение свойств метода Диалог Свойства метода помо жет вам лучше понять то, как различные опции влияют на результирующую поверхность. Использование свойств метода 1. В таблице содержания ArcMap щелкните правой клавишей мыши на выбранном слое и выберите опцию Свойства ме тода. То, какие опции доступны, зависит от способа построения исходной поверхности. Эти шаги соответствуют построе нию поверхности вероятнос тей значений на основе мето да кригинга. 2. Выберите необходимый метод кригинга. 3. В диалоге Выбор геостатисти ческого метода нажмите Да лее. 4. Необязательный шаг: измени те какие либо параметры мо дели и в диалоге Моделирова ние вариограммы/ковариа ции нажмите Далее. 5. Необязательный шаг: задайте новую область поиска сосед ства и в диалоге Поиск сосед ства нажмите Далее. 6. Оцените результаты перекре стной проверки. Улучшился ли результат? Если нет, то повто рите шаги со 2 по 5. Если да, нажмите Готово в диалоге Пе рекрестная проверка. 7. В диалоге Информация о ре зультирующем слое нажмите OK. 240 1 2 3 ARCGIS GEOSTATISTICAL ANALYST Интерполирование Использование 3 значений для заданных точек всплывающих подсказок 4 1. Создайте геостатистический Иногда вы заинтересованы в слой с использованием любо интерполировании значений в го из методов, описанных в заданной точке или в несколь ких определенных точках, а не главах 5 или 6. обязательно для всей поверхно 2. Нажмите правую клавишу сти. Например, вы обеспокоены мыши на выбранном геоста уровнем радиации в районе оп тистическом слое и выберите ределенного дома или хотите опцию Свойства. знать высоту в намечаемом мес те строительства обзорной баш ни. 3. Откройте закладку Отображе ние. Если вы хотите знать предпола 4. Отметьте опцию Показывать 5 гаемые значения в нескольких подсказки карты. определенных точках, самый 5. Нажмите OK. 6 простой способ воспользовать ся всплывающими на карте под 6. Поместите курсор в точке сказками. Однако, если вы хо слоя, для которой вы хотите тите сохранить проинтерполи получить информацию. рованные значения в определен ной точке в результирующем слое, чтобы их можно было ис Отобразится значение поверх ности в данной точке. пользовать для последующего анализа, лучше воспользоваться диалогом Интерполяция. Подсказка Выбор точек с использованием таблицы атрибутов Помимо использования инстру мента выбора, интересующие вас точки могут быть выбра ны с помощью таблицы атри бутов (нажмите правой клави шей мыши на выбранном слое в таблице содержания ArcMap и выберите опцию Открыть таблицу атрибутов). ДОПОЛНИТЕЛЬНЫЕ ИНСТРУМЕНТЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 241 Подсказка Другой способ просмотреть результаты Результаты интерполяции можно просмотреть также в ArcCatalog™. Интерполяция значения для заданного объекта точечного слоя 1. В таблице содержания ArcMap выберите геостатис тический слой, созданный с использованием данных на блюдений, нажмите правую клавишу мыши и выберите опцию Интерполяция. 2. В меню Входные данные вы берите слой, содержащий точ ки, для которых вы хотите по лучить проинтерполирован ные значения. 3. Определите директорию, в ко торой будет храниться полу ченный набор данных, нажав кнопку с изображением пап ки, расположенную рядом с окном “Укажите результиру ющий шейп файл или класс пространственных объектов”. 4. Пролистайте папки или напе чатайте название директории, в которой будет храниться ре зультирующий файл, и назо вите его. 5. Нажмите Сохранить и OK. 6. После подсказки добавьте файл с проинтерполирован ными значениями в таблицу содержания ArcMap. 7. Выберите слой с проинтерпо лированными значениями, на жмите правую клавишу мыши и выберите Открыть таблицу атрибутов, чтобы отобразить полученные результаты. В таблице будут показаны проинтерполированные зна чения в заданных точках. 242 1 3 2 4 5 ARCGIS GEOSTATISTICAL ANALYST Выполнение проверки для геостатистического слоя, созданного на основе поднабора данных Наиболее точный способ оценить качество результирующей по верхности сравнить интерполи руемые значения для определен ных точек с измеренными в по левых условиях. По разным при чинам (время, деньги, и т.д.), часто бывает невозможным вер нуться в изучаемый район и на брать независимый проверочный набор данных. Одно из решений разделить исходный набор дан ных на две части. Одна часть мо жет быть использована для мо делирования, то есть для созда ния результирующей поверхно сти, а другая для тестирования или проверки результирующей поверхности. Подсказка Разделение набора данных Процентное соотношение, в ко тором должен быть разделен набор данных, должно быть основано на количестве воз можных опорных точек. Вам необходимо достаточное коли чество точек для создания ре зультирующей поверхности и выполнения значимой проверки полученной поверхности. Сле довательно, если у вас неболь шое исходное количество опор ных точек, их может не хва тить для корректного разделе ния набора данных. Создание поднаборов данных 1. На панели инструментов Geostatistical Analyst выбери те опцию Создать поднаборы. 2. Из меню Слой выберите слой, данные которого вы хотите разделить. 3. Нажмите Далее. 4. Передвиньте движок в поло жение, которое определит тре буемое соотношение данных в учебном и тестовом наборе. По умолчанию, результирую щему набору данных присва ивается название в соответ ствии с условием: “исходный файл набора данных” + “_sets.mdb”, например, inputpoints_sets.mdb, где inputpoints название исход ного набора данных, содер жащего точки. 5. Нажмите Готово. Учебные и тестовые наборы данных образуют две таблицы в персональной базе геодан ных. ДОПОЛНИТЕЛЬНЫЕ ИНСТРУМЕНТЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 1 2 3 4 5 243 Подсказка Выполнение проверки Выполнение проверки с помощью Мастера операций с использованием поднаборов данных геостатистики Учебный и тестовый наборы данных могут быть введены не посредственно в первый диалог Мастера операций геостатис тики “Выберите входные дан ные и метод”. После того, как в диалогах Мастера были вы браны соответствующие пара метры, в последующем диалоге будет показана статистика проверки, которую можно про анализировать перед построе нием окончательной поверхнос ти. 1. На стандартной панели инст рументов ArcMap нажмите кнопку Добавить данные. Пе рейдите к папке, в которой был сохранен поднабор дан ных (если его нет в таблице содержания ArcMap). 2. Выберите учебный и тестовый слои (удерживая клавишу Shift). 5 3. Нажмите Добавить. 4. На панели инструментов Geostatistical Analyst выберите опцию Мастер операций гео статистики. 6 Подсказка Просмотр суммарной статистики Суммарная статистика из проверки может быть просмо трена с использованием либо ArcMap, либо ArcCatalog. 5. В окне Входные данные выбе рите учебный набор данных. 6. Выберите соответствующий метод. 7. Нажмите Далее и пройдите через все диалоги, чтобы пост роить поверхность. 8. Нажмите правую клавишу См. также мыши, выделив вновь создан ный геостатистический слой, См. также Главу 7, ‘Использо вание аналитических инстру ментов при построении по верхностей’, для информации о том, что такое перекрестная проверка и проверка, и о содер жании результирующей ста тистики. и выберите опцию Проверка. 9. В окне Входные данные выбе рите тестовый набор данных. 10. В окне Атрибут выберите тот атрибут, который был исполь зован при построении поверх ности. 11. Наберите название результи рующего (проверочного) набо ра данных и определите его место на диске. 12. Нажмите OK. f 11 244 2 3 7 8 9 10 12 ARCGIS GEOSTATISTICAL ANALYST Подсказка 13. После подсказки добавьте Результирующие файлы слой проверки в таблицу со В результате выполнения держания ArcMap. 14 проверки будут созданы два 14. Выберите новый слой и, на файла: шейп файл, который жав правую клавишу мыши, содержит тестовые опорные выберите опцию Открыть точки и связанные с ними таблицу атрибутов. проверочные данные, и таблица, в которой приведена суммарная статистика проверки, аналогичная На экране отобразятся ре зультаты проверки, которые вы сможете оценить. представленной в диалоге перекрестной проверки (см. Главу 7, ‘Использование аналитических инструментов при построении поверхностей’). ДОПОЛНИТЕЛЬНЫЕ ИНСТРУМЕНТЫ ГЕОСТАТИСТИчЕСКОГО АНАЛИЗА 245 s Приложение A  ÝÒÎÌ ÏÐÈËÎÆÅÍÈÈ • Детерминистские методы • Интерполяция по методу взвешенных расстояний • Интерполяция по методу глобального полинома • Интерполяция по методу локальных полиномов • Интерполяция по методу радиальных базисных функций • Геостатистические методы • Диалог декластеризации • Диалог моделирования распределения • Диалог вариограммы/ковариации • Диалог двумерного распределения • Формулы кригинга • Диалог перекрестной проверки В основе модуля Geostatistical Analyst лежит множество формул и уни кальных концепций выполнения задач. В данном приложении и приведе ны эти формулы и теоретические понятия. Предполагается, что до чтения этого приложения вы имели опыт в математике и геостатистике. По тексту приложения приводятся ссылки на наиболее известные учебни ки и статьи, в которых вы сможете более детально познакомиться с мате матической составляющей методов, использованных в модуле Geostatistical Analyst. В некоторых случаях, когда подробности нелегко отыскать в учебниках, мы приводим более детальное описание метода. 247 Äåòåðìèíèñòñêèå ìåòîäû Èíòåðïîëÿöèÿ ïî ìåòîäó âçâåøåííûõ ðàññòîÿíèé Èíòåðïîëÿöèÿ ïî ìåòîäó âçâåøåííûõ ðàññòîÿíèé - îòíîñèòåëüíî ïðîñòîé ìåòîä, è åãî ïîäðîáíîå îïèñàíèå ïðèâåäåíî â Ãëàâå 5, ‘Äåòåðìèíèñòñêèå ìåòîäû èíòåðïîëÿöèè ïðîñòðàíñòâåííûõ äàííûõ’. Èíòåðïîëÿöèÿ ïî ìåòîäó ãëîáàëüíîãî ïîëèíîìà Èíòåðïîëÿöèÿ ïî ìåòîäó ãëîáàëüíîãî ïîëèíîìà èñïîëüçóåò ìåòîäû ìíîæåñòâåííîé ðåãðåññèè äëÿ âñåõ äàííûõ. Ðåçóëüòàò èëè ïîâåðõíîñòü òðåíäà ïîäáèðàåòñÿ äëÿ êîîðäèíàò x è y, ÿâëÿþùèõñÿ êîâàðèàòàìè. Äëÿ òðåíäà ïåðâîãî ïîðÿäêà, ìîäåëü âûãëÿäèò ñëåäóþùèì îáðàçîì: Z (xi , yi ) = β0 + β1xi + β2 yi + ε (xi , yi ), ãäå Z(x ,y ) ii - ôàêòè÷åñêîå çíà÷åíèå â òî÷êå (x ,y ), ii βj - ïàðàìåò- ðû, à ε(xi,yi) - ñëó÷àéíàÿ îøèáêà. Äëÿ òðåíäà âòîðîãî ïîðÿäêà, ìîäåëü âûãëÿäèò ñëåäóþùèì îáðàçîì: Äëÿ òðåíäà òðåòüåãî ïîðÿäêà, ìîäåëü âûãëÿäèò òàê: Z (xi , yi ) = β0 + β1xi + β2 yi + β3xi2 + β4 yi2 + β5xi yi + ε (xi , yi ). Z (xi , yi ) = β0 + β1xi + β2 yi + β3xi2 + β4 yi2 + β5xi yi + β6xi3 + β7 yi3 + β8xi2 yi + β9xi yi2 + ε (xi , yi ), è òàê äàëåå, äî 10-îé ñòåïåíè (ìàêñèìàëüíàÿ èç èñïîëüçóåìûõ ìîäóëåì Geostatistical Analyst). Ðåãðåññèîííûå ìîäåëè ïîäáèðàþòñÿ ïóòåì îöåíêè ïàðàìåòðîâ {β } íà îñíîâå èñïîëüçîâàíèÿ i ìåòîäà íàèìåíüøèõ êâàäðàòîâ, îïèñàíèå êîòîðîãî ìîæíî íàé- òè âî ìíîãèõ ó÷åáíèêàõ ïî ãåîñòàòèñòèêå, íàïðèìåð â ó÷åáíèêå Snedecor è Cochran (1989). Èíòåðïîëÿöèÿ ïî ìåòîäó ëîêàëüíûõ ïîëèíîìîâ Èíòåðïîëÿöèÿ ïî ìåòîäó ëîêàëüíûõ ïîëèíîìîâ àíàëîãè÷íà èíòåðïîëÿöèè ïî ìåòîäó ãëîáàëüíîãî ïîëèíîìà çà òåì èñêëþ÷åíèåì, ÷òî èñïîëüçóþòñÿ äàííûå òîëüêî â ïðåäåëàõ îïðåäåëåííûõ “îêîí”, à íå äëÿ âñåé òåððèòîðèè, ïîýòîìó ïîäáèðàþòñÿ ëîêàëüíûå òðåíäû è èñïîëüçóþòñÿ çíà÷åíèÿ âåñîâ. Îêíî ìîæíî ïåðåäâèãàòü, è çíà÷åíèå ïîâåðõíîñòè â öåíòðå îêíà, íàçîâåì åãî µ0(x,y), îöåíèâàåòñÿ äëÿ êàæäîé òî÷êè. Ìåòîä íàèìåíüøèõ êâàäðàòîâ èñïîëüçóåòñÿ äëÿ ìèíèìèçàöèè ñóììû, n ∑ wi (Z (xi , yi ) − µ0 (xi , yi ))2 , i =1 ãäå n - êîëè÷åñòâî òî÷åê, ïîïàäàþùèõ â îêíî.  äàííîì ñëó÷àå, wi - âåñîâîé êîýôôèöèåíò, wi = exp(−3di0 / a), ãäå d - ðàññòîÿíèå ìåæäó òî÷êîé è öåíòðîì îêíà, à a - ïàðài0 ìåòð, êîíòðîëèðóþùèé ñêîðîñòü óáûâàíèÿ âåñîâûõ êîýôôèöèåíòîâ ñ ðàññòîÿíèåì. È íàêîíåö, µ0(xi,yi) - çíà÷åíèå ïîëèíîìà. Äëÿ ïîëèíîìà ïåðâîé ñòåïåíè: µ0 (xi , yi ) = β0 + β1xi + β2 yi , Äëÿ ïîëèíîìà âòîðîé ñòåïåíè: µ0(xi , yi ) = β0 + β1xi + β2 yi + β3xi2 + β4 yi2 + β5xi yi , è òàê äàëåå. Ìèíèìèçàöèÿ îñóùåñòâëÿåòñÿ äëÿ ïàðàìåòðîâ {β }. i Ïàðàìåòðû îöåíèâàþòñÿ ïîâòîðíî â òîì ñëó÷àå, åñëè öåíòð îêíà è, ñëåäîâàòåëüíî, âñå îêíî ñìåùàåòñÿ (Gandin, 1963). 248 ARCGIS GEOSTATISTICAL ANALYST Èíòåðïîëÿöèÿ ñ èñïîëüçîâàíèå ðàäèàëüíûõ áàçèñíûõ ôóíêöèé Ìîäóëü Geostatistical Analyst èñïîëüçóåò íàáîð èç n áàçèñíûõ ôóíêöèé, ïî îäíîé äëÿ êàæäîé îïîðíîé òî÷êè. Èíòåðïîëÿòîð ýòî ëèíåéíàÿ êîìáèíàöèÿ áàçèñíûõ ôóíêöèé, ∑ ( ) n Z€(s0) = ωiφ si − s0 + ωn+1 i =1 ãäå φ(r) ðàäèàëüíàÿ áàçèñíàÿ ôóíêöèÿ, r = ||si s0|| - Ýâêëè- äîâî ðàññòîÿíèå ìåæäó èíòåðïîëèðóåìîé òî÷êîé s0 è êàæäîé îïîðíîé òî÷êîé si, à {ω : i i = 1, 2, …, n + 1} îöåíèâàåìûå çíà÷åíèÿ âåñîâ. Ïóñòü w = (ω1, ω2, …, ωn), êîòîðûå âû÷èñëÿþòñÿ ïóòåì ðåøåíèÿ ñèñòåìû óðàâíåíèé, ⎜⎜⎝⎛ Ц 1' 10⎟⎟⎠⎞⎜⎜⎝⎛ωwn+1 ⎟⎟⎠⎞ = ⎜⎜⎝⎛ z 0 ⎟⎟⎠⎞ ãäå Φ - ìàòðèöà ñ i,j ûì ýëåìåíòîì φ(||s s ||) äëÿ ïàðû i j îïîðíûõ òî÷åê i,j, 1 - âåêòîð ñòîëáöà, ñîñòîÿùèé èç åäèíèö, à z - âåêòîð ñòîëáöà, ñîäåðæàùèé äàííûå. Åñëè φ - âåêòîð, ñîäåðæà- ùèé φ(||s i s0||), èíòåðïîëÿòîð ðàâåí, Z€(s0) = w'φ + ωn+1. Ãäå ωn+1 - ïàðàìåòð ñìåùåííîñòè. Ñëåäóåò èñïîëüçîâàòü àíàëîãè÷íûé èíòåðïîëÿòîð, Z€(s0 ) = л'z, ãäå λ ðåøàåò óðàâíåíèå, ⎜⎜⎝⎛ Ц1' 10⎟⎟⎠⎞⎜⎜⎝⎛ mл ⎟⎟⎠⎞ = ⎜⎜⎝⎛ ц 1 ⎟⎟⎠⎞ , ïðåèìóùåñòâî êîòîðîãî ñîñòîèò â òîì, ÷òî îí ïîêàçûâàåò âåñîâûå êîýôôèöèåíòû äëÿ âñåõ äàííûõ. Âåñà îòîáðàæàþòñÿ â äèàëîãå Ïîèñê ñîñåäñòâà.  ìîäóëå Geostatistical Analyst èñïîëüçóþòñÿ ñëåäóþùèå ðàäèàëüíûå ôóíêöèè: 1. Ïîëíîñòüþ ðåãóëÿðèçîâàííûé ñïëàéí, ∑ φ (r ) = − ∞ (−1)n (σ ⋅ r)2n n =1 n!n = ln(σ ⋅ r / 2)2 + E1(σ ⋅ r / 2)2 + CE, ãäå ln - íàòóðàëüíûé ëîãàðèôì, E1(x) - ýêñïîíåíöèàëüíûé èíòåãðàë (Abramowitz and Stegun, 1965, ñòð. 227), à CE - êîíñòàíòà Ýéëåðà (Abramowitz and Stegun, 1965, ñòð. 255), 2. Ôóíêöèÿ ñïëàéíà ñ íàòÿæåíèåì, φ(r) = ln(σ ⋅ r / 2) + K0 (σ ⋅ r) + CE , ãäå K0(x) - ìîäèôèöèðîâàííàÿ ôóíêöèÿ Áåññåëÿ (Abramowitz and Stegun, 1965, ñòð. 374), 3. Ìóëüòèêâàäðèê, ( ) φ (r) = r2 + σ 2 1/ 2 , 4. Îáðàòíûé ìóëüòèêâàäðèê, ( ) φ (r) = r2 + σ 2 , −1/ 2 5. Ïëîñêèé ñïëàéí, φ(r) = (σ ⋅ r)2 ln(σ ⋅ r). Îïòèìàëüíûé ïàðàìåòð ñãëàæèâàíèÿ σ îïðåäåëÿåòñÿ ïóòåì ìèíèìèçàöèè ñðåäíåêâàäðàòè÷íûõ îøèáîê âû÷èñëåíèé ñ èñïîëüçîâàíèåì ïåðåêðåñòíîé ïðîâåðêè. ПРИЛОЖЕНИЕ A 249 Ðàäèàëüíûå áàçèñíûå ôóíêöèè îïèñàíû Áèøîïîì (Bishop, 1995, ñòð. 164). Ðàçâåðíóòîå îïèñàíèå ðàäèàëüíûõ ôóíêöèé è èõ ñâÿçåé ñî ñïëàéíàìè è ìåòîäàìè êðèãèíãà ìîæíî íàéòè â ðàáîòàõ Cressie (1993, ñòð. 180) è Chiles è Delfiner (1999, ñòð. 272). Ãåîìåòðè÷åñêàÿ àíèçîòðîïèÿ Ãåîìåòðè÷åñêàÿ àíèçîòðîïèÿ ó÷èòûâàåòñÿ êàê ïðåîáðàçîâàíèå êîîðäèíàò: s+ = ⎜⎜⎝⎛ r 0 0 1/ r ⎟⎟⎠⎞⎜⎜⎝⎛ cos(θ ) − sin(θ ) sin(θ ) cos(θ ) ⎟⎟⎠⎞ s ãäå θ - óãîë ïîâîðîòà è r - ñîîòíîøåíèå ðàçìåðîâ ìàëîé è áîëüøîé îñè ðåçóëüòèðóþùåãî ýëëèïñà. Ðàññòîÿíèå çàòåì ðàñ- ñ÷èòûâàåòñÿ êàê si+ − s + 0 . 250 ARCGIS GEOSTATISTICAL ANALYST Геостатистические методы Äèàëîã Declustering (Äåêëàñòåðèçàöèÿ) Äåêëàñòåðèçàöèÿ ïî ÿ÷åéêàì Ïî ðàçíûì ïðè÷èíàì äàííûå ìîãëè áûòü îòîáðàíû íåðàâíîìåðíî, ñ ðàçëè÷íîé ãóñòîòîé îïîðíûõ òî÷åê äëÿ ðàçíûõ ó÷àñòêîâ òåððèòîðèè. Äëÿ íåêîòîðûõ ìåòîäîâ ïðåîáðàçîâàíèé, òàêèõ, êàê ïðåîáðàçîâàíèÿ ïî ìåòîäó íîðìàëüíûõ ìåòîê, âàæíî, ÷òîáû ãèñòîãðàììà âûáîðêè ïðàâèëüíî îòðàæàëà ãèñòîãðàììó âñåé ñîâîêóïíîñòè. Ðåøåíèåì äëÿ íåðàâíîìåðíûõ âûáîðîê ÿâëÿåòñÿ ïðèñâîåíèå äàííûì âåñîâûõ çíà÷åíèé, ïðè ýòîì äàííûì, îòîáðàííûì íà òåððèòîðèÿõ ñ âûñîêîé ãóñòîòîé òî÷åê, ïðèñâàèâàþòñÿ ìåíüøèå âåñà. Çà áîëåå äåòàëüíîé èíôîðìàöèåé îáðàòèòåñü ê êíèãàì Journel (1983), Isaaks è Srivastava (1989, ñòð. 421), Cressie (1993, ñòð. 352), è Goovaerts (1998, ñòð. 76). Ìåòîä ïî óìîë÷àíèþ—Èíäåêñ Ìîðèñèòà (Morisita’s index) Ïî óìîë÷àíèþ â ìîäóëå Geostatistical Analyst èñïîëüçóåòñÿ ìåòîä ãðèäà ñ êâàäðàòíûìè ÿ÷åéêàìè, ðàçìåð êîòîðûõ îïðåäåëÿåòñÿ èñõîäÿ èç ìàêñèìàëüíîãî çíà÷åíèÿ èíäåêñà Ìîðèñèòà (Morisita’s index) (Morisita, 1959; ñì. òàêæå Cressie, 1993, ñòð. 590), ãäå èíäåêñ Ìîðèñèòà - ôóíêöèÿ ðàçìåðà ÿ÷åéêè. Ïîëèãîíàëüíûé ìåòîä Âîçìîæíî òàêæå èñïîëüçîâàòü ìåòîä, êîòîðûé ïîçâîëÿåò ïðèñâàèâàòü âåñîâûå çíà÷åíèÿ â çàâèñèìîñòè îò ðàçìåðà ïîëèãîíîâ, îêðóæàþùèõ êàæäóþ òî÷êó. Ïîëèãîíû îáðàçóþòñÿ ïóòåì íàõîæäåíèÿ âñåõ âîçìîæíûõ òî÷åê, êîòîðûå áëèæå ê äàííîé îïîðíîé òî÷êå, ÷åì ê ëþáîé äðóãîé îïîðíîé òî÷êå. Òàêèì îáðàçîì, êàæäàÿ îïîðíàÿ òî÷êà èìååò ïîëèãîí âëèÿíèÿ.  ìàòåìàòèêå òàêèå ïîëèãîíû íîñÿò íàçâàíèå äèàãðàìì Âîðîíîãî è ïîëèãîíîâ Òèññåíà. Çà ðàçúÿñíåíèÿìè îáðàòèòåñü ê ðàáîòàì Isaaks è Srivastava (1989, ñòð. 238), è Goovaerts (1998, ñòð. 79).  ìîäóëå Geostatistical Analyst âíåøíÿÿ ãðàíèöà íåñêîëüêî áîëüøå, ÷åì íàèìåíüøèé (áåç ïîâîðîòà) ïðÿìîóãîëüíèê, êîòîðûé îõâàòûâàåò âñå òî÷êè. Ïðÿìîóãîëüíèê îáðàçóåòñÿ ïóòåì ñóììèðîâàíèÿ íàèáîëüøåé x-êîîðäèíàòû è y-êîîðäèíàòû è 1/ 2 * S / N , ãäå S - ïëîùàäü ïðÿìîóãîëüíèêà, à N - ÷èñëî íàáîðîâ äàííûõ. Ñàìûå ìàëåíüêèå çíà÷åíèÿ êîîðäèíàò x è y íåñêîëüêî óìåíüøàþòñÿ àíàëîãè÷íûì îáðàçîì. Âíåøíÿÿ ãðàíèöà îêàçûâàåò çíà÷èòåëüíîå âëèÿíèå íà âåñîâûå êîýôôèöèåíòû êðàåâûõ òî÷åê. Äèàëîã ìîäåëèðîâàíèÿ ðàñïðåäåëåíèÿ Ïðåîáðàçîâàíèå ïî ìåòîäó íîðìàëüíûõ ìåòîê Äëÿ íåêîòîðûõ ìåòîäîâ êðèãèíãà âàæíî, ÷òîáû äàííûå ïîä÷èíÿëèñü çàêîíó íîðìàëüíîãî ðàñïðåäåëåíèÿ. Îäèí èç ñïîñîáîâ ïðèâåñòè ðàñïðåäåëåíèå äàííûõ ê íîðìàëüíîìó - èñïîëüçîâàòü ïðåîáðàçîâàíèå ïî ìåòîäó íîðìàëüíûõ ìåòîê. Çà ðàçúÿñíåíèÿìè îáðàòèòåñü ê êíèãàì Journel and Huijbregts (1978, ñòð. 478), Isaaks è Srivastava (1989, ñòð. 469), Cressie (1993, ñòð. 281), Rivoirard (1994, ñòð. 46), Goovaerts (1998, ñòð. 266), è Chiles and Delfiner (1999, ñòð. 380). Îäíàêî ìíîãèå èëëþñòðàöèè â ýòèõ èñòî÷íèêàõ ââîäÿò â çàáëóæäåíèå, ïîñêîëüêó íà íèõ ïîêàçàíî, ÷òî ôóíêöèÿ êóìóëÿòèâíîãî ðàñïðåäåëåíèÿ íåîáðàáîòàííûõ äàííûõ ÿâëÿåòñÿ íåïðåðûâíîé.  äåéñòâèòåëüíîñòè ýòî ñòóïåí÷àòàÿ ôóíêöèÿ. Ïóñòü ñòàòèñòè÷åñêèé ðÿä äàííûõ âûãëÿäèò ñëåäóþùèì îáðàçîì: Z(s ), (1) Z(s(2)), … Z(s(n)), ãäå Z(s(1)) - ñàìîå íèçêîå çíà÷åíèå, à Z(s(n)) - ñàìîå âûñîêîå çíà÷åíèå. Ïðåäïîëîæèì, ÷òî ó íàñ åñòü òîëüêî ÷åòûðå çíà÷åíèÿ (n = 4); òîãäà ýìïèðè÷åñêàÿ ôóíêöèÿ êóìóëÿòèâíîãî ðàñïðåäåëåíèÿ áóäåò âûãëÿäåòü ïðèìåðíî ñëåäóþùèì îáðàçîì: Кóìóëÿòèâíàÿ âåðîÿòíîñòü 1 3/4 1/2 1/4 Z(s(1)) Z(s(2)) Z(s(3)) Зíà÷åíèå Z(s(4)) Ýòà ôóíêöèÿ ìîæåò áûòü ñãëàæåíà ðàçëè÷íûìè ñïîñîáàìè. Òàêæå îáðàòèòå âíèìàíèå, ÷òî âåñîâûå çíà÷åíèÿ ïî îñè y - íå äîëæíû áûòü ïðèðàùåíèÿìè (1/n), åñëè èñïîëüçóåòñÿ äåêëàñòåðèçàöèÿ ïî ìåòîäó ÿ÷ååê. Äëÿ âûïîëíåíèÿ ïðåîáðàçîâàíèé â ìîäóëå Geostatistical Analyst ïðåäóñìîòðåíî íåñêîëüêî ìåòîäîâ. ПРИЛОЖЕНИЕ A 251 Ïðÿìîé ñïîñîá Îí èñïîëüçóåò çíà÷åíèÿ, êîòîðûå ñîîòâåòñòâóþò ïîëîâèíå “øàãà” ãðàôèêà ôóíêöèè ýìïèðè÷åñêîãî ðàñïðåäåëåíèÿ. Íà ðèñóíêå ïîêàçàíî ñîîòâåòñòâèå ìåæäó èñõîäíûìè è òðàíñôîðìèðîâàííûìè äàííûìè. Ýìïèðè÷åñêîå êóìóëÿòèâíîå 1 ðàñïðåäåëåíèå 0 Z(s(1)) Z(s(2)) Z(s(3)) Z(s(4)) Иñхîäíûå äàííûå Ïðåîáðàçîâàíèå ïî ìåòîäó 1 íîðìàëüíûõ ìåòîê Êóìóëÿòèâíîå ðàñïðåäåëåíèå äëÿ ñòàíäàðòíîãî íîðìàëüíîãî 0 -3 ðàñïðåäåëåíèÿ 0 3 Нîðìàëьíîå ðàñпðåäåëåíèå Ëèíåéíûé ìåòîä Ëèíåéíûé ìåòîä âûïîëíÿåò ëèíåéíóþ èíòåðïîëÿöèþ ïî ÷àñòÿì äëÿ èñõîäíîé ôóíêöèè êóìóëÿòèâíîãî ðàñïðåäåëåíèÿ. Ñóòü ýòîãî ìåòîäà ëåãêî ïîíÿòü, èçó÷èâ ðèñóíîê: Êóñî÷íûå ëèíåéíûå èíòåðïîëÿöèè ýìïèðè÷åñêîãî êóìóëÿòèâíîãî 1 ðàñïðåäåëåíèÿ 0 Z(s(1)) Z(s(2)) Z(s(3)) Z(s(4)) Иñõîäíûå äàííûå Ïðåîáðàçîâàíèå ïî ìåòîäó 1 íîðìàëüíûõ ìåòîê Êóìóëÿòèâíîå ðàñïðåäåëåíèå äëÿ ñòàíäàðòíîãî íîðìàëüíîãî 0 -3 ðàñïðåäåëåíèÿ 0 3 Нîðìàëüíîå ðàñïðåäåëåíèå Ñìåøàííûé Ãàóññîâ ìåòîä Ñìåñü èç Ãàóññîâûõ ðàñïðåäåëåíèé ìîæåò áûòü èñïîëüçîâàíà äëÿ ñãëàæèâàíèÿ ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè. Ìîäåëü ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè âûãëÿäèò ñëåäóþùèì îáðàçîì: K ∑ p(z) = αi pi ( z; µi ,σ 2 i ) i =1 ãäå K ∑αi = 1 i =1 è pi (z; µi,σ 2 i ) = 1 2π σ i ⎡ exp⎢− ⎢⎣ (z − µi 2σ 2 i )2 ⎤ ⎥ ⎥⎦ Ïàðàìåòðû α , µ , è σ îöåíèâàþòñÿ ïî ñòåïåíè ìàêñèìàëüíîãî ii i ñõîäñòâà, ïðåäïîëàãàÿ ñìåñü èç íîðìàëüíûõ ðàñïðåäåëåíèé è íåçàâèñèìûõ äàííûõ. Êóìóëÿòèâíîå ðàñïðåäåëåíèå âû÷èñëÿåò- ñÿ ÷åðåç ÷èñëîâîå èíòåãðèðîâàíèå, z ∫ P(z) = p(x)dx −∞ è ìåæäó P(z) è êóìóëÿòèâíûì ðàñïðåäåëåíèåì äëÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ óñòàíàâëèâàåòñÿ ñîîòâåòñòâèå, àíàëîãè÷íî òîìó, êàê ýòî äåëàåòñÿ ïðè ïðÿìîì è ëèíåéíîì ìåòîäàõ. 252 ARCGIS GEOSTATISTICAL ANALYST Диалог Вариограмма/Ковариация Определения вариограммы Определение вариограммы приводится практически во всех ра ботах по геостатистике (например, Journel и Huijbregts, 1978, стр. 31; Cressie, 1993, стр. 58; Goovaerts, 1997, стр. 68; Armstrong, 1998, стр. 19; Chiles and Delfiner, 1999, стр. 31; Stein, 1999, стр. 39). Обратите внимание, что некоторые авторы оп ределяют ее как 2g(h), а другие как g(h). Принято, что 2g(h) это вариограмма, а g(h) полувариограмма. Определения ковариации Определения функции ковариации применительно к простран ственному анализу также приводятся практически во всех рабо тах по геостатистике (например, Journel и Huijbregts, 1978, стр. 31; Isaaks и Srivistava, 1989, стр. 221; Cressie, 1993, стр. 53; Goovaerts, 1997, стр. 68; Armstrong, 1998, стр. 19; Chiles и Delfiner, 1999, стр. 30; Stein, 1999, стр. 15). Оценка вариограммы Эмпирическая вариограмма может служить оценкой теорети ческой величины, определяемой вариограммой. Описание оцен ки при помощи эмпирической вариограммы также приведено практически во всех работах по геостатистике (например, Journel и Huijbregts, 1978, стр. 194; Isaaks и Srivastava, 1989, стр. 60; Cressie, 1993, стр. 69; Goovaerts, 1997, стр. 82; Armstrong, 1998, стр. 47; Chiles и Delfiner, 1999, стр. 36; Stein, 1999, стр. 39). Оценка ковариации Эмпирическая ковариация служит для оценки теоретической величины, определяемой ковариационной функцией. Описание оценки с помощью эмпирической ковариации дано в многих ра ботах по геостатистике (например, Journel и Huijbregts, 1978, стр. 192; Isaaks и Srivastava, 1989, стр. 59; Cressie, 1993, стр. 70; Goovaerts, 1997, стр. 86; Chiles и Delfiner, 1999, стр. 31; Stein, 1999, стр. 39). Бининг (объединение) оценок вариограммы и ковариации в классы лагов Оценки эмпирической вариограммы и ковариации обычно объ единяются в классы лагов, основываясь на значении вектора h = (h , h )1, который разделяет пары точек, а затем значения вари xy ограммы или ковариации усредняются для каждого бина. Чаще всего, бининг выполняется по радиальным секторам; мы назо вем этот способ “методом сектора”. Например, на рисунке показан метод, наиболее часто использу емый в программных продуктах, включая программы GSLIB ПРИЛОЖЕНИЕ A 253 h в направлении y Классы лагов Вектор лага h в направлении x h в направлении y Классы лагов Вектор лага h в направлении x (Deutsch и Journel, 1992, стр. 45), Splus (Splus Spatial Stats User Manual Руководство пользователя), и SAS (Technical Report Технический отчет). В отличие от этого метода, в моду ле Geostatistical Analyst лаги определяются по регулярной сетке; назовем этот способ “методом грида”. Однако для данных, отобранных по регулярной сетке, опреде ление границ бинов представляет определенную проблему. Для того, чтобы обойти эту проблему и сгладить эмпирическую вари ограмму, модуль Geostatistical Analyst для определения взвешен ных значений вариограммы для каждой ячейки использует ме тод кернфункции (значения определяются с учетом того, на сколько близко точка расположена к центру ячейки). Значения весов для ячейки, содержащей точку, могут быть найдены как произведение двух маржинальных профилей, как показано на рисунке на стр. 255. Все ячейки вычисляются одинаково. Обра тите внимание, что для любого лага будет вычислено четыре ве совых коэффициента, и их сумма будет равна единице. 254 ARCGIS GEOSTATISTICAL ANALYST 1 h в направлении y 0 Профиль кернфункции 0 1 h в направлении x На рисунке видно, что любой вектор лага, который попадает в область, закрашенную желтым цветом, вносит вклад в класс (бин) лага с центром в красной точке. Чем ближе к центру бина, тем выше вес. То же самое выполняется для всех классов. Модели вариограммы и ковариации Связь между вариограммой и ковариацией В дальнейшем будут даны формулы для вариограмм. Воспользо вавшись связями между моделями вариограммы и ковариации, по вариограммам легко получить значения ковариации, и на оборот. Для внутренне стационарных процессов: C(h;θ) = γ(∞ ;θ) – γ(h;θ), и γ(h;θ) = C(0;θ) – C(h;θ), где γ(∞ ;θ) порог вариограммы, а C(0;θ) начало ковариаци онной функции. Эти связи поддерживаются только для варио грамм, имеющих порог; все модели вариограмм в модуле Geostatistical Analyst имеют порог. Геометрическая анизотропия Геометрическая анизотропия может быть построена с использо ванием преобразования γ (h;θ,Θ) = γ(||Θh||;θ), a где Θ матрица 2×2, а γ(h; θ) одна из моделей изотропной вариограммы, приведенной ниже. Вектор h = (hx,hy) враща ется и масштабируется в новую систему координат, где область влияния вариограммы эллипс. В модуле Geostatistical Analyst большой радиус влияния соответствует длинной оси эллипса, а малый радиус влияния короткой оси эллипса. Параметры боль шого и малого радиусов влияния это значения, при котором радиус влияния равен порогу для моделей, которые достигают пороговых значений, или 95 процентам значения порога для моделей, которые асимптотически приближаются к пороговому значению. Для более подробной информации обратитесь к сле дующей литературе: Journel и Huijbregts (1978, стр. 175), Isaaks и Srivastava (1989, стр. 377), Cressie (1993, стр. 64), Goovaerts (1997, стр. 90), или Armstrong (1998, стр. 28), Chiles и Delfiner (1999, стр. 93). Линейные комбинации моделей Модели вариограммы могут представлять собой линейную ком бинацию вариограмм: γ(h;θ) = γ1(h;θ1) + γ2(h;θ2) + … Модуль Geostatistical Analyst позволяет комбинировать до трех моделей, помимо модели, учитывающей эффект самородка. ПРИЛОЖЕНИЕ A 255 Модель эффекта самородка Модель вариограммы выглядит следующим образом: ãäå θ ≥ 0. s γ (h; и) = ⎧0 ⎩⎨θ s for for h=0 h≠0 Круговая модель Модель вариограммы выглядит следующим образом: ⎧⎡ γ (h;и) = ⎪⎪ ⎨ 2θ π s ⎪ ⎢h ⎢ ⎢⎣ θ r 1 − ⎜⎜⎝⎛ h θr ⎟⎟⎠⎞2 + arcsin h θr ⎤ ⎥ ⎥ ⎥⎦ for 0 ≤ h ≤ θr ⎪⎩ θs for θr < h где θ s ≥ 0 параметр частичного порога, а θ r ≥ 0 параметр радиуса влияния. Сферическая модель Модель вариограммы выглядит следующим образом: Тетрасферическая модель Модель вариограммы выглядит следующим образом: γ (h;и) = ⎧ ⎪ ⎪ 2θ s ⎨π ⎪ ⎪⎩ ⎜⎛ ⎜ ⎜⎜⎝ arcsin⎜⎜⎝⎛ h θr ⎟⎟⎠⎞ + h θr 1 − ⎜⎜⎝⎛ h θr ⎟⎟⎠⎞ 2 + 2 3 h θr ⎜⎜⎛1 ⎝ − ⎜⎜⎝⎛ h θr 3 ⎟⎟⎠⎞ 2 ⎟⎞ ⎟ ⎠ 2 ⎟⎞ ⎟ ⎟⎟⎠ θs for 0 ≤ h ≤ θ r for θ r < h где θ ≥ 0 параметр частичного порога, а θ ≥ 0 параметр s r радиуса влияния. Пентасферическая модель Модель вариограммы выглядит следующим образом: γ (h; и) = ⎧ ⎪⎪θ ⎨ ⎪ s ⎡ ⎢ ⎢⎣ 3 2 h θr ⎪⎩ − 1 2 ⎜⎜⎝⎛ h θr θs ⎟⎟⎠⎞ 3 ⎤ ⎥ ⎥⎦ for for 0 ≤ h ≤θr θr < h где θ ≥ 0 параметр частичного порога, а θ ≥ 0 параметр s r радиуса влияния. γ (h; и) = ⎧ ⎪⎪θ ⎨ s ⎪ ⎢⎡15 ⎢ ⎣ 8 h θr − 5 4 ⎜⎜⎝⎛ h θr ⎟⎟⎠⎞3 + 3 8 ⎜⎜⎝⎛ h θr ⎟⎟⎠⎞5 ⎤ ⎥ ⎥ ⎦ for 0 ≤ h ≤ θr ⎪⎩ θs for θr < h где θ ≥ 0 параметр частичного порога, а θ ≥ 0 параметр s r радиуса влияния. 256 ARCGIS GEOSTATISTICAL ANALYST Экспоненциальная модель Ìîäåëü âàðèîãðàììû âûãëÿäèò ñëåäóþùèì îáðàçîì: γ (h; и) = θ s ⎡ ⎢1 ⎢⎣ − exp ⎜⎜⎝⎛ − 3h θr ⎟⎟⎠⎞ ⎤ ⎥ ⎥⎦ äëÿ âñåõ h, ãäå θ ≥ 0 - ïàðàìåòð ÷àñòè÷íîãî ïîðîãà, à θ ≥ 0 - ïàðàìåòð s r ðàäèóñà âëèÿíèÿ. Гауссова модель Ìîäåëü âàðèîãðàììû âûãëÿäèò ñëåäóþùèì îáðàçîì: γ (h;и) = θ s ⎡ ⎢1 ⎢⎣ − exp⎜⎜⎛ ⎝ − 3 ⎜⎜⎝⎛ h θr ⎟⎟⎠⎞ 2 ⎟⎞ ⎟ ⎠ ⎤ ⎥ ⎥⎦ äëÿ âñåõ h, ãäå θ ≥ 0 - ïàðàìåòð ÷àñòè÷íîãî ïîðîãà, à θ ≥ 0 - ïàðàìåòð s r ðàäèóñà âëèÿíèÿ. Ïîñêîëüêó ýòà ìîäåëü íåñòàáèëüíà, åñëè îò- ñóòñòâóåò ñàìîðîäîê, ïî óìîë÷àíèþ ìîäóëü Geostatistical Analyst äîáàâëÿåò íåáîëüøîå çíà÷åíèå ñàìîðîäêà, ðàâíîå 1/ 1000 âû÷èñëåííîé äèñïåðñèè âûáîðêè. Рациональная квадратичная модель Ìîäåëü âàðèîãðàììû âûãëÿäèò ñëåäóþùèì îáðàçîì: ãäå θ ≥ 0 - ïàðàìåòð ÷àñòè÷íîãî ïîðîãà, à θ ≥ 0 - ïàðàìåòð s r ðàäèóñà âëèÿíèÿ. Модель эффекта дыры Ìîäåëü âàðèîãðàììû âûãëÿäèò ñëåäóþùèì îáðàçîì: γ (h; и) = ⎪⎧ ⎪⎩⎨θ s 1 − sin (02π h / sin (2π h /θ θr ) r ) for for h=0 h≠0 ãäå θ ≥ 0. s Модель K Бесселя Ìîäåëü âàðèîãðàììû âûãëÿäèò ñëåäóþùèì îáðàçîì: ( ) ⎡ ( ) γ (h; и) = θ s ⎢1 ⎢⎣ − Ωθk h /θ r θk 2θk −1 Γ(θ k ) Kθk Ωθ k h /θr ⎤ ⎥ ⎥⎦ äëÿ h, âñåõ ãäå θ ≥ 0, θ s r îáðàçîì, ÷òî ≥ 0, θ k γ(θ ) = 0≥.90Ω5,θθk - çíà÷åíèå, âû÷èñëåííîå òàêèì äëÿ ëþáîãî θ , Γ(θ ) - ãàììà-ôóíê- r s k k öèÿ, ∫ Γ( y) = ∞ x y−1 exp(−x)dx 0 γ (h; и) = θ s 1 19⎜⎜⎝⎛ h θr ⎟⎟⎠⎞ 2 + 19⎜⎜⎝⎛ h θr ⎟⎟⎠⎞ 2 äëÿ âñåõ h, è Kθk (•)- ìîäèôèöèðîâàííàÿ ôóíêöèÿ Áåññåëÿ âòîðîãî ïîðÿäêà θ (Abramowitz è Stegun, 1965, ñòð. 374). k ПРИЛОЖЕНИЕ A 257 Модель J Бесселя Ìîäåëü âàðèîãðàììû âûãëÿäèò ñëåäóþùèì îáðàçîì: ⎡ ( ) ( ) γ (h; и) = θ s ⎢1 ⎢⎣ − 2θd Γ(θ d + 1) Ωθd h /θ r θd Jθd Ωθd h /θ r ⎤ ⎥ äëÿ âñåõ ⎥⎦ h ãäå θ s ≥ 0, θ r ≥ 0, θ d ≥ 0Ω, θ d äîëæíî óäîâëåòâîðÿòü óñëîâèþ, min B >0,γ (B)=θ s ,γ ′(B)<0 B = θr Γ(θ ) - ãàììà-ôóíêöèÿ, k ∫ Γ( y) = ∞ x y−1 exp(−x)dx 0 è Jθd (•) - ôóíêöèÿ J-Áåññåëÿ (Abramowitz è Stegun, 1965, ñòð. 358). Устойчивая модель Ìîäåëü âàðèîãðàììû âûãëÿäèò ñëåäóþùèì îáðàçîì: γ (h;и) = θ s ⎡ ⎢1 ⎢⎣ − exp ⎜⎛ ⎜ ⎝ − 3⎜⎜⎝⎛ h θr ⎟⎟⎠⎞θ e ⎟⎞ ⎤ ⎥ ⎟ ⎠ ⎥⎦ äëÿ âñåõ h, ãäå θ ≥ 0 è 0 ≤ θ ≤ 2. Ïîñêîëüêó ýòà ìîäåëü íåñòàáèëüíà, åñëè s e îòñóòñòâóåò ñàìîðîäîê, ïî óìîë÷àíèþ ìîäóëü Geostatistical Analyst äîáàâëÿåò íåáîëüøîå çíà÷åíèå ñàìîðîäêà, ðàâíîå 1/1000 âû÷èñëåííîé äèñïåðñèè âûáîðêè. Модели взаимной ковариации Модели взаимной ковариации в модуле Geostatistical Analyst ис пользуют модели корегионализации, что означает, что они при надлежат к тому же семейству, что и ковариационные формы моделей вариограммы, перечисленные ранее. Взаимные варио граммы (кросс вариограммы) не используются в модуле Geostatistical Analyst. Традиционная взаимная вариограмма (Matheron, 1965) может быть применена только при опреде ленных условиях (Journel и Huijbregts, 1978, стр. 236; Cressie, 1993, стр. 67; Ver Hoef и Cressie, 1993), и даже в этом случае не является оптимальной. Взаимная ковариация допускает моде ли, которые могут иметь некоторые пространственные сдвиги (Journel и Huijbregts, 1978, стр. 41; Ver Hoef и Cressie, 1993), а эмпирическая поверхность взаимной ковариации позволяет поль зователю визуально определить и оценить эти смещения. Однотипные модели для взаимной ковариации (иногда препод носимые как кроссвариограммы, но при этом их идеи и модели адаптированы под взаимную ковариацию) описаны в работах Journel и Huijbregts (1978, стр. 40), Isaaks и Srivastava (1989, стр. 390), Goovaerts, (1997, стр. 107), и Chiles и Delfiner (1999, стр. 339). Модуль Geostatistical Analyst применяет эти модели, допуская пространственное смещение между двумя перемен ными (Ver Hoef и Cressie, 1993). Это добавляет к модели два параметра, определяющих сдвиг по оси x и по оси y. 258 ARCGIS GEOSTATISTICAL ANALYST Подбор моделей вариограммы и ковариации Алгоритм подбора начинается с получения предварительной оценки диапазона данных, и этот процесс носит название пер вой стадии. Используйте Z k j (si )для обозначения j го измерения переменной типа k в i той точке пространства s . i Стадия 1 Сбонрачдаалнанымохд, уZ~льjk Geostatistical Analyst (si ) = Z k j (si )/ sk где sk сопоставляет стандартное каждый на отклонение выборки. Стадия 1 начинается с предположения, что мы имеем дгреалмо мс аиз(оитлриопкновоайрмиоадцеиляь)юд;лвяысчоипсолсятеатвсляеэнмнпыихрдиачненскыахяZ~ваjk (рsиi )ос использованием метода сектора (как было описано ранее в раз деле ‘Бининг (объединение) оценок вариограммы и ковариа ции в классы лагов’) для большого диапазона классов лагов, ко [ ) торые увеличиваются в геометрической прогрессии. Классы ла гов образуются из интервалов d k−1/ 2, d k+1/ 2 , где d = 1.25, и k меняется от наименьшего аппаратного целого до наибольшего. Центр каждого класса лагов принимается равным d k cosh(12 logd k ) . Очевидно, что многие классы лагов останут ся пустыми, и модуль Geostatistical Analyst использует только те, которые содержат данные. Назовем это эмпирической (взаим ной) ковариацией C€ij( hk ) , где i обозначает i ый тип переменной, j обозначает j ый тип переменной, и k обозначает k ый класс лагов. Первая итерация оценок параметров выпол няется путем минимизации, ∑∑∑ ( ( ) ) ( ) T T nij wij (hk ) C~ij hk ;иij − C€ij hk 2 (1) i =1 j =1 k =1 для θ, где θ вектор параметров для ковариационной функции ij i,j , и θ содержит все ковариационные параметры, где nij ∑ wij(hk ) = Nij(hk )/ Nij(hm) (2) m=1 и N (h ) число пар в эмпирической (взаимной) ковариацион ij k ной функции для переменных i и j в классе k. Назовем эту оценку θ(1). В следующей итерации модуль Geostatistical Analyst исполь зует взвешенные наименьшие квадраты Кресси (1985) путем повторной минимизации (1), только в этот раз, (3) ϖ ij (h k ; и(1) ij ) = N ij (h k ) ~ Cii (0; и(1) ii )C~ jj (0; и(1) jj ) + C~i2j (h k ; и(1) ij ) à çàòåì ýòè âåñà íîðìèðóþòñÿ òàêèì îáðàçîì, ÷òî êàæäîìó çíà÷åíèþ (âçàèìíîé) êîâàðèàöèè ïðèñâàèâàþòñÿ ðàâíûå âåñà, nij ∑ wij (hk ) = ϖ ij (hk ; иi(j1) ) / ϖ ij (hm ; и(ij1) ) (4) m =1 Íàçîâåì ýòó îöåíêó θ(2). Îáðàòèòå âíèìàíèå, ÷òî åñëè âìåñòî êîâàðèàöèè ìû èñïîëüçóåì âàðèîãðàììó, и( 2 ) ii ðàâíî ∑ ( ) ( ) ( ) ⎡ nij arg min θ ii ⎢ ⎢⎣ k =1 wii (h k ) γ~ii hk ; иii − γ€ii hk 2⎥⎤ ⎥⎦ (5) ãäå wii(hk) îïðåäåëÿåòñÿ ïî ôîðìóëå (2), à çàòåì и( 2) ii âû÷èñëÿåòñÿ ïî ôîðìóëå (5) ñ âåñîâûìè çíà÷åíèÿìè êàê â ôîðìóëå (4), íî òåïåðü ϖ ij (h k ; и(1) ii ) = γ Nij (h k ) 2 ii (h; и(1) ii ) Îöåíêè θ(1) è θ(2) - ýòî äâà øàãà â àëãîðèòìå, êîòîðûé èñïîëüçó- åò íåñêîëüêî èòåðàöèé äëÿ ïåðåñ÷åòà âåñîâûõ çíà÷åíèé ïî ìåòî- äó íàèìåíüøèõ êâàäðàòîâ. Îöåíêà θ(2) èñïîëüçóåòñÿ òîëüêî äëÿ îöåíêè äèàïàçîíà äëÿ ðàç- ìåðà ëàãà, ïðåäëîæåííîãî ïî óìîë÷àíèþ äëÿ ìåòîäà ãðèäà, ïðè âûïîëíåíèè îöåíêè ýìïèðè÷åñêîé âàðèîãðàììû èëè êîâàðèà- öèè. ×èñëî ëàãîâ, ïðåäëàãàåìîå ïî óìîë÷àíèþ, ðàâíî 12, ñëåäî- âàòåëüíî, ðàçìåð ëàãà äëÿ ìåòîäà ãðèäà ïðèíèìàåòñÿ ðàâíûì “2*äèàïàçîí/12”. ПРИЛОЖЕНИЕ A 259 Шаг 2 Øàã 2 ïî ñóòè ïîâòîðÿåò øàã 1, íî ðàáîòàåò ñ ýìïèðè÷åñêîé âäààðíèíîûãõðàZ~ìjkì(sîié) èëè (âçàèìíîé) êîâàðèàöèåé ñîïîñòàâëåííûõ êîòîðûå èñïîëüçóþò ìåòîä ãðèäà (îïèñàííûé ðàíåå â ðàçäåëå ‘Îáúåäèíåíèå (áèíèíã) îöåíîê âàðèîãðàììû è êîâàðèàöèè’), ãäå ðàçìåð ëàãà, ïðåäëîæåííûé ïî óìîë÷àíèþ, îïðåäåëÿåòñÿ ïî îöåíêå äèàïàçîíà èç èòåðàöèè θ(2) ïåðâîãî øàãà. Îí òàêæå äîïóñêàåò èñïîëüçîâàíèå àíèçîòðîïèè è ëèíåéíûõ êîìáèíàöèé èç íå áîëåå, ÷åì òðåõ ìîäåëåé (âçàèìíîé) êîâàðèà- öèè èëè âàðèîãðàììû, ñ ó÷åòîì ýôôåêòà ñàìîðîäêà äëÿ êëàñ- ñîâ ëàãîâ äëÿ êàæäîãî íàáîðà äàííûõ, S ∑ ~ C ij (h; и) = Bu (i, j) ρ u (h;цu ). u =1  äàííîé ôîðìóëå, B (i,j) - ïàðàìåòð ÷àñòè÷íîãî ïîðîãà, à òàêæå u i,j -òûé êîìïîíåíò Bu, à T × T ïîëîæèòåëüíî-îïðåäåëåííàÿ ìàòðèöà, â êîòîðîé T - ÷èñëî òèïîâ ïåðåìåííûõ, S - ÷èñëî ðàç- ëè÷íûé ìîäåëåé (âçàèìíîé) êîâàðèàöèè, èñïîëüçóåìûõ â ëè- íåéíîé êîìáèíàöèè, à ôóíêöèÿ ρ (h; ϕ ) íîðìàëèçîâàííàÿ u u ìîäåëü êîâàðèàöèè; ρu(0; ϕu) = 1, ãäå ϕu - ïàðàìåòðû, êîòîðûå îáû÷íî êîíòðîëèðóþò äèàïàçîí (è/èëè ôîðìó) ìîäåëè êîâàðè- àöèè. Êàê è ðàíåå, θ âêëþ÷àåò âñå ïàðàìåòðû. Òðåòüÿ èòåðàöèÿ îöåíîê ïàðàìåòðîâ, θ(3) îñóùåñòâëÿåòñÿ ïóòåì ìèíèìèçàöèè ôîðìóëû (1) ñ âåñàìè (2) äëÿ ýìïèðè÷åñêîé êîâàðèàöèè ñ èñ- ïîëüçîâàíèåì ìåòîäà ãðèäà, à çàòåì ÷åòâåðòàÿ èòåðàöèÿ θ(4) âûïîëíÿåòñÿ ïóòåì ìèíèìèçàöèè (1) ñ âåñàìè, âçÿòûìè èç ôîð- ìóë (4) è (3) äëÿ ýìïèðè÷åñêîé âàðèîãðàììû, èñïîëüçóþùåé ìåòîä ãðèäà. Ýòè ôîðìóëû î÷åâèäíî ìåíÿþòñÿ, åñëè ìû èñ- ïîëüçóåì âàðèîãðàììû, êàê ïîêàçàíî äëÿ øàãà 1. Òåïåðü âåð- íåìñÿ ê èñõîäíîìó ìàñøòàáó. Îêîí÷àòåëüíûå ìîäåëè (âçàèì- íîé) êîâàðèàöèè âûãëÿäÿò ñëåäóþùåì îáðàçîì: Cij(h) = si ~ sj Cij (h;и(ij4) ), è äëÿ âàðèîãðàìì: γ (h) ii = si2γ~ii (h; и(4 ii ) ). Åñëè ïîëüçîâàòåëü ìåíÿåò êàêèå-ëèáî ïàðàìåòðû (íàïðèìåð, ðàçìåð ëàãà), îöåíêè ïåðåñ÷èòûâàþòñÿ, íà÷èíàÿ ñî âòîðîãî øàãà. Диалог двумерного распределения Äèçúþíêòèâíûé êðèãèíã òðåáóåò, ÷òîáû âñå ïàðû äàííûõ ïîä÷èíÿëèñü äâóìåðíîìó íîðìàëüíîìó ðàñïðåäåëåíèþ. Ýòî óñëîâèå òÿæåëî ïðîâåðèòü íà ïðàêòèêå. Ìîäóëü Geostatistical Analyst ïðåäîñòàâëÿåò âèçóàëüíûé èíñòðóìåíò, êîòîðûé ïîìîãàåò îöåíèòü âûïîëíåíèå óñëîâèÿ äâóìåðíîé íîðìàëüíîñòè. Òåîðåòè÷åñêàÿ êðèâàÿ, êàê ôóíêöèÿ ëàãà, ìîæåò áûòü ïîñòðîåíà íà îñíîâå ðàçëè÷íûõ ïîðîãîâûõ çíà÷åíèé äëÿ ôóíêöèè êóìóëÿòèâíîãî ðàñïðåäåëåíèÿ. (ñì. Deutsch è Journel, 1992, ñòð. 139 è Goovaerts, 1998, ñòð. 265). Ýòó òåîðåòè÷åñêóþ êðèâóþ ìîæíî ñðàâíèòü ñ ýìïèðè÷åñêîé âàðèîãðàììîé íà îñíîâå èíäèêàòîðîâ. Áîëåå øèðîêî, åñëè ãðàôèêè ÊÊ ïîêàçûâàþò íîðìàëüíîå ðàñïðåäåëåíèå êîìïîíåíòû ìíîãîìåðíîé ñëó÷àéíîé âåëè÷èíû, è ïîõîæå, ÷òî äàííûå ïîä÷èíÿþòñÿ äâóìåðíîìó íîðìàëüíîìó ðàñïðåäåëåíèþ, ðàçóìíî ïðåäïîëîæèòü è íàëè÷èå ìíîãîìåðíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ äàííûõ. Òàêèì îáðàçîì, ïðîâåðêà íà äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå ìîæåò áûòü èñïîëüçîâàíà äëÿ ïðîñòîãî êðèãèíãà, ÷òî ïîçâîëÿåò ïîëüçîâàòåëþ óäîñòîâåðèòüñÿ â òîì, ÷òî êàðòû êâàíòèëåé è âåðîÿòíîñòåé îñíîâàíû íà ðàçóìíûõ ïðåäïîëîæåíèÿõ. 260 ARCGIS GEOSTATISTICAL ANALYST Формулы кригинга ×åñòü ðàçðàáîòêè ìåòîäîâ êðèãèíãà ïðèíàäëåæèò ìíîãèì àâòîðàì. Êðèãèíã ñ êîâàðèàöèåé ýêâèâàëåíòåí ìåòîäó ëó÷øåé ëèíåéíîé íåñìåùåííîé èíòåðïîëÿöèè (best linear unbiased prediction - BLUP); ìåòîäû ïðîñòîãî, îðäèíàðíîãî è óíèâåðñàëüíîãî êðèãèíãà áûëè ðàçðàáîòàíû òàêèìè ó÷åíûìè, êàê Wold (1938), Õîëìîãîðîâ (1941), Wiener (1949), Ãàíäèí (1959), Goldberger (1962), è Henderson (1963). Ìåòîäû ïðîñòðàíñòâåííîé èíòåðïîëÿöèè ñ èñïîëüçîâàíèåì âàðèîãðàìì áûëè ñôîðìóëèðîâàíû Ãàíäèíûì (1959, 1963) è Matheron (1962, 1969). Îáðàòèòåñü ê ðàáîòàì Journel (1983) ïî èíäèêàòîðíîìó êðèãèíãó, Sullivan (1984) ïî âåðîÿòíîñòíîìó êðèãèíãó, è Matheron (1976) ïî äèçúþíêòèâíîìó êðèãèíãó.  ðàáîòå Cressie (1990) äàíà ïîäðîáíàÿ èíôîðìàöèÿ îá îñíîâàõ êðèãèíãà. Ìîäóëü Geostatistical Analyst âêëþ÷àåò èíòåðïîëÿòîðû, êîòîðûå ìîãóò ó÷èòûâàòü îøèáêó èçìåðåíèé. Ýòè ìîäåëè ðàññìàòðèâàþòñÿ â ðàáîòàõ Ãàíäèíà (1959, 1960, 1963) è Cressie (1986, 1988, 1993, ñòð. 127–135). Ê ýòèì æå ìîäåëÿì îòíîñÿòñÿ è ÷àñòî ïðèâîäèìûå âî ìíîãèõ ó÷åáíèêàõ ïî ãåîñòàòèñòèêå òàê íàçûâàåìûå “æåñòêèå” èíòåðïîëÿòîðû. Ïîä ïîíÿòèåì “æåñòêèé” ïîäðàçóìåâàåòñÿ, ÷òî åñëè èíòåðïîëÿöèÿ âûïîëíÿåòñÿ äëÿ òî÷êè, â êîòîðîé îòáèðàëèñü äàííûå, âû÷èñëåííîå çíà÷åíèå áóäåò â òî÷íîñòè ðàâíî çíà÷åíèþ, ïîëó÷åííîìó ïðè âûïîëíåíèè èçìåðåíèé â ýòîé òî÷êå, è äëÿ íåå ñòàíäàðòíàÿ îøèáêà èíòåðïîëÿöèè ðàâíà íóëþ. Ýòî ìîæåò ïðèâîäèòü ê ñîçäàíèþ ñòðàííûõ êàðò, ïîñêîëüêó â îïîðíûõ òî÷êàõ ïðîèíòåðïîëèðîâàííûå çíà÷åíèÿ áóäóò êàê áû “ïîäñêàêèâàòü”. Ïðè íàëè÷èè îøèáîê èçìåðåíèé, ó ïîëüçîâàòåëÿ ìîæåò âîçíèêíóòü æåëàíèå “îòôèëüòðîâàòü” èçìåðåíèÿ è ñîñòàâèòü áîëåå “ñãëàæåííóþ” êàðòó ïðîèíòåðïîëèðîâàííûõ çíà÷åíèé. Ìîäåëèðîâàíèå îøèáîê èçìåðåíèé âîçìîæíî òîëüêî äëÿ îðäèíàðíîãî, ïðîñòîãî è óíèâåðñàëüíîãî êðèãèíãà. Îïèñàíèå âñåõ ìîäåëåé ïðèâåäåíî äàëåå. Íà÷íåì ñ çàìå÷àíèÿ. Èíîãäà, íåîáõîäèìî áóäåò èìåòü äåëî ñ ìíîæåñòâåííûìè îïîðíûìè òî÷êàìè, ñ ìíîæåñòâåííûìè èçìåðåíèÿ- ìè â îäíîé òî÷êå (îøèáêîé èçìåðåíèé) äëÿ ìíîæåñòâåííûõ òè- ïîâ ïåðåìåííûõ (ïðè êîêðèãèíãå). Äëÿ îáîçíà÷åíèÿ j-îãî èçìå- ðåíèÿ ïåðåìåííîé òèïà k â i-îé ïîëüçóåì îáîçíà÷åíèå Z k j (si ) . òî÷êå ïðîñòðàíñòâà si ìû èñ- Îöåíêà îøèáêè èçìåðåíèé Åñëè åñòü íåñêîëüêî íàáëþäåíèé (èçìåðåíèé) äëÿ êàæäîé îïîð- íîé òî÷êè, ìîäóëü Geostatistical Analyst ìîæåò îöåíèòü îøèáêó èçìåðåíèé. Ôîðìóëà äëÿ âû÷èñëåíèÿ îøèáêè èçìåðåíèé ñëå- äóþùàÿ, ni ∑∑(Z j (si ) − Z (si ))2 σ€ = 2 si ∈D j =1 ME N − nD , ãäå D - íàáîð âñåõ îïîðíûõ òî÷åê, â êîòîðîì âûïîëíåíî áîëåå îäíîãî èçìåðåíèÿ, Zj(si) - j-îå èçìåðåíèå â òî÷êå si, σ€M2 E - ñðåäíåå çíà÷åíèå â òî÷êå si, ni - ÷èñëî íàáëþäåíèé â òî÷êå s i ∈ D, N = Σ i ni äëÿ âñåõ si â D, è nD ÷èñëî îïîðíûõ òî÷åê â D. Äâèæîê â äèàëîãå ïî óìîë÷àíèþ óñòàíàâëèâàåòñÿ â ïîëîæåíèè, êîòîðîå ñîîòâåòñòâóåò ýòîìó çíà÷åíèþ; ýòî îçíà÷àåò, ÷òî îí óñòàíîâëåí íà çíà÷åíèè 100 ( σ€M2 E / ñàìîðîäîê) ïðîöåíòîâ. Ïîëüçîâàòåëè ïðè æåëàíèè ìîãóò çàìåíèòüσ€M2 E ; ïðè âûïîëíå- íèè îöåíêè óñòàíàâëèâàåòñÿ, ÷òî ýôôåêò ñàìîðîäêà íå ìîæåò áûòü ìåíüøå, ÷åì σ€M2 E ; êîãäà ïîëüçîâàòåëü ìåíÿåò çíà÷åíèå ñàìîðîäêà èëè çíà÷åíèå, òîãäà ñîõðàíÿåòñÿ íåðàâåíñòâî “ñàìî- ðîäîê ≥ σ€M2 E”. ПРИЛОЖЕНИЕ A 261 Îðäèíàðíûé êðèãèíã Çàèíòåðåñîâàííûé ÷èòàòåëü ìîæåò îáðàòèòüñÿ ê ðàáîòå Cressie (1993, ñòð. 127–135) çà äîïîëíèòåëüíûìè ðàçúÿñíåíèÿìè ïî èñïîëüçîâàíèþ êðèãèíãà ñ îøèáêîé èçìåðåíèé; äàëåå ïðèâåäåíà ñæàòàÿ âåðñèÿ òîãî, êàê îðäèíàðíûé êðèãèíã ðåàëèçîâàí â ìîäóëå Geostatistical Analyst. Êàê â è Ãëàâå 6, ïðåäïîëîæèì, ÷òî äàííûå - ýòî ðåàëèçàöèÿ ïðîñòðàíñòâåííî àâòîêîððåëèðóþùåãî ïðîöåññà ïëþñ íåçàâèñèìûå ñëó÷àéíûå îøèáêè: Z (s) = µ(s) + ε (s), t t íî òåïåðü ðàçëîæèì ñëó÷àéíûå îøèáêè, εt(s) = Y(s) + η(s) + δt(s), ãäå Zt(s) îáîçíà÷àåò t-óþ ðåàëèçàöèþ â òî÷êå si, è ïóñòü ni - ÷èñëî èçìåðåíèé â òî÷êå si. ×àñòî ni = 1, è åñëè ni > 1, ôîðìèðóåòñÿ ìîäåëü îøèáêè èçìåðåíèé. Ïðåäïîëàãàåòñÿ, ÷òî: • m(s) = m - íåèçâåñòíîå äåòåðìèíèñòñêîå ñðåäíåå çíà÷åíèå. • Y(s) - ñãëàæåííûé ñòàöèîíàðíûé ïðîöåññ âòîðîãî ïîðÿäêà, ÷åé ðàäèóñ âëèÿíèÿ äëÿ àâòîêîððåëÿöèè ìîæíî îïðåäåëèòü ñ ïîìîùüþ ýìïèðè÷åñêîé âàðèîãðàììû èëè êîâàðèàöèè. • E(Y(s)) = 0. • Cov(Y(s), Y(s+h)) = Cy(h), è íåò äîïîëíèòåëüíîãî ýôôåêòà ñàìîðîäêà â ïðîöåññå Y(s). • h(s) ñãëàæåííûé ñòàöèîíàðíûé ïðîöåññ âòîðîãî ïîðÿäêà, ðàäèóñ âëèÿíèÿ âàðèîãðàììû êîòîðîãî íàñòîëüêî áëèçîê ê 0, ÷òî îí ìåíüøå, ÷åì âñå äåéñòâèòåëüíûå ðàññòîÿíèÿ ìåæäó îïîðíûìè è èíòåðïîëèðóåìûìè òî÷êàìè. • E(h(s)) = 0. • Cov(h(s), h (s+h)) = Ch(h) with Ch(Ґ) = 0. • dt(s) ïðîäîëæèòåëüíûé (áåëûé) øóì, ñîñòîÿùèé èç îøèáîê èçìåðåíèé. • E(d (s)) = 0, äëÿ âñåõ s è t. t • Cov(d (s), d (s+h)) = s2 åñëè h = 0 è t = u, â ïðîòèâíîì ñëó- t u ÷àå îí ðàâåí 0. • Y(•), h (•), è d(•) íåçàâèñèìû. Ïðåäïîëîæèì çäåñü, ÷òî ýôôåêò ñàìîðîäêà, îáîçíà÷àåìûé êàê v, ñîñòîèò èç äâóõ ÷àñòåé: âàðèàöèè íà ìèêðîóðîâíå è îøèáêè èçìåðåíèé. Òî åñòü, v = Cη(0) +σ2. Èç ýòîé ìîäåëè âû ìîæåòå âûâåñòè, ÷òî ⎧ Cov (Z t (s), Zu (s + h)) = ⎪ ⎨ Cy (h) + Cη (h) Cy (0) + Cη (0) if h≠0 if h = 0 and t ≠ u ⎪⎩Cy (0) + Cη (0) + σ 2 if h = 0 and t = u . Åñëè ñóùåñòâóåò îøèáêà èçìåðåíèé, âû çàõîòèòå èíòåðïîëèðî- âàòü ôèëüòðîâàííûå (áåç øóìîâ) âåëè÷èíû S(s0) ≡ µ + Y(s0) + η(s0) â òî÷êàõ s0; òî åñòü, âû÷åñòü îøèáêó èçìåðåíèé. Åñëè îøèáêè èçìåðåíèé íåò, S(s0) = Z(s0). Îðäèíàðíûé êðèãèíã ñ îøèáêîé èçìåðåíèé ïðèìåíÿåòñÿ äëÿ ëèíåéíîãî èíòåðïîëÿòîðà, S€ (s ) 0 = λ’z, çàòåì ìèíèìèçèðóåì, E(S(s0) – λ’z)2, ãäå z - âåêòîð èç íàáëþäàåìûõ äàííûõ, à λ - âåêòîð èç âåñîâ êðèãèíãà. Óñëîâèå íåñìåùåííîñòè, E(S(s0) – λ’z) = 0, ïîäðàçóìåâàåò, ÷òî λ’ 1 = 1, à ýòî â ñâîþ î÷åðåäü ïðèâîäèò ê íåîáõîäèìîñòè èñïîëüçîâàíèÿ ïðè ìèíèìèçàöèè ìíîæèòåëÿ Ëàãðàíæà. Òàêèì îáðàçîì, ïîëó÷àåì óðàâíåíèÿ êðèãèíãà, ⎜⎜⎝⎛ Уz 1′ 10 ⎟⎟⎠⎞⎜⎜⎝⎛ л m ⎟⎟⎠⎞ = ⎜⎜⎝⎛ 1c ⎟⎟⎠⎞ 262 ARCGIS GEOSTATISTICAL ANALYST ãäå m - ìíîæèòåëü Ëàãðàíæà, Σz - êîâàðèàöèîííàÿ ìàòðèöà äëÿ äàííûõ, è c ðàâíî Cov(z, S(s0)) = Cov(z, Y(s0) + η(s0)). Ïðåäïîëîæèâ, ÷òî ðàäèóñ âëèÿíèÿ η(•) î÷åíü áëèçîê ê 0, âû ìîæåòå äîïóñòèòü, ÷òî Cov(z, η(s0)) = 0 äëÿ âñåõ ôàêòè÷åñêèõ ðàññòîÿíèé, çà èñêëþ÷åíèåì ñëó÷àÿ, êîãäà s0 = si, ãäå si - îäíà èç òî÷åê íàáëþäåíèÿ; òîãäà Cov(Z(si), η(si)) = Cη(0), ÷òî òðåáóåò îöåíêè. Îáùèé ýôôåêò ñàìîðîäêà ìîæåò áûòü îöåíåí, íî íàïîì- íèì, ÷òî îí ñîñòîèò èç äâóõ ÷àñòåé, v = σ2 + Cη(0). Åñëè åñòü íåçàâèñèìàÿ îöåíêà σ2, òîãäà âû ìîæåòå îöåíèòü Cη(0) = v – σ2. Ýòî ýêâèâàëåíòíî îïðåäåëåíèþ òîé ÷àñòè ýôôåêòà ñàìîðîäêà, êîòîðàÿ ñîîòâåòñòâóåò îøèáêå èçìåðåíèé, è òîé ÷àñòè, êîòîðàÿ ñîîòâåòñòâóåò âàðèàöèè íà ìèêðîóðîâíå; 0 ≤ π < 1, è ìîãóò áûòü óñòàíîâëåíû òîæäåñòâà σ2 = πv è Cη(0) = (1 – π)v. Åñëè äëÿ îäíîé òî÷êè åñòü íåñêîëüêî èçìåðåíèé, îøèáêà èçìåðåíèé ìîæåò áûòü îöåíåíà òàê, êàê ýòî áûëî ïîêàçàíî ðàíåå. Ïîñëå òîãî, êàê îïðåäåëåíû σ2 è Cη(0), ïåðåõîäèòå ê ðåøåíèþ óðàâíåíèé êðèãèíãà. Åñëè âåñü ýôôåêò ñàìîðîäêà - ýòî âàðèàöèÿ íà ìèêðîóðîâíå η(•) (ò.å., íåò îøèáêè èçìåðåíèé), òî â ðåçóëüòàòå ðåøåíèÿ óðàâíåíèé êðèãèíãà, ìû ïîëó÷èì æåñòêèé êðèãèíã. Äëÿ λ ïîëó÷àåì, λ = Σ z 1(c 1m) ãäå m = (1’ Σ z 1 c 1)/1’ Σ z 11, äëÿ èíòåðïîëÿòîðà îðäèíàðíîãî êðèãèíãà. Ïîäñòàâèâ â ýòî óðàâ- íåíèå λ , ïîëó÷èì ñðåäíåêâàäðàòè÷íóþ îøèáêó èíòåðïîëÿöèè, E(S(s ) – λ’z)2 0 = C (0) y + Cη(0) λ’c m, = Cy(0) + (1 – π)v λ’c m, ñëåäîâàòåëüíî, ñòàíäàðòíûå îøèáêè èíòåðïîëÿöèè ðàâíû: σ€S (s0 ) = Cy (0) + (1 − π )v − л'c − m Âû÷èñëåíèå íîâîãî çíà÷åíèÿ äëÿ ïåðåêðåñòíîé ïðîâåðêè è ïðîâåðêè Ïðè âûïîëíåíèè ïåðåêðåñòíîé ïðîâåðêè, âû íå õîòèòå èíòåð- ïîëèðîâàòü S(s ), âåðñèþ äàííûõ áåç øóìîâ, íî äîëæíû èíòåð0 ïîëèðîâàòü Zu(s0), ñ îøèáêîé èçìåðåíèé, äëÿ òîãî, ÷òîáû ñòàíäàðòíûå îøèáêè âû÷èñëåíèé îòðàçèëè ñðåäíåêâàäðàòè÷íóþ îøèáêó âû÷èñëåíèé, ïîëó÷åííóþ â ðåçóëüòàòå âûïîëíåíèÿ ïå- ðåêðåñòíîé ïðîâåðêè. Âû÷èñëåíèå “íîâîãî çíà÷åíèÿ” âûïîë- íÿåòñÿ äëÿ ëèíåéíîãî èíòåðïîëÿòîðà Z€u(s0) = λ’z, çàòåì ìèíèìèçèðóåì, E(Z (s ) – λ’z)2. u0 Ïðåäïîëîæèì, ÷òî åñëè s 0 = s i ∈ D, òî u > ni. Àíàëîãè÷íî ïðåäû- äóùåìó ïðèìåðó, ïîëó÷àåì óðàâíåíèÿ êðèãèíãà, ⎜⎜⎝⎛ Уz 1′ 1 0 ⎟⎟⎠⎞⎜⎜⎝⎛ mл ⎟⎟⎠⎞ = ⎜⎜⎝⎛ 1c ⎟⎟⎠⎞ , ãäå m - ìíîæèòåëü Ëàãðàíæà, Σz - êîâàðèàöèîííàÿ ìàòðèöà äëÿ äàííûõ è c ðàâíî Cov(z, Z (s )) u0 = Cov(z, Y(s ) 0 + η(s ) 0 +δu(s0)). Äëÿ λ ïîëó÷àåì, λ = Σz 1(c 1m) , ãäå m = (1’ Σz 1 c 1)/1’ Σz 11. Îáðàòèòå çíà÷åíèå âZ€íu(èsìi)àíêèàêå,ï÷ðòàîâêèîëãîäíàås0ð=àâsíiî∈íDè ,îèäííîòåìðóïèîçëèíðàîáâëàþíäíàîåå- ìûõ çíà÷åíèé zt(si); t ≤ n. Îäíàêî, ïîäñòàâèâ λ , ÷òîáû íàéòè ñðåäíåêâàäðàòè÷íóþ îøèáêó èíòåðïîëÿöèè, ïîëó÷èì E(Z (s ) – λ’z)2 u0 = C (0) y + Cη(0) + σ2 λ’c m, = Cy(0) + v λ’c m, ñëåäîâàòåëüíî, ñòàíäàðòíûå îøèáêè èíòåðïîëÿöèè ðàâíû σ€Z (s0 ) = Cy (0) + v − л'c − m . ПРИЛОЖЕНИЕ A 263 Ýòè îøèáêè äîëæíû áûòü ñîïîñòàâëåíû ñî ñòàíäàðòíûìè îøèáêàìè èíòåðïîëÿöèè σ€S (s0 ) äëÿ âåðñèè äàííûõ áåç øóìîâ. Îáðàòèòå âíèìàíèå, ÷òî êîãäà s0 = si äëÿ îäíîé èç òî÷åê íàáëþäåíèé si ∈ D, íè îäíà èç ñòàíäàðòíûõ îøèáîê âû÷èñëåíèé íå áóäåò ðàâíà 0. Äëÿ áîëåå ïîäðîáíîé èíôîðìàöèè î êðèãèíãå ñ íîâûì çíà÷åíèåì, îáðàòèòåñü ê ðàáîòå Krivoruchko, Gribov, è Ver Hoef, 2000. Êàðòû âåðîÿòíîñòåé è êâàíòèëåé Åñëè ñëó÷àéíûå îøèáêè ïîä÷èíÿþòñÿ çàêîíó íîðìàëüíîãî ðàñïðåäåëåíèÿ è îáëàäàþò ñòàöèîíàðíîñòüþ (ëèáî âòîðîãî ïîðÿäêà, ëèáî âíóòðåííåé), òî îøèáêà èíòåðïîëÿöèè S€(s0) - S(s0) òîæå ïîä÷èíÿåòñÿ çàêîíó íîðìàëüíîãî ðàñïðåäåëåíèÿ, ñ íóëåâûì ñðåäíèì çíà÷åíèåì è äèñïåðñèåé, ðàâíîé σ€s2 (s0 ) . Íîðìàëüíîñòü ðàñïðåäåëåíèÿ ïîçâîëÿåò ñòðîèòü êàðòû âåðîÿòíîñòåé èëè êâàíòèëåé. 264 ARCGIS GEOSTATISTICAL ANALYST Простой кригинг Здесь приведено сжатое описание реализации простого кригин га в модуле Geostatistical Analyst. Чтобы понять, что представля ет собой модель и какие делаются предположения, обратитесь к разделу, посвященному ординарному кригингу. Для простого кригинга одно предположение меняется на следующее: µ(s) известная, детерминистская средняя функция. При ординарном же кригинге, необходимо интерполировать отфильтрованную (без шумов) величину S(s0) ≡ µ(s0) + Y(s0) + η(s ) в точке s . 0 0 Интерполяция с ошибкой измерений Простой кригинг с ошибкой измерений получается для линей ного интерполятора, (s ) = λ’z + k 0 затем минимизируем, E (S(s0) – λ ’z – k)2 =Var[Y(s0) + η(s ) 0 – λ’z] + [µ(s ) 0 – λ ’µ – k]2, где µ - вектор из известных средних для всех полученных дан ных. Минимизация достигается при определении k = µ(s ) – 0 λ’µ и λ = Σz 1c, где Σz ковариационная матрица данных, и c равно Cov(z, Y(s ) + η(s )). Затем получаем интерполятор для 0 0 простого кSр€ игинга, (s0) = λ’z + k = c’Σz 1 (z µ) + µ(s0). Подставляем, чтобы получить среднеквадратичные ошибки ин терполяции, E(S(s ) – λ’z – k)2 0 = C (0) y + Cη(0) – c’Σ z 1c = C (0) + (1 – π)v – c’Σ 1c , y z и стандартные ошибки интерполяции равны: σ€S (s0 ) = Cy (0) + (1 − π )v − л'c Вычисление нового значения для перекрестной проверки При выполнении перекрестной проверки нежелательно интер полировать значения версии данных “без шумов”—наоборот, следует интерполировать значения с ошибкой измерений с тем, чтобы стандартные ошибки интерполяции отразили среднеква дратичную ошибку интерполяции, полученную при выполнении перекрестной проверки. Вычисление “нового значения” выпол няется для линейного интерполятора, u(s0) = λ’z + k, затем минимизируем, E(Zu(s0) – λ’z – k )2. Предположим, что если s 0 = s i ∈ D, то u > ni. Повторяя выпол ненные ранее операции, получаем интерполятор кригинга, u(s0) = λ’z + k = c’Σz 1(z µ) + µ(s0) , со среднеквадратичными ошибками интерполяции, E(Z (s ) – λ’z – k )2 u0 = C (0) y + Cη(0) + σ2 − c’Σ z 1c = Cy(0) + v + c’Σz 1c , в результате, стандартные ошибки интерполяции равны: σ€Z (s0 ) = Cy (0) + v − л'c . Эти ошибки необходимо сравнить со стандартными ошибками интерполяции для версии данных без шумов. Обратите внима ние, что когда s 0 = s i для одной из точек наблюдений s i ∈ D, ни одна из стандартных ошибок интерполяции не будет равна 0. ПРИЛОЖЕНИЕ A 265 Карты вероятности и квантилей Åñëè äàííûå ïîä÷èíÿþòñÿ çàêîíó ñâÿçàííîãî ìíîãîìåðíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ, ãäå ⎡S(s0 )⎤ ⎢ ⎣ z ⎥ ⎦ ~ N ⎜⎜⎝⎛ ⎡µ ⎢ ⎣ (s0 м )⎤ ⎥, ⎦ ⎡C y ⎢ ⎣ (0) + Cη c' (0) c Уz ⎤ ⎥ ⎦ ⎟⎟⎠⎞ òìîíîS€ã(îsì0)åð-íóîñãëîîâííîîðåìîàæëèüäíàîíãèîåð, Eàñ(ïSð(åsä0)å|ëzå)í,èàÿèçSâ€åñ(òsí0î)åññîâñîòéîñèòòâîâ òîì, ÷òî S(s0)|z) ~ N(c’Σz 1(z µ) + µ(s0), Cy(0) +Cη(0) c’Σz 1c). Ïîñêîëüêó ïðîèíòåðïîëèðîâàííûå çíà÷åíèÿ òàêæå ïîä÷èíÿþòñÿ çàêîíó íîðìàëüíîãî ðàñïðåäåëåíèÿ, âîçìîæíî âû÷èñëèòü çíà÷åíèÿ âåðîÿòíîñòåé, èëè ïî àíàëîãèè ïîñòðîèòü êàðòó êâàíòèëåé. Òàêæå îáðàòèòå âíèìàíèå, ÷òî óñëîâíîå îæèäàíèå E(S(s0)|z) íàèëó÷øèé èíòåðïîëÿòîð èç âñåõ èíòåðïîëÿòîðîâ, ëèíåéíûõ è íåëèíåéíûõ, òàê êàê èìååò íàèìåíüøóþ ñðåäíåêâàäðàòè÷íóþ îøèáêó èíòåðïîëÿöèè. 266 ARCGIS GEOSTATISTICAL ANALYST Универсальный кригинг Предположим, что у нас есть следующая модель: Z (s) = [x(s)]’β + ε (s), t t теперь разложим на составляющие случайные ошибки: ε (s) = Y(s) + η(s) + δ (s), t t где X - предполагаемая матрица и β - вектор параметров, други ми словами, она аналогична модели ординарного кригинга, с теми же допущениями, за исключением одного, µ(s) = [x(s)]’β , где x(s) - вектор ковариат наблюдений и b вектор из неизвестных параметров. Интерполяция с ошибкой измерений Êàê и для ординарного кригинга, интерполируем фильтрован ную (без шумов) величину S(s ) ≡ [x(s )]’β + Y(s ) + η(s ) в 0 0 0 0 точке s0. Матрица X имеет столбец из единиц, другие столбцы содержат полиномиальные функции пространственных коор динат в точке s. Универсальный кригинг с ошибкой измерений получается для линейного интерполятора, затем минимизируем, S€(s0) = λ’z, E(S(s ) – λ’z)2 , 0 где z вектор данных наблюдений, а λ вектор весов кригинга. Условие несмещенности выглядит следующим образом: E(S(s0) – λ’z) = 0 , значит X’ λ = x(s0). Повторив операции как для ординарного кригинга, получаем уравнения универсального кригинга, ⎜⎜⎝⎛ Уz X' X 0 ⎟⎟⎠⎞⎜⎜⎝⎛ mл ⎟⎟⎠⎞ = ⎜⎜⎝⎛ c x(s0 ) ⎟⎟⎠⎞ где m вектор из множителей Лагранжа, Σz ковариационная матрица данных и c равно Cov(z, S(s )). Вычислив λ, получаем 0 интерполятор для универсального кригинга, λ = Σz 1(c Xm) , ãäå m = (X’ Σz 1X) 1(X’ Σz 1 c − x(so)). Подставляем, чтобы получить среднеквадратичные ошибки ин терполяции, E(S(s ) – λ’z)2 0 = Cy(0) + Cη(0) λ’(c+Xm), = Cy(0) + (1 – π)v λ’(c+Xm), и стандартные ошибки интерполяции равны: σ€S (s0 ) = Cy (0) + (1 − π )v − л' (c − Xm) . Вычисление нового значения для перекрестной проверки При выполнении перекрестной проверки не интерполируйте S(s0), значения версии данных “без шумов”; наоборот, следует интерполировать значения с ошибкой измерений Zu(s0) с тем, чтобы стандартные ошибки интерполяции отразили срднеквад ратичную ошибку интерполяции, полученную при выполнении перекрестной проверки. Вычисление “нового значения” выпол няется для линейного интерполятора, Z€u (s0) = λ’z, затем минимизируем, E(Z (s ) – λ’z)2. u 0 Предположим, что если s 0 = s i ∈ D, то u > ni. Повторяя выполненные ранее операции, получаем уравнения универсального кригинга, ⎜⎜⎝⎛ Уz X' X 0 ⎟⎟⎠⎞⎜⎜⎝⎛ л m ⎟⎟⎠⎞ = ⎜⎜⎝⎛ c x(s0 ) ⎟⎟⎠⎞ Вычислив λ, получаем интерполятор для универсального кригинга, λ = Σz 1(c Xm), ãäå m = (X’ Σz 1X) 1(X’ Σz 1 c − x(s )). 0 ПРИЛОЖЕНИЕ A 267 ÎZá€ð(àòsè)ò,åêâàíêèïìðààíâèèåë,î÷,òíîåêðîàãâäíàîs0í=è sι∈ D, âû÷èñëåííîå çíà÷åíèå îäíîìó èç çíà÷åíèé íàáëþäå- u0 íèé zt(sι); t ≤ nι. Ïîäñòàâëÿÿ λ , ïîëó÷àåì ñðåäíåêâàäðàòè÷íóþ îøèáêó èíòåðïîëÿöèè, E(Z (s ) – λ’z)2 = u0 = C (0) y + Cη(0) + σ2 λ’(c +Xm), = C (0) + v λ’(c +Xm), y â ðåçóëüòàòå, ñòàíäàðòíûå îøèáêè èíòåðïîëÿöèè ðàâíû: C y ( 0 ) + v − л ' ( c − Xm ) . Ýòè îøèáêè íåîáõîäèìî ñðàâíèòü ñî ñòàíäàðòíûìè îøèáêàìè èíòåðïîëÿöèè äëÿ âåðñèè äàííûõ áåç øóìîâ. Îáðàòèòå âíèìà- íèå, ÷òî êîãäà s 0 = s i äëÿ îäíîé èç òî÷åê íàáëþäåíèé s i ∈ D, íè îäíà èç ñòàíäàðòíûõ îøèáîê èíòåðïîëÿöèè íå áóäåò ðàâíà 0. Êàðòû âåðîÿòíîñòè è êâàíòèëåé Åñëè ñëó÷àéíûå îøèáêè ïîä÷èíÿþòñÿ çàêîíó íîðìàëüíîãî ðàñ- ïðåäåëåíèÿ è îáëàäàþò ñòàöèîíàðíîñòüþ (ëèáî âòîðîãî ïîðÿäêà, ëèáî âíóòðåííåé), òî îøèáêè âû÷èñëåíèé (s0) -S€S(s0) òîæå ïîä÷èíÿþòñÿ çàêîíó íîðìàëüíîãî ðàñïðåäåëåíèÿ, ñ íóëåâûì ñðåäíèì çíà÷åíèåì è äèñïåðñèåé, ðàâíîé σ€S (s0 ) . Íîðìàëüíîñòü ðàñïðåäåëåíèÿ ïîçâîëÿåò ñòðîèòü êàðòû âåðîÿòíîñòåé èëè êâàíòèëåé. 268 ARCGIS GEOSTATISTICAL ANALYST Логарифмически нормальный линейный кригинг Если вы выбираете логарифмическое преобразование, для орди нарного, простого и универсального кригинга вы можете исполь зовать логарифмически нормальный кригинг (или логнормаль ный кригинг), который реализован в соответствии с описанием, приведенном в работе Кресси (Cressie, 1993). Формулы интер поляции приведены на следующих страницах: Ординарный кригинг—уравнение 3.2.40, стр. 135 (Cressie, 1993) Простой кригинг—второе уравнение на стр. 136 (Cressie, 1993) Универсальный кригинг—Cressie (1993) уравнение 3.2.40 сво дится к, p€z (Z;s0 ) = exp{p€Y (Z;s0 ) +σ€Y2 (s0 ) / 2 − mY '[x(s0 )]} где m вектор из множителей Лагранжа из уравнений универ сального кригинга, и x(s0) вектор из ковариат в точке s0, для которой интерполируется значение. Дисперсия вы,числения дана в работе Кресси (Cressie, 1993) в уравнении 3.2.41, где: Для ординарного кригинга - µ Y меняется на: µ€Y = 1' УY−1Y /(1' УY−1 1) , Для простого кригинга µ Y известно, Для универсального кригинга µ Y меняется на: µ€Y (s 0 ) = [x(s0 )]' (X' УY−1 X)−1 X' УY−1Y где вектор Y = log(Z), и предполагается, что каждый элемент вектора Y подчиняется нормальному распределению. Трансгауссов кригинг Если выбрано преобразование по методу Box–Cox или арксину са, для ординарного, простого и универсального кригинга вы можете использовать трансгауссов кригинг, который реализо ван в соответствии с описанием, приведенном в работе Кресси (Cressie, 1993, стр. 137). Индикаторный кригинг Индикаторный кригинг это нелинейный метод, и для индика торов может быть применена только жесткая форма (т.е., с не отфильтрованной ошибкой измерений) ординарного кригинга. Предположим, что данные относятся к пространственно корре лированному процессу, Z(s) = µ + ε(s), и бинарная (0 или 1) вероятностная переменная образована с использованием порогового значения, Z1(s) = I(Z(s) > c ), 1 где I(условие) индикаторная функция, которая равна 1, если условие верно, и 0, если условие неверно. Предположим, что бинарные данные также относятся к пространственно коррели рованному процессу (с возможным эффектом самородка), Z1(s) = µ 1 + ε1(s). Индикаторный кригинг это ординарный кригинг (с нулевой ошибкой измерений) бинарных переменных Z1(s), и, следова тельно, для Z(s) не предпринимается попыток фильтрации оши бок измерений. Может быть использовано другое пороговое зна чение, для модели Z2(s) = I(Z(s) > c2), Z2(s) = µ2 + ε2(s). Теперь воспользуемся кокригингом для обеих бинарных пере менных для вычисления значений Z1(s0). Теория и формулы при ведены в работах Journel (1983), Isaaks и Srivastava (1989), Cressie (1993, стр. 281), Goovaerts (1997, стр. 293), и Chiles и Delfiner (1999, стр. 381). ПРИЛОЖЕНИЕ A 269 Вероятностный кригинг Как и индикаторный кригинг, вероятностный кригинг (Sullivan, 1984; Cressie, 1993, стр. 283; Goovaerts, 1997, стр. 301; Chiles и Delfiner, 1999, стр. 385) это нелинейный метод, и при исполь зовании вероятностного кригинга не существует очевидных спо собов для фильтрации ошибки измерений. Предположим, что полученные данные это реализация пространственно коррели рованного процесса, плюс независимые случайные ошибки, Z(s) = µ + ε(s), и на основании порогового значения создана бинарная (0 или 1) вероятностная переменная, Z1(s) = I(Z(s) > c), где I(условие) индикаторная функция, которая равна 1, если условие верно, и 0, если условие неверно. Предположим, что бинарные данные также относятся к пространственно коррели рованному процессу (с возможным эффектом самородка), Z1(s) = µ + ε 1 (s). 1 Затем воспользуемся кокригингом для вычисления Z1(s0) с ис пользованием {Z1(s)} в качестве первой переменной и исходных значений {Z(s)} в качестве второй переменной в уравнениях кокригинга. Обратитесь за дополнительной информацией к раз делу, посвященному кокригингу. Дизъюнктивный кригинг Для дизъюнктивного кригинга (Matheron, 1976), интерполя тор выглядит следующим образом: ∑ Z€(s0) = gs (Z (s)), s∈D где g (Z(s)) - некая функция переменной Z(s). Модуль s Geostatistical Analyst использует следующий интерполятор, ∑ Z€(s0 ) = f0 + fk H€k (Y (s0 )), k >0 где n ∑ H€k (Y (s0 )) = λkiHk (Y (si )), i =1 f и λ - коэффициенты, H (Y(s )) - многочлены Хермита i ki k i (Hermite), а Y(si) и Y(sj) подчиняются двумерному нормальному распределению. Переменная Y(s) может быть преобразована (т.е., дизъюнктивный кригинг может быть логнормальным и трансгауссовым) и позволяет пользователю изучить предполо жение о двумерной нормальности. Теория и практика дизъюнк тивного кригинга довольно сложны; модуль Geostatistical Analyst следует методике, приведенной в работе Ривуарара (Rivoirard, 1994). 270 ARCGIS GEOSTATISTICAL ANALYST Êîêðèãèíã Êîêðèãèíã ìîæåò áûòü èñïîëüçîâàí ïðè íàëè÷èè íåñêîëüêèõ ïåðåìåííûõ. Òî÷íûå ôîðìóëû êîêðèãèíãà ïðèâåäåíû â ðàáîòàõ: Journel è Huijbregts (1978, ñòð. 324), Isaaks è Srivastava (1989, ñòð. 400), Cressie (1991, ñòð. 138), Goovaerts (1997, ñòð. 224), è Chiles è Delfiner (1999, ñòð. 298). Îðäèíàðíûé êîêðèãèíã, ïðîñòîé êîêðèãèíã è óíèâåðñàëüíûé êîêðèãèíã äîïóñêàþò èñïîëüçîâàíèå ìîäåëåé, ó÷èòûâàþùèõ îøèáêó èçìåðåíèé, êàê è ñîîòâåòñòâóþùèå èì ìîäåëè êðèãèíãà. Òàê æå, êàê è èíäèêàòîðíûé êîêðèãèíã, âåðîÿòíîñòíûé êîêðèãèíã è äèçúþíêòèâíûé êîêðèãèíã ìîãóò âûïîëíÿòü òîëüêî æåñòêóþ èíòåðïîëÿöèþ (ò.å., îøèáêà èçìåðåíèé íå ôèëüòðóåòñÿ). Îðäèíàðíûé, ïðîñòîé è óíèâåðñàëüíûé êîêðèãèíã Ìîäåëü óíèâåðñàëüíîãî êîêðèãèíãà ÿâëÿåòñÿ íàèáîëåå îáùåé, ïîýòîìó ïðåäïîëîæèì, ÷òî Z k j (s)= [x (s)]’β k k + Yk(s) + ηk(s) + δ k j (s), ãäå Xk - ïðåäïîëàãàåìàÿ ìàòðèöà, è βk - âåêòîð ïàðàìåòðîâ äëÿ ïåðåìåííîé k-îãî òèïà, ñî ñëåäóþùèìè äîïóùåíèÿìè: • Yk(s) - ñãëàæåííûé âòîðîãî ïîðÿäêà ñòàöèîíàðíûé ïðîöåññ, ðàäèóñ âëèÿíèÿ âàðèîãðàììû êîòîðîãî áîëüøå, ÷åì íàèìåíü- øåå ðàññòîÿíèå ìåæäó îïîðíûìè òî÷êàìè. • E(Yk(s)) = 0. • Cov(Yk(s), Ym(s+h)) = C km y (h) , ïðè ýòîì C km y (∞) = 0 (ò.å., îòñóòñòâóåò äîïîëíèòåëüíûé ýôôåêò ñàìîðîäêà â ïðîöåññå Yk(s)). • ηk(s) - ñãëàæåííûé âòîðîãî ïîðÿäêà ñòàöèîíàðíûé ïðîöåññ, ðàäèóñ âëèÿíèÿ âàðèîãðàììû êîòîðîãî òàê áëèçîê ê íóëþ 0, ÷òî îí ìåíüøå âñåõ ôàêòè÷åñêèõ ðàññòîÿíèé ìåæäó îïîðíûìè òî÷êàìè è òî÷êàìè, äëÿ êîòîðûõ èíòåðïîëèðóþòñÿ çíà÷åíèÿ. • E(ηk(s)) = 0. • Cov(ηk(s), ηm(s+h)) = Cηkm(∞) , êîãäà k ðàâíî m, ïðè ýòîì Cηkm (h)= 0. • Cov(ηk(s), ηm(s+h)) = 0, êîãäà k íå ðàâíî m. • δ k j (s) øóìû, îáðàçóåìûå îøèáêàìè èçìåðåíèé. • E ( δ k j (s) ) = 0, äëÿ âñåõ k è j. • Cov(δ k j (s), δ k j (s + h))= sk2 åñëè h = 0; â ïðîòèâíîì ñëó÷àå, îíà ðàâíà 0. • Cov(δ k j (s), d k(s+h)) t = 0 äëÿ i, íå ðàâíûõ t. Yk(•), ηl(•), and δm(•) íåçàâèñèìû äðóã îò äðóãà äëÿ âñåõ k, l, è m. Ïðåäïîëîæèì, ÷òî â äàííîì ñëó÷àå ýôôåêò ñàìîðîäêà vi ñîñòîèò èç äâóõ ÷àñòåé: âàðèàöèè íà ìèêðîóðîâíå è îøèáêè èçìåðåíèé; òî åñòü, vk = Cηkk(0) + σ 2. k Òàêæå îáðàòèòå âíèìà- íèå, ÷òî äëÿ ηk(•) è ηm(•) íåò îáùåé èíôîðìàöèè, ïîýòîìó èõ âçàèìíóþ êîâàðèàöèþ ìîæíî óñòàíîâèòü, ðàâíîé 0. Íà îñíîâà- íèè ýòîé ìîäåëè âû ìîæåòå ïðèéòè ê âûâîäó, ÷òî Cov(Z k j (s), Z m t (s + h)) = ⎧ ⎪ ⎪ ⎨ ⎪ C km y (h) C kk y (h) + Cηkk (h) C kk y ( 0) + Cηkk (0) if k≠m if k = m and h ≠ 0 if k = m and h = 0 and j ≠ t ⎪⎩C kk y (0) + Cηkk (0) + σ 2 k if k = m and h = 0 and j = t Äëÿ óïðîùåíèÿ, ðàññìîòðèì òîëüêî äâà òèïà ïåðåìåííûõ; âû- âîäû ëåãêî îáîáùèòü äëÿ áîëüøåãî êîëè÷åñòâà òèïîâ ïåðåìåí- íûõ. Âû÷èñëèì îòôèëüòðîâàííóþ (áåç øóìîâ) âåëè÷èíó S1(s0) ≡ [x (s )]’β 10 1 + Y1(s ) 0 + η1(s ) 0 â òî÷êå s0. Êîêðèãèíã â ìîäóëå Geostatistical Analyst ïîëó÷àåòñÿ äëÿ ëèíåéíîãî èíòåðïîëÿòîðà, S€1 (s0 )= л1′z1 + л′2z2 çàòåì ìèíèìèçèðóåì, E(Z(s0) [ л1′z1 + л′2z2 ])2 . Âûïîëíèâ òå æå îïåðàöèè, ÷òî è äëÿ îðäèíàðíîãî êðèãèíãà, ïîëó÷àåì ñëåäóþùèå óðàâíåíèÿ êîêðèãèíãà: ⎜⎜⎝⎛ Уz X' X 0 ⎟⎟⎠⎞⎜⎜⎝⎛ л m ⎟⎟⎠⎞ = ⎜⎜⎝⎛ x1 c (s0 ) ⎟⎟⎠⎞ , ПРИЛОЖЕНИЕ A 271 ãäå Σz= ⎜⎜⎝⎛ У11 У21 У12 У22 ⎟⎟⎠⎞, X = ⎜⎜⎝⎛ X1 0 0 X2 ⎟⎟⎠⎞ , c = ⎜⎜⎝⎛ c1 c2 ⎟⎟⎠⎞ , λ = ⎜⎜⎝⎛ л1 л2 ⎟⎟⎠⎞ , m = ⎜⎜⎝⎛ m1 m2 ⎟⎟⎠⎞ , m1è m2 - ìíîæèòåëè Ëàãðàíæà, Σkm - êîâàðèàöèîííàÿ ìàòðèöà äëÿ äàííûõ z k è z, m à c k ðàâíî Cov(z , k S1(s0)). Ðåøèâ óðàâíåíèå äëÿ λ, ïîëó÷èì, λ = Σz 1(c Xm) , ãäå m = (X’ Σz 1X) 1(X’ Σz 1c x (s )). 10 Ïîäñòàâèâ λ, ïîëó÷èì ñðåäíåêâàäðàòè÷íóþ îøèáêó èíòåðïî- ëÿöèè, E(S1(s ) – λ’z)2 0 = C 11 y (0) + Cη11 (0) − λ’(c +Xm), = C 11 y (0) + (1 – π )v 11 λ’(c +Xm), ñëåäîâàòåëüíî, ñòàíäàðòíûå îøèáêè èíòåðïîëÿöèè ðàâíû: Èíäèêàòîðíûé, âåðîÿòíîñòíûé è äèçúþíêòèâíûé êîêðèãèíã Èíäèêàòîðíûé, âåðîÿòíîñòíûé è äèçúþíêòèâíûé êîêðèãèíã îòíîñÿòñÿ ê íåëèíåéíûì ìåòîäàì, è òîëüêî æåñòêàÿ ôîðìà (ò.å., îøèáêà èçìåðåíèé íå îòôèëüòðîâûâàåòñÿ) îðäèíàðíîãî êîêðèãèíãà ìîæåò áûòü èñïîëüçîâàíà äëÿ ýòèõ ìåòîäîâ. Èíäèêàòîðíûé êîêðèãèíã - ýòî ïðîñòî êîêðèãèíã äëÿ èíäèêàòîðîâ; îáðàòèòåñü ê ðàáîòàì: Cressie (1993, ñòð. 283), Goovaerts (1997, ñòð. 297), è Chiles è Delfiner (1999, ñòð. 386). Âåðîÿòíîñòíûé êîêðèãèíã, ïîìèìî èñïîëüçîâàíèÿ èñõîäíûõ äàííûõ, ôîðìèðóåò èíäèêàòîðû äëÿ äâóõ òèïîâ ïåðåìåííûõ, à çàòåì ïîëüçóåòñÿ óðàâíåíèÿìè îðäèíàðíîãî êîêðèãèíãà. Äèçúþíêòèâíûé êîêðèãèíã - ýòî îáîáùåíèå ìåòîäà äèçúþíêòèâíîãî êðèãèíãà äëÿ äâóìåðíûõ Ãàóññîâûõ ðàñïðåäåëåíèé (Muge è Cabecadas, 1989; Chiles è Delfiner, 1999, ñòð. 419). Åñëè σ€S1 (s0 ) = C1y1(0) + (1−π 1)ν1 − л' (c + Xm) . X = ⎜⎜⎝⎛ 1 0 0 1 ⎟⎟⎠⎞ , òîãäà îðäèíàðíûé êîêðèãèíã ñâîäèòñÿ ê îñîáîìó ñëó÷àþ óíèâåðñàëüíîãî êîêðèãèíãà. Äëÿ ïðîñòîãî êðèãèíãà, S€1 (s 0 ) = λ’z + k = c’Σz 1(z µ) + µ1(s0), à ñòàíäàðòíûå îøèáêè èíòåðïîëÿöèè âû÷èñëÿþòñÿ ïî ôîðìóëå, σ€S1 (s0 ) = C1y1(0) + (1−π1 )ν1 − c' Уz c . Èíòåðïîëÿöèÿ íîâûõ çíà÷åíèé äëÿ ïåðåêðåñòíîé ïðîâåðêè ìîæåò áûòü âûïîëíåíà òàê æå, êàê è äëÿ îðäèíàðíîãî, ïðîñòîãî è óíèâåðñàëüíîãî êðèãèíãà. Äèàëîã Ïåðåêðåñòíàÿ ïðîâåðêà Ïåðåêðåñòíàÿ ïðîâåðêà Ïåðåêðåñòíàÿ ïðîâåðêà ñîñòîèò â ïîñëåäîâàòåëüíîì óäàëåíèè èç îáùåé ñîâîêóïíîñòè çíà÷åíèÿ îäíîé îïîðíîé òî÷êè, à çàòåì èíòåðïîëÿöèè çíà÷åíèÿ ýòîé òî÷êè ñ èñïîëüçîâàíèåì îñòàâøèõñÿ äàííûõ. Çàòåì, ïðîèíòåðïîëèðîâàííîå çíà÷åíèå ìîæåò áûòü ñîïîñòàâëåíî ñ ôàêòè÷åñêèì (çíà÷åíèåì íàáëþäåíèÿ) äëÿ îöåíêè òîãî, íàñêîëüêî õîðîøî ðàáîòàåò ìîäåëü èíòåðïîëÿöèè. Îáðàòèòå âíèìàíèå, ÷òî â ãåîñòàòèñòèêå ìîäåëè âàðèîãðàììû, êàê ïðàâèëî, íå îöåíèâàþòñÿ çàíîâî êàæäûé ðàç, êîãäà óäàëÿåòñÿ çíà÷åíèå îäíîé îïîðíîé òî÷êè. Áîëåå ïîäðîáíóþ èíôîðìàöèþ î âûïîëíåíèè ïåðåêðåñòíîé ïðîâåðêè âû ìîæåòå ïîëó÷èòü â ðàáîòàõ Isaaks è Srivastava (1989, ñòð. 351), Cressie (1993, ñòð. 101), Goovaerts (1997, ñòð. 105), Armstrong (1998, ñòð. 115), Chiles è Delfiner (1999, ñòð. 111), è Stein (1999, ñòð. 215). 272 ARCGIS GEOSTATISTICAL ANALYST Ñóììàðíàÿ ñòàòèñòèêà ïåðåêðåñòíîé ïðîâåðêè Ñóììàðíàÿ ñòàòèñòèêà è ãðàôèêè ìîãóò áûòü ïîëó÷åíû ïðè ñðàâíåíèè ïðîèíòåðïîëèðîâàííîãî çíà÷åíèÿ ñ ôàêòè÷åñêèì çíà÷åíèåì äàííûõ â õîäå âûïîëíåíèÿ ïåðåêðåñòíîé ïðîâåðêè. Ïóñòü Z€(si ) - ïðîèíòåðïîëèðîâàííîå çíà÷åíèå, ïîëó÷åííîå â ðåçóëüòàòå ïåðåêðåñòíîé ïðîâåðêè, z(si) - ôàêòè÷åñêîå çíà÷åíèå, ïîëó÷åííîå â ðåçóëüòàòå íàáëþäåíèé, è σ€(si )- ñòàíäàðòíàÿ îøèáêà èíòåðïîëÿöèè äëÿ òî÷êè s . Òîãäà íåêîòîðûå èç çíà÷å- i íèé ñóììàðíîé ñòàòèñòèêè, ïðåäñòàâëåííîé â ìîäóëå Geostatistical Analyst ðàâíû: 1. Ñðåäíèå îøèáêè èíòåðïîëÿöèè, ( ) n ∑ Z€(si ) − z(si ) i=1 . n 4. Ñðåäíèå íîðìèðîâàííûå îøèáêè èíòåðïîëÿöèè, ∑( ) n Z€(si ) − z(si ) /σ€(si ) i =1 . n 5. Ñðåäíåêâàäðàòè÷íûå íîðìèðîâàííûå îøèáêè èíòåðïîëÿöèè, ∑ [( ) ] n Z€(si ) − z(si ) / σ€(si ) 2 i =1 . n 2. Ñðåäíåêâàäðàòè÷íûå îøèáêè èíòåðïîëÿöèè, ( ) ∑n Z€(si) − z(si) 2 i =1 . n 3. Ñðåäíÿÿ ñòàíäàðòíàÿ îøèáêà êðèãèíãà, . n ∑σ€(si ) i =1 n ПРИЛОЖЕНИЕ A 273 s Приложение  ÝÒÎÌ ÏÐÈËÎÆÅÍÈÈ B В этом приложении дан обзор методов, которые можно использовать в модуле Geostatistical Analyst. В таблице на следующей странице даны ха рактеристики каждого метода, кратко сформулированы его достоинства и недостатки, и приведены типы создаваемых с его помощью поверхнос тей. Сравнив различия между этими методами, вы можете определить, какой из них вам лучше использовать для ваших приложений. 275 Сравнение методов, используемых в модуле Geostatistical Analyst Метод Детерминистский/ Стохастический Типы результи рующих поверхностей Время вычислений/ Метод Детерминист взвешенных ский расстояний Проинтерпо лированных значений Быстрый/ Быстрый Глобального Детерминист полинома ский Проинтерпо лированных значений Быстрый/ Быстрый Локальных Детерминист полиномов ский Радиальные Детерминист базисные ский функции Кригинг Стохасти ческий Кокригинг Стохасти ческий Проинтерпо лированных значений Умеренно быстрый/ средний Проинтерпо лированных значений Умеренно быстрый/ средний Проинтерпо Умеренно лированных быстрый/ значений; относительно стандартных медленный ошибок интерполяции; вероятности; квантилей Проинтерпо Средний/ лированных самый значений; медленный стандартных ошибок интерполяции; вероятности; квантилей Жесткий Преимущества интерполятор время моделирования1 Да Решения для меньшего числа параметров Нет Решения для меньшего числа параметров Недостатки Ограничения2 Нет оценки ошибок интерполяции; Нет приводит к образованию глаз буйвола” (“bulls eyes”) вокруг опорных точек Нет оценки ошибок интерполяции; поверхность может быть слишком сглаженной; краевые точки имеют большое влияние Нет Нет Да Да без ошибки измерений; Нет с ошибкой измерений Да без ошибки измерений; Нет с ошибкой измерений Решения для большого числа параметров Нет оценки ошибок интерполяции; может быть слишком автоматическим Гибкий, возможен автоматический выбор некоторых параметров Нет оценки ошибок интерполяции; может быть слишком автоматическим Очень гибкий; позволяет оценить пространственную автокорреляцию; можно вычислить стандартные ошибки интерполяции; много решений по параметрам Требует принятия многих решений по методам преобразований, трендам, моделям, параметрам и областям соседства Очень гибкий; может использовать информацию нескольких; наборов данных; по зволяет оценить взаим ную пространственную корреляцию; много решений по параметрам Требует принятия многих решений по методам преобразований, трендам, моделям, параметрам и областям соседства Нет Нет Данные должны относиться к стационарному стохастическому процессу; некоторые методы требуют, чтобы данные подчинялись закону нормального распределения Данные должны относиться к стационарному стохастическому процессу; некоторые методы требуют, чтобы данные подчинялись закону нормального распределения 1. Время вычислений время, которое компьютер затрачивает на построение поверхности. Время моделирования включает время, необходимое пользователю для принятия решений по выбору параметров модели и определению области поиска соседства. 2. Мы предполагаем, что все методы интерполируют сглаженную поверхность с использованием данных, содержащих шумы. 276 ARCGIS GEOSTATISTICAL ANALYST Описание IDW (Метод взвешенных расстояний): IDW быстрый де терминистский метод, который выполняет жесткую интерпо ляцию. Для этого метода необходимо определить небольшое ко личество параметров модели. Он может быть полезен для пред варительного взгляда на интерполируемую поверхность. Одна ко, при использовании этого метода невозможно оценить ошиб ки интерполяции. Кроме того, метод взвешенных расстояний может привести к образованию “глаз буйвола” (“bulls eyes”) вокруг опорных точек. Для данных нет никаких ограничений. Метод глобального полинома: Метод глобального полинома быстрый детерминистский метод, который выполняет сглажен ную (не жесткую) интерполяцию. Для этого метода необходимо определить небольшое количество параметров модели. Лучше всего он подходит для моделирования поверхностей, меняющих ся медленно и постепенно. Однако, при использовании этого ме тода невозможно оценить ошибки интерполяции. Поверхность может получиться слишком сглаженной. Опорные точки, рас положенные по краям области интереса, могут оказывать боль шое влияние на результирующую поверхность. Для данных нет никаких ограничений. Метод локальных полиномов: Метод локальных полиномов относительно быстрый детерминистский метод, который выпол няет сглаженную (не жесткую) интерполяцию. Он более гиб кий, чем метод глобального полинома, но требует принятия ре шений для большего количества параметров. При использова нии этого метода невозможно оценить ошибки интерполяции. Метод позволяет строить поверхности проинтерполированных значений, сопоставимые с поверхностями, получаемыми при использовании кригинга с учетом ошибок измерений. Методы локальных полиномов не позволяют вам изучить автокорреля цию данных, что делает их менее гибкими и более автоматичес кими, чем методы кригинга. Для данных нет никаких ограни чений. Радиальные базисные функции: Использование радиальных базисных функций это относительно быстрый детерминист ский метод, который выполняет жесткую интерполяцию. Ме тод радиальных базисных функций более гибкий, чем метод взве шенных расстояний, но требует принятия решений для боль шего числа параметров. При использовании этого метода невоз можно оценить ошибки интерполяции. Метод позволяет стро ить поверхности проинтерполированных значений, сопостави мые с поверхностями, получаемыми при использовании жест кой формы кригинга. Радиальные базисные функции не позво ляют вам изучить автокорреляцию данных, что делает их менее гибкими и более автоматическими, чем методы кригинга. Ради альные базисные функции не требуют введения ограничений на используемые данные. Кригинг: Кригинг это относительно быстрый метод интерпо ляции, который может быть жестким, если данные не содержат ошибки измерений, или сглаженным, если данные содержат ошибку измерений. Он очень гибкий и допускает изучение про странственной автокорреляции данных. Поскольку кригинг ис пользует статистические модели, он позволяет строить различ ные карты, включая карты проинтерполированных значений, карты стандартных ошибок интерполяции, карты вероятнос тей и карты квантилей. Гибкость кригинга может потребовать принятия большего, относительно других методов интерполя ции, количества решений, однако, вы можете воспользоваться и параметрами, предлагаемыми по умолчанию. Кригинг предпо лагает, что данные относятся к стационарному стохастическому процессу, и некоторые методы требуют, чтобы данные подчиня лись закону нормального распределения. Кокригинг: Кокригинг это относительно быстрый метод ин терполяции, который может быть жестким, если данные не со держат ошибки измерений, или сглаженным, если данные со держат ошибку измерений. Он может использовать информа цию из нескольких наборов данных. Кокригинг это очень гиб ПРИЛОЖЕНИЕ B 277 кий метод, который позволяет вам изучить пространственную автокорреляцию и взаимную корреляцию данных. Поскольку кокригинг использует статистические модели, он позволяет стро ить различные карты, включая карты проинтерполированных значений, карты стандартных ошибок интерполяции, карты вероятностей и карты квантилей. Гибкость кокригинга требует принятия наибольшего из всех других методов количества ре шений по параметрам, однако, вы можете воспользоваться па раметрами, предлагаемыми по умолчанию. Кокригинг предпо лагает, что данные относятся к стационарному стохастическому процессу, и некоторые методы требуют, чтобы данные подчиня лись закону нормального распределения. 278 ARCGIS GEOSTATISTICAL ANALYST