s
Доцент Морозов Михаил Владимирович: официальный сайт

Михаил Владимирович Морозов:
персональный сайт

А Г Д К Л М П Р С Т У Х Я

Мат.модели (занятие, карта-7): Выбор математической модели, крайгинг и вариограмма


Курс "Математические методы моделирования в геологии"

Карты-6. Построение сеточного файла и карты поверхности. Работа со слоями проекта.
Карты-7. Выбор математической модели, крайгинг и вариограмма.
Карты-8. Операции с сеточными файлами (сглаживание, расчеты, обрезка).

Оглавление:
   Цель работы.
   Теория-1
   Алгоритмы создания сеточных файлов.
   Практика-1
   Создание сеточного файл методом крайгинга.
   Теория-2
   Вариограмма: что это такое.
   Практика-2
   Выбор параметров вариограммы и указание их в диалоге Grid - Data.

Геохимическая карта строится на основе прогноза значений картируемой переменной на искомую территорию. Для количественного прогноза требуется использовать интерполяционную математическую модель. Если исходные данные распределены по неравномерной сети, наиболее адекватной моделью прогноза значений переменной, как правило, является крайгинг, в основе которого лежит понятие о вариограмме - пространственной функции, прогнозирующей изменение картируемой величины.

Цель работы: выбор оптимальной модели построения сеточного файла для дальнейшего создания карты в изолиниях.

ТЕОРИЯ-1

Алгоритмы создания сеточных файлов.

Наиболее сложным и ответственным моментом при построении карты поверхности является выбор математического метода создания сеточного файла, а также выбор параметров математической модели для интерполяции данных. Теоретическая основа данной проблемы велика и непроста, ниже мы ограничимся рядом технических рекомендаций, актуальных при построении геохимических карт при построении их методом крайгинга. Помимо крайгинга, Surfer позволяет использовать большое число иных алгоритмов.

ПРАКТИКА-1

Создание сеточного файл методом крайгинга.

Как мы уже знаем, для построения карты в изолиния необходимо предварительное создание сеточного файла, что осуществляется с помощью команды Grid - Data.

После выбора команды и определение файла-источника данных открывается диалоговое окно, в котором обязательно нужно указать, какие столбцы электронной таблицы содержат данные для координат X, Y и параметр Z, т.е. величину для картирования (содержание элемента, его логарифм, значение фактора и т.п.). Этот выбор производится в блоке Data Columns. Затем нужно указать имя для итогового сеточного файла (Output Grid File). Прочие параметры Surfer предлагает по умолчанию, однако, для корректного построения карты именно они являются решающими, поэтому рассмотрим их подробнее.

Опциональный параметр: что делать с дубликатами данных, т.е. со значениями, имеющими одинаковые координаты X и Y. Данный параметр вызывается нажатием кнопки Filter Data (фильтрация данных). При нажатии открывается дополнительное окно, в котором можно выбрать способ учета (или отбрасывания) дубликатов данных. Сперва определимся: откуда берутся дубликаты? Один возможный вариант - контрольное измерение в лаборатории, но обычно такие данные в общую таблицу опробования не включаются. Если они все же используются, то разумнее всего их усреднять, т.е. выбирать значение фильтра Average (среднее). Вообще, усреднение - самый надежный способ учета дубликатов, он позволяет не беспокоиться о том, что какие-то данные не будут учтены при построении карты.

С другой стороны, если содержание искомого элемента сильно зависит от наличия неоднородностей в пробе (эффект самородка), то оно будет подвержено сильным колебаниям, при которых максимальные значения ("самородки") будут контрастировать с основной массой низких значений. Если растворение редких максимальных значений среди массы ординарных критично, то можно выбрать усреднение по условию Maximum Z, т.е. максимальное.

ВНИМАНИЕ: после выбора столбцов с данными и условий фильтра переходим к следующим полям диалогового окна. При возврате к описанным выше полям все описанные ниже установки обнуляются, поэтому, чтобы не тратить время на повторный выбор параметров, убедитесь, что вы правильно установили переменные X, Y, Z и условие фильтрации данных.

Теперь переходим к математическому алгоритму построения сеточного файла для карты. Не вдаваясь в теорию, отметим, что оптимальный выбор алгоритма сильно зависит от твида исходных данных, характера сети опробования (регулярная сеть или, как это часто бывает в геохимии, нерегулярная, и т.п.). Выбор алгоритма происходит посредством списка Gridding method, а его настройка - в очень важном меню, которое вызывается кнопкой Advanced options. Приведем пример выбора наиболее типичного для геохимии метода крайгинга (Kriging), а о параметрах крайгинга поговорим подробнее.

При выборе процедуры крайгинга и нажатии кнопки Advanced Options откроется окно Kriging Advanced Options, наиболее важные вкладки которого General и Search.

На этих вкладках необходимо выбрать параметры вариограммы и способ их приложения к исходным данным для создания корректного сеточного файла. О вариограмме и ее параметрах поговорим отдельно (ниже, второй раздел данной главы), а пока допустим, что мы все сделали правильно, и рассмотрим завершающие шаги по созданию сеточного файла.

После нажатия кнопки OK, мы возвращаемся в основное окно, где должны выбрать имя для создаваемого сеточного файла (Output Grid File), а также параметры его сетки (Grid Line Geometry). По умолчанию, Surfer в качестве крайних значений берет минимальные и максимальные координаты по осям X и Y реальных точек опробования из таблицы данных и самостоятельно определяет шаги сетки по осям и, соответственно, число линий сетки, равное разнице между максимальной и минимальной координатами по соответствующей оси, деленной на шаг сетки. Шаг (D) подбирается таким образом, чтобы число линий (N) было, разумеется, целым:

NlinesX = ( ( Xmax - Xmin ) / DX ) + 1,

NlinesY = ( ( Ymax - Ymin ) / DY ) + 1.

Значения по умолчанию неудобны по следующим причинам.

1. Края сетки вплотную прижаты к крайним точкам опробования, а экстраполяция данных позволяет несколько расширить область построения карты, чтобы все точки опробования были внутри площади картирования, а не на границе ее. Что делать: вручную выбираем крайние значения по координатам - для минимальных немного меньше имеющегося минимального, для максимальных - немного больше имеющегося максимального (т.е. тех значений, которые подставлены в поля по умолчанию). Желательно выбирать круглые значения, чтобы шаг сетки был меньше в кратное число раз.

2. Шаг сетки обычно имеет смысл подбирать одинаковый по обеим осям, чтобы избежать деформации построенных контуров, придавая ему достаточно "круглое" значение, близкое к шагу опробования (20, 25, 40, 50, 100 метров и т.п.). Шаг опробования легко оценить, выведя на экран карту фактов и посмотрев расстояние между точками с учетом масштаба (рамки) карты.

Если все сделано аккуратно и правильно, то число линий будет целым. Теперь мы готовы к построению сеточного файла - нажимаем OK, ждем окончания расчета и смотрим его результаты.

ТЕОРИЯ-2

Вариограмма: что это такое.

Суть проблемы в том, что карта в изолиниях должна опираться на равномерную сеть данных (по координатам X и Y), см. рисунок слева. Однако реальность жестока, и исходные данные на практике часто расположены по неравномерной и даже не вполне по сети - см. рисунок справа. Чтобы перейти от абы как расположенных точек с реальными значениями (результатами опробования) к равномерным точкам, для последних необходимо рассчитать ожидаемые значения. Ожидаемые ("предполагаемые") значения должны согласовываться с окружающими точками опробования, т.е. основываться на интер- и экстраполяции данных.

  

Каким образом может осуществляться интерполяция? Представим, что наша карта отражает формы рельефа. Тогда "реальные" (исходные) точки - это места геодезических измерений высот,  а интерполируемые точки лежат между ними, следовательно, должны принимать промежуточные значения. В качестве первого приближения можно принять, что между двумя высотами A и B (A выше, т.е. A>B) высота промежуточной точки тем ближе к значению A, чем меньше расстояние до A. Это верно качественно, но если мы примем такую модель как количественную (т.е. будем брать как меру просто расстояние до точки A), то получим форму профиля склона A-B в виде прямой линии. Реальный рельеф, разумеется, так не выглядит, т.е. для корректной интерполяции мы должны учесть закругление форм рельефа (выполаживание вершин и низин). Следовательно, формула интерполяции должна быть сложнее.

В качестве альтернативной основы можно взять следующую идею: если мы наблюдаем выступающее относительно среднего уровня значение (яма или гора, а с точки зрения геохимической карты - положительная или отрицательная аномалия содержаний), то, очевидно, соседние с максимумом аномалии точки ведут себя аналогично ему, но "не так аномально", т.е. они тоже будут несколько выше (или ниже) среднего уровня, но в меньшей степени. Это справедливо для любой точки: соседи имеют близкие значения. Таким образом, между точкой и ее соседями ожидается некая более-менее стандартная вероятностная, т.е. статистическая связь. Поскольку эта статистика привязана к географическим координатам, то в практику вошел термин геостатистика. В нашем случае мы можем говорить о корреляции или о ковариации (C) значений соседних точек.

По мере удаления от исходной точки новые значения параметра становятся все меньше связаны с ней, т.е. статистическая взаимосвязь между точками теряется с ростом расстояния между ними. Таким образом, мы имеем некую эмпирическую функциональную зависимость, изменение которой, в общем виде, должно стремиться к затуханию ковариации по мере увеличения координаты h (где 0 - координата исходной точки, т.е. начала отсчета).

Вариограмма γ(h) - это математическое выражение описанной зависимости, только противоположное ковариации (и со сдвигом на величину, называемую "эффектом самородка"). Surfer в состоянии построить эмпирическую вариограмму на основе реальных значений, распределенных по картируемой площади. Затем, как и любую другую эмпирическую зависимость, мы можем аппроксимировать полученную вариограмму каким-либо близким к ней математическим уравнением, а затем указать параметры этого уравнения программе с целью построения искомого сеточного файла.

    

   

ПРАКТИКА-2

Выбор параметров вариограммы и указание их в диалоге Grid - Data.

Для определения эмпирической вариограммы следует вызвать команду Grid - Variogram - New Variogram.

В открывшемся окне необходимо, как и при построении сеточного файла, определить столбцы электронной таблицы, в которых размещаются координаты точки по осям (X и Y) и значения картируемого параметра (Z).

После нажатия кнопки OK происходит построение эмпирической вариограммы (черная линия), которая по умолчанию аппроксимирована линейным уравнением (рисунок слева). Помним, что наша задача - аппроксимировать вариограмму наиболее адекватным к ней уравнением, а линейное выглядит в данном случае сомнительным вариантом. Свойства построенной вариограммы и аппроксимирующей ее функции выводятся в области свойств объекта после выделения изображения вариограммы мышью. Для замены линейного уравнения на более адекватное необходимо перейти на вкладку Model (модель), на которой нужно указать вид функции и ее коэффициенты. Данный вопрос требует более глубокого теоретического рассмотрения, поэтому в подробности удаляться не будем. В нашем примере мы выбрали степенную функцию (рисунок справа).

 

После получения параметров искомой аппроксимирующей функции можно использовать их в окне диалога Grid - Data, если мы не хотим, чтобы при создании сеточного файла применялось уже печально знакомое нам по вариограмме линейное уравнение. Для этого на вкладке General окна Kriging Advanced Options (см. выше первый раздел данной главы) необходимо нажать кнопку Edit (Редактирование) и в еще одном открывшемся окне указать параметры аппроксимирующей функции, которые мы подобрали, работая с вариограммой. В нашем примере мы переходим от линейной функции (Linear) к степенной (Power), а затем указываем (что очень важно!) анизотропию ее применения (на третьем рисунке).

     

Что такое анизотропия в нашем случае? Анизотропия показывает, как мы отбираем точки на местности для применения уравнения вариограммы. Вспомним, что при геологической съемке по сети часто (но не всегда!) работы ведутся по сети параллельных профилей. При этом часто (но не всегда!) расстояние между соседними профилями превышает расстояние между точками наблюдения на профиле. Например, профили могут проходить через каждые 100 метров, а точки опробования чередоваться по профилю через каждые 20 метров. Такая сеть называется сетью 100 на 20. Причины такой пространственной неодинаковости (она и называется анизотропией, т.е., в переводе, "неравносвойственностью" по разным направлениям) заключаются в том, что геологические объекты (границы между горными породами, жилы, рудные тела) часто ориентированы в каком-то направлении, как говорят, "вытянуты", и если это направление на изучаемой территории известно, то для очерчивания геологических объектов необходимо тщательнее картировать при перемещении поперек ориентировки объектов, нежели вдоль них. Как бы то ни было, если сеть опробования имеет различный шаг вдоль и поперек профилей, то и приложение вариограммы должно быть пространственно аналогичным (например, в пропорции 2 к 1). Для указания пропорции служит параметр Ratio (отношение) в группе Anisotropy (анизотропия). Здесь же укажем угол анизотропии (параметр Angle) в градусах. В итоге получим эллипс, который должен быть вытянут в направлении большей разряженности сети опробования.

Но общую модель указать недостаточно: программа должна найти реальные точки в соответствии с их координатами. Нельзя построить сеточный файл, если в область рассмотрения попадет только одна точка или вообще ни одной. Поэтому необходимо перейти на вкладку Search окна Kriging Advanced Options (см. выше в первой части данной главы), на которой указать параметры поиска точек. Самые важные среди них также касаются анизотропии, которая должна быть согласована с выбранной ранее моделью. Данные параметры устанавливаются в группе Search Ellipse (эллипс поиска). Угол (Angle) эллипса должен соответствовать выбранной выше модели, а пропорции его радиусов (Radius1 и Radius2) должны соответствовать отношению анизотропии (2 к 1 в нашем примере). Кроме того, длины радиусов должны позволять программе найти достаточное число точек для осуществления интерполяции. Радиусы указываются в метрах и подбираются с учетом реальных типовых расстояний между точками так, чтобы, с одной стороны, на карте не осталось "белых пятен" (мест, куда "не дотягивается" эллипс), а с другой стороны - чтобы в эллипс поиска не попало слишком много точек, что приведет к излишнему сглаживанию поверхности, т.е. усреднению пространственных данных.

Вот, в двух словах, общая логика работы процедуры крайгинга в программе Surfer. Конечно, часть важных моментов осталась за кадром, но основное мы вкратце очертили. Прочие детали удобнее разбирать непосредственно на практике.





Опубликовать в своем блоге livejournal.com
Энциклопедия
Найти