Лось В.Л., проф. (РГП “НЦ КПМС РК”) ИЗУЧЕНИЕ НЕДР КАК ИНФОРМАЦИОННЫЙ ПРОЦЕСС 1. Любые природные, технологические, биологические, экономические и даже общественные процессы можно описывать и моделировать с позиций трансформации материи (энергии) и /или информации. Для описания и моделирования необходимы базовые понятия и представления о взаимодействиях. Соответствующая система понятий и взаимодействий сформировалась для описания и моделирования природных и технологических процессов с материально-энергетических позиций (о единственности, достаточности и эффективности этой системы что-либо утверждать сложно).
Второй, и не менее важный, аспект – описание и моделирование природных, технологических и других процессов с информационных позиций. Однако в этой сфере пока еще отсутствует развитая система четких базовых понятий и взаимодействий, которые можно использовать для формализованного описания и моделирования информационной стороны процессов.
Есть достаточно строгое описание общего количества информации по Шеннону, которое трактуется как мера неопределенности состояния некоторой системы любой природы и связывается с вероятностями каждого состояния:где рi - вероятность i-того состояния (i от 1 до n). ,
Как видим, здесь количество информации о каком-либо состоянии системы равно ln pi - и оно пропорционально “неожиданности” этого состояния (события), что, в целом, согласуется с нашим “здравым смыслом”.
В теории информации вводится представление о “новой информации” (Jn), которой считается информация о новых неизвестных нам событиях и/или изменении вероятностей рi в оценке общего количества информации. Таким образом Jn расширяет тезаурус наших знаний об объектах и процессах. Однако же здесь возникают принципиальные трудности с количественной оценкой Jn, т.к. эта величина индивидуальна для каждого воспринимающего информацию субъекта.
Еще более сложной является проблема “смысла” и “ценности” информации (этот вопрос сейчас обсуждается в ряде работ) [5]. Но пока понятия и взаимодействия информационной сферы не увязаны в систему, развитую до уровня, достигнутого в понимании материально-энергетической стороны процессов. Возможно, это связано с тем, что в области информации нам не обойтись без понятия “разум”, который явится третьей осью фазового пространства: материя, информация, разум.
Несмотря на трудности с формальным описанием информационных характеристик уже сейчас информационное моделирование достаточно эффективно, особенно в тех случаях, когда эта компонента в изучаемом процессе является доминирующей.2. Операции изучения и оценки ресурсного потенциала недр в значительной мере являются процессами получения, хранения и обработки (трансформации) информации. В общем случае получение и переработка информации сводится к нескольким основным процедурам:
измерение или оценка “первичных” характеристик геологической среды (вещественных, геофизических, геометрических, структурных и т. д.); конструирование “вторичных” характеристик геологической среды и геологических систем (расширение числа характеристик); интерполяция и экстраполяция “первичных” и “вторичных” характеристик в пространстве (в определённом смысле, увеличение числа объектов, которым поставлены в соответствие характеристики); целевое сжатие числа характеристик; целевое сжатие числа объектов геологической среды. В целом все эти операции направлены на создание функционально достаточного описания и максимально возможного сжатия объема количества информации (в Шенноновском понимании).
Процедуры получения и преобразования информации предполагают существование некоторых априорных знаний и критериев (желательно, формализованных), позволяющих “разумно” подойти к выбору первичных характеристик (самая дорогостоящая и слабо формализованная операция), направленно и осторожно вести расширение информации (операции 2 и 3), иметь четкие правила отбора информации по ее целевой ценности (при сжатии). По-сути, в процессе получения и преобразования информации реализуется научно-исследовательский путь, который представляет собой узкую тропинку между “болотом переусложнения” (избыток общей информации) и “ловушкой схематизации” (как часто бывает, все разнообразие реальных объектов и процессов сводится к одной-двум линейным характеристикам).
Главное для знаний, правил и критериев, реализующих получение и преобразование информации – непрерывное развитие и совершенствование. Надо решительно отбрасывать выработавший свой ресурс парадигмы и вводить новые гипотезы для выбора “первичной” информации и конструирование “вторичных” признаков. При операциях расширения и сжатия информации необходимо переходить от линейных монокритериальных к нелинейным многокритериальным оценкам (очевидно, что последние более адекватные свойствам и особенностям геологической среды и геологических систем).3. Прогнозирование полезных ископаемых (косвенные поиски) основывается на взаимосвязи свойств геологической среды и представляет собой прямую геопризнаковую задачу, заключающуюся в переходе из одного признакового пространства в другое:
где x, y, z - координаты - пространство прогнозирующих (косвенных) характеристик ![]()
{t}n - пространство прогнозирующих (косвенных) характеристик;
{T}m - пространство целевых характеристик прогнозирования ();
f - оператор перехода (сжатия информации).При этой операции резко (на порядки) уменьшается общее количество информации, но также резко возрастает ее целевая ценность (по отношению к задаче прогноза).
Формально задачу прогноза полезных ископаемых с количественной оценкой прогнозных ресурсов удобно представить как задачу построения и вычисления функции:где p(T)- статистическое распределение целевой характеристики в точке с текущими координатами xyz(T=T(xyz));
- параметры.
Как видим, первой операцией прогнозирования является выбор прогнозирующих характеристик (все реальные среды и системы обладают практически бесконечным набором характеристик и поэтому без этой операции обойтись невозможно). Отбор производится на основе примерно следующих основных требований:
Характеристики должны иметь содержательный смысл, т.е. их привлечение для прогнозирования можно объяснить на основе представлений о закономерностях размещения прогнозируемых объектов, т.е. знаний. Это главное требование. Характеристики должны быть объективно определяемыми (воспроизводимыми). Определение характеристик должно увязываться с практически выполняемой операцией (экономическое ограничение). Если имеются какие-либо соображения, что некоторые составные (“вторичные”) характеристики будут содержать дополнительную целевую информацию о расположении объектов прогнозирования, то их желательно построить (например, формации, геохимические мультиореолы, геодинамические параметры и т.д.). При этом, однако, необходимо строго контролировать с помощью корреляционного анализа, чтобы “вторичные” характеристики не дублировали одну и туже информацию (т.е. не коррелировались с “первичными” и другими “вторичными” характеристиками), а также несли как можно больше целевой информации об объектах прогноза.
Кстати, неконтролируемое расширение “вторичной” информации крайне опасно и может существенно ухудшить результаты прогнозирования. Во многих случаях при прогнозировании является полезным “расширение” информации в пространстве с использованием интер- и экстраполяционных процедур, которое, как и конструирование “вторичных” характеристик, должно контролироваться целенаправленным корреляционным анализом.
Таблица 1. Оценка изменения знаний и информации
с использованием технологий разных поколений
Поколения прогнозных технологий и моделей-эталонов Базовые знания Общая информация Результат прогноза Новая информация 1. Экспертные оценки на основе моделей-сценариев А=1 1 Перспективные участки 1 2. Таксономия, распознавание образов; признаковые модели А=1-1.5 2-3 Прогнозные ресурсы P3, P2 2-3 3. Линейные и нелинейные функции многих аргументов; модели стохастических связей А=2-3 3-5 Прогнозные ресурсы P3, P2, P1 5-10 4. Нелинейные функции многих переменных, нейросети; модели на основе пространственно-стохастических связей А=3-5 3-5 Прогнозные ресурсы P2, P1, C2 10-15 5. Модели пространственно-временных закономерностей А=5-10 2-3 Прогнозные ресурсы и запасы P1, С2 ? Таким образом, на первом этапе направленное сжатие общей информации с повышением ее целевой ценности (относительно решения задачи прогноза) осуществляется с помощью методов корреляционного анализа, т.к. в систему {t}n отбираются только те tj, для которых
где
- показатель силы связи (
= от 0 до 1).
Второй этап целевого сжатия информации осуществляется при построении функции f, связывающий целевую и информативные прогнозирующие характеристики (см. формальную постановку задач количественного прогнозирования). Важно, чтобы функция обеспечивала решение задачи прогнозирования в нелинейном многомерном пространстве. Опыт и специальные имитационные эксперименты показывают, что оптимальная мерность пространства прогнозирующих характеристик 8-12.
Если рассмотреть общую тенденцию развития технологий прогнозирования и соответствующих моделей-эталонов, то можно видеть, что в технологиях и моделях более высоких поколений используется значительно больше знаний, тогда как количество общей информации не увеличивается (Табл.1) [1]. Количество новой информации при этом определяется точностью даваемых оценок прогнозных ресурсов. Так новая информативность оценок С2 на порядок больше новой информативности оценок Р3.
Заметим, что в настоящее время в основном используются модели и технологии первого и второго поколений. Технологии третьего поколения разработаны и даже использовались в конце 80-х годов (технология “Регион”, “Многомодельный метод прогнозирования”, “Целевой прогноз” и т.д. [1, 3, 4]). Сейчас созданы предпосылки и можно приступать к построению моделей-эталонов четвертого поколения и разработке соответствующей технологии прогнозирования. Разработка, освоение и широкое применение информационных технологий прогнозирования 3-4 поколений было бы прорывом в эффективности и качестве прогноза полезных ископаемых.4. Разведка месторождений полезных ископаемых заключается в построении моделей распределения полезных компонентов в пространстве, выделении рудных тел (блоков) и определении по ним необходимых для геолого-экономической оценки параметров (запасов полезных компонентов, средних содержаний и т.д.).
Модель месторождения представляет собой модели распределения в пространстве (поля) основных и сопутствующих рудных компонентов, технологических свойств руд и т.д.
Формально модель имеет вид:где - модельные значения е-той характеристики (концентрация основных и сопутствующих компонентов, коэффициент извлечения и т.д.). Обычно
определяется в узлах регулярной сети x,y,z;
x,y,z – пространственные координаты (изотропные или преобразованные с учетом анизотропии геологической среды, где V – область моделирования;
Cei – массив “обучения” (или исходных данных), состоящий из замеров характеристики Се в i пробах:Cei=Се(xi, yi, zi),;
- вектор параметров, регулирующий вид модели (степень генерализации, радиус влияния отдельных Ci, детальность и т.д.);
- массив моделей “косвенных” характеристик:
![]()
(j,e) - связь (взаимодействие) между е-той моделируемой и j-той косвенной характеристиками.
Существенной особенностью построения моделей месторождений является то, что моделирование ведется в режиме поступления новой информации (проходятся разведочные выработки, поступают данные анализа проб, изменяются представления о геолого-структурных закономерностях локализации руд). Соответственно модель динамически развивается по мере поступления информации о моделируемом объекте и расширении знаний о нем. И здесь возникает принципиальная возможность отслеживать изменение модели, что, в свою очередь, позволит судить об устойчивости модели (или ее частей), надежности получаемых на основе модели оценок в тех или иных частях моделируемого объекта. Ориентировка при моделировании месторождения не на осредненную аналогию, регламентирующую параметры разведочной сети для различных типов рудных объектов, а на динамику приращения новой информации об объекте открывает интересные перспективы.
Операцию построения моделей месторождений можно представить как информационный процесс. При этом информация может поступать в режиме реального времени от изучаемого объекта (при его разведке и/или эксплуатации) или ее динамическое поступление имитируется искусственно (например, при пересчете запасов). В первом случае моделирование “естественно” вписывается в процесс разведки и/или эксплуатации, позволяя оптимизировать затраты на проходку скважин, горных выработок, отбор проб за счет их рационального размещения в пространстве.
Суть информационно-динамического подхода заключается в том, что модель объекта (месторождения) уточняется, корректируется, структурно развивается по мере поступления новой информации об объекте. Это позволяет почти непрерывно отслеживать изменения модели и гибко корректировать расположение новых точек опробования, опираясь на динамику прироста новой информации о моделируемом объекте (как известно, каждое месторождение в значительной мере уникально по геометрии и внутренней структуре распределения поля концентраций полезных ископаемых и поэтому аналогия не всегда надежный принцип).
Общее количество поступающей от объекта моделирования информации можно оценить на основе Шенноновского подхода, хотя и здесь есть значительные технические трудности. Несколько сложнее определить и измерить количество новой информации. В принципе эта мера должна отражать изменение модели объекта при получении от него порции общей информации. Например, если при получении информации от объекта его модель не изменяется, то, очевидно, количество новой информации равно нулю. В зависимости от типа и целевого предназначения модели количество новой информации в одной и той же порции общей информации может быть различным, т.е. количество новой информации есть величина относительная и зависит от ее целевого предназначения.
В общем виде изменение модели при получении порции информации может быть охарактеризовано рассогласованием между состояниями модели до и после получения этой порции информации. Само рассогласование можно описать множеством критериев, отражающих те или иные аспекты рассогласования.
Схема процедуры моделирования на основе информационно-динамического подхода имеет следующий вид [2]:
….М0 + J1,А1
М1, d1 (М0,М1) + J2,А2
…..
Jk,Ak
Mk, dk(Mk-1,Mk)+…., где
М0 – “стартовая” модель объекта (месторождения);
М1,….,Мk – модели построенные после получения 1,….,k-той порций информации;
J1,….,Jk – общее количество информации в 1,….,k порциях;
A1,….,Ak – состояние наших знаний об объекте при получении 1,….,k порций информации (влияющих на параметры модели);
d(Mk-1,Mk) – рассогласование моделей, построенных до и после получения k-той порции информации.
В целом в процессе построения модели должны выдерживаться следующие соотношения: J1J2
….
Jk; d1> d2> ….> dk; A1< A2< ….< Ak. Условие здесь можно понимать как тенденцию, т.е. когда dk ставится устойчиво меньше d0, то процесс изучения можно считать законченным.
Реально отслеживание прироста новой информации в процессе моделирования рудного объекта более сложно и во многом индивидуально для каждого объекта. Эта индивидуальность связана со стадией изучения, системой разведки, морфологическими, статистическими и геостатистическими особенностям руд, принятой схемой моделирования, формой и размеромэлементарного объема моделирования (блока) и т.д.
Рис.1. Ориентировочное изменение величины
рассогласования d в зависимости от плотности
данных (w); размера элементарного блока (J ) и среднего содержания компонента в блоке (Cj};
знаний об объекте (А) в зависимости от плотности данных (w).
Если в качестве основного метода моделирования месторождения (рудного тела, массива) принять “весовую” аппроксимацию [2], то в качестве аналога общей информации в точке (элементарном блоке) можно принять величинугде х - сокращенное обозначение тройки координат x,y,z; ,
J(x)= где(W),
- монотонная функция.
Общее количество информации по всему объекту будет равно:
где n=V/v (V – объем или площадь области моделирования; v – объем или площадь элементарного блока моделирования). ,
Среднее количество общей информации по V:Тогда прирост общей информации в точке (блоке) х будет: .
.
В качестве критерия рассогласования, пропорционального приросту новой информации, можно взять следующий функционал:где ,
-. средние значения концентраций компонента на j и j-1 стадиях изучения в элементарном блоке с координатами х.
Как видим, величина d является функцией пространственных координат. Она является также функцией общего количества накопленной информации d=d(W), концентраций компонентов d=dc) и размеров элементарного блока d=d(V). Общие тенденции изменения d в зависимости от ряда параметров показаны на рис. 1.
5. Информационный подход к геологоразведочным процессам, анализ операций получения, расширения и сжатия информации, подразделение самой информации на общую (Шенноновскую) и “новую”, а также введение понятий ценности информации (для решения конкретной задачи) и ее смысла (возможности ее составления с другой информацией и распространения на другие объекты и процессы) позволят с новых позиций подойти к конструированию схем геологоразведочных технологий, оптимизации их параметров и оценке качества получаемых результатов.
Можно ожидать, что новые информационные технологии приведут к существенному повышению эффективности геологоразведки и будут способствовать устойчивому обеспечению ресурсами всего горно-металлургического комплекса Казахстана.Литература 1.Лось В.Л. Модели-эталоны месторождений для прогнозно-поисковых работ. – В сб. Модели, методы и технология прогнозирования полезных ископаемых. Алма-Ата, КазИМС, 1991, с. 4-18.
2.Лось В.Л. Моделирование рудных месторождений. - В сб. Математические методы решения задач моделирования и прогнозирования в геологии. Алматы, КазИМС, 1994, с. 4-18.
3.Марченко В.В. Человеко-машинные методы геологического прогнозирования. М., Недра, 1988, 232 с.
4.Островский Э.Я., Горелик Е.С. и др. Анализ изображений в поисковой геофизике. М., Ин-т Физики Земли, 1986, 184 с.
5.Пригожин И., Стенгерс И. Время, хаос, квант. М., 2001, 239 с.Горный журнал Казахстана, 2003, 3, с.23-26.