Вверх
список докладов

История
или как это начиналось

Факты
или что про это знают

Идеи
или что про это думают

Люди
или кто  над этим  работает

Библиография
или что об этом пишут

Конференции
или где это обсуждают

Рабочее Совещание
"Сверхслабые воздействия на физико-химические и биологические системы. Связь с солнечной и геомагнитной активностью"

6-8 мая 2002 года, Крымская Астрофизическая обсерватория НАН Украины.


Т.А. Зенченко, А.А. Конрадов, В.В. Стрелков.

Неслучайность рядов, получаемых при измерении скорости радиоактивного распада..
(Стенограмма доклада)

         Уважаемые коллеги, результаты, о которых я хочу вам рассказать, являются ответвлением или продолжением работ, которые проводит Симон Эльевич Шноль в течение многих лет. Здесь был использован разработанный им гистограммный метод исследования временных рядов, но постановка задачи несколько иная.

Многие здесь, наверное, слышали его недавний доклад и знакомы с результатами, но я повторю коротко некоторые положения. В настоящее время объектом исследования группы С.Э.Шноля являются временные ряды измерений интенсивности радиоактивного распада. Радиоактивность была выбрана как процесс, считающийся абсолютно случайным (даже эталоном случайного ряда) и независимым от тривиальных земных факторов.

1. Процедура построения гистограмм


Рис.1. Ряд результатов измерений альфа-активности
плутония 239, разбитый на последовательные
непересекающиеся отрезки по 60 значений
Вот здесь, на первом рисунке, изображен последовательный ряд секундных измерений интенсивности альфа-распада плутония 239. Теперь возьмем этот ряд и разрежем на последовательные небольшие отрезки, например, здесь выбран отрезок в 60 односекундных значений - на рисунке они разделены синим пунктиром. Для каждого такого отрезка в отдельности построим выборочное распределение – сколько раз встретилось каждое значение активности в этом отрезке. Это будет всем знакомая гистограмма встречаемости, соответствующая интервалу времени в 60 секунд – назовем этот интервал «длительностью гистограммы». Гистограммы, соответствующие первым четырем отрезкам показанного раньше ряда, приведены на рисунке 2 черным цветом. Видно, что когда они не сглажены, выявить низкочастотную составляющую, максимумы и минимумы плотности, глазу довольно сложно.


Рис.2. Черная линия - выборочное распределения встречаемости значений для первых четырех отрезков (гистограммы). Масштаб по оси абсцисс задается минимальным и максимальным значением измеряемой величины для этого отрезка данных, так что бин всегда равен единице. По оси ординат высота максимального пика приведена к единице. Синяя линия - те же распределения, сглаженные 9 раз скользящим средним.

 

Для удобства визуального сравнения формы их сглаживают несколько раз скользящим средним. В результате получаются хорошо различимые глазом формы с несколькими пиками и впадинами (рис 2, синие гистограммы).

Теперь построим гистограммы по каждому из двадцати отрезков ряда данных, приведенных на первом рисунке. Можно сказать, что мы получили новый временной ряд, только уже не значений активности, а гистограмм (рис 3). Длительность одной гистограммы здесь равна 1 минуте – 60 односекундных значений.


Рис. 3 Фрагмент временного ряда гистограмм


Рис.4. Фрагмент журнала


Рис.5. Модельное распределение интервалов
времени между сходными гистограммами, построенное
по результатам рис 4.

После сглаживания становится видно, что, например, формы первой и второй гистограмм очень похожи. Тот же вывод можно сделать относительно гистограмм номер 11 и 12, 14 и 15, 3 и 6, если совместить их зеркально, 17 и 18, и так далее. Сравним попарно форму всех гистограмм в этом приведенном отрезке, отбирая близкие по форме – именно в том смысле, в каком близки приведенные здесь примеры: количество и выраженность пиков и впадин, их локализация по оси абсцисс, и т.д. Получится некоторый набор пар (журнал), каждая из которых характеризуется числом – временным интервалом DT, разделяющим эти две гистограммы. На рисунке 4 приведены сходные по форме гистограммы из рис 3, расстояние между которыми не более 11 минут, или гистограмм (все просто не помещались).

Из отобранных сходных по форме пар шесть оказались соседними (первые шесть на рисунке). Две пары разделены интервалом в две гистограммы, и так далее. Рисунок 5 – это уже «гистограмма второго уровня» – распределение встречаемости сходных пар по интервалу времени DT между ними. На столбиках указано, какие именно пары гистограмм его образуют.

Здесь приведен модельный пример. Как все происходит в реальном эксперименте? Во-первых, длина временного ряда на несколько порядков больше, чем здесь, и составляет от двухсот тысяч точек до миллиона. Соответственно, и длина ряда гистограмм может быть от двухсот до нескольких тысяч. Существует компьютерная программа, написанная нашим коллегой. Эксперт подгружает в нее временной ряд результатов измерений, программа преобразует его во временной ряд гистограмм, перемешивает гистограммы случайным образом, так, что реальные соседи оказываются на самых разных расстояниях друг от друга и выдает на экран один или два ряда гистограмм для сравнения экспертом. Эксперт имеет возможность увеличить на экране любую пару гистограмм, сдвинуть, растянуть и таким образом совместить их максимально возможным образом, после чего принимает решение – сходны эти гистограммы по форме или нет. Если «да» – программа заносит эту пару гистограмм в журнал.

Когда эксперт заканчивает сравнение, эта программа строит распределение встречаемости сходных пар, аналогичное приведенному на рис 5, но по большой статистике. Обычно в журнале оказывается больше тысячи отобранных пар. Результат приведен на рисунке 6.

2. «Эффект ближней зоны»


Рис.6. Суммарные распределения встречаемости
сходных пар гистограмм по интервалу
времени между ними для 10 отрезков физического ряда
(темные столбики) и тех же отрезков ряда данных,
перемешанных посредством генератора случайных чисел.

Здесь показан один из основных эффектов, которому будет посвящен дальнейший доклад – он получил название «эффект ближней зоны».
Это та же самая альфа-активность плутония 239, измерения раз в секунду, гистограмма по 60 точкам, т.е. длительность одной гистограммы (или интервал времени между соседями) равны одной минуте. Были взяты 10 последовательных отрезков временного ряда измерений, каждый длиной в один час, построены ряды по шестьдесят одноминутных гистограмм, перемешаны и проанализированы экспертом.

Черные столбики – это суммарное распределение всех десяти отрезков (красная линия означает 99 процентный доверительный интервал). Видно, что гистограммы, разделенные большими интервалами времени, сходны примерно с одинаковой частотой, около 16% от общего числа возможных сочетаний. Понижение высоты столбиков вправо есть простое следствие комбинаторики – когда сравниваются все со всеми, возможных в принципе сочетаний тем меньше, чем больше интервал между гистограммами. Если принять этот средний уровень за случайный, то соседние гистограммы (разделенные единичным интервалом), как видно из рисунка, сходны намного чаще этого случайного уровня. Оценка вероятности случайной реализации столбика такой высоты (или выше) по гипергеометрическому закону дает величину p, меньшую, чем десять в минус десятой степени. Можно ввести даже численную характеристику «выраженности» интервала времени между гистограммами – т.е. степень его «неслучайности» – l=-lg(p).

Затем значения в каждом из десяти отрезков временного ряда данных были перемешаны с помощью генератора случайных чисел, и эксперт повторил просмотр на таком материале при всех прочих равных условиях (голубые столбики). Видно, что в этом случае все распределение вполне случайно.

3. Периодичность проявления «эффекта ближней зоны».

Было обнаружено, что на разных отрезках одного и того же ряда данных он может иметь очень разную выраженность – иногда эффект весьма яркий, а иногда не видно вообще никакого превышения частоты сходства соседей над средним фоном – все в пределах ошибки... Возникла мысль посмотреть, как меняется выраженность этого эффекта во времени.


Рис.7a. Выраженность «эффекта
ближней зоны» от времени.


Рис.7b. Результат анализа
данных рис 7а методом пробных периодов.

Эксперимент был поставлен следующим образом. Был взят очень длинный ряд – 26 тысяч гистограмм. Эксперт сравнивал не по схеме «все со всеми», как я рассказывала выше, а определял только сходство или несходство соседних гистограмм: например, первой и второй, второй и третьей и т.д. Таким образом, на предыдущем распределении (рис. 6) все отобранные пары оказались бы в пределах первого столбика, но его ордината была бы около шести тысяч.

Разобьем весь период времени измерений (с 6 по 24 июля) на двухчасовые интервалы и построим такое распределение: по оси абсцисс отложим номер интервала, а по оси ординат – сколько гистограмм из входящих в него ста двадцати штук оказались похожими на свою следующую соседку – т.е. снова «развернем во времени» этот первый столбик. График покажет нам, в какие дни и часы во временном ряду гистограмм соседи оказывались похоже чаще, а когда – реже. Частоту сходных пар, равную 16% (или 19 гистограммам за два часа), характерную для несоседних интервалов времени, будем считать уровнем случайного сходства.

Пример такого распределения приведен на рисунке 7а. Это был ряд односекундных измерений активности плутония 239, измерения начаты шестого июля 2000 года. Видно, что число «сходных соседей» может сильно изменяться во времени, но видна и сильная низкочастотная составляющая, период которой, как показала статистическая обработка, равен 42 интервалам, или 84 часам – т.е. 3.5 суток. На рис. 7б показан результат обработки этого распределения методом пробных периодов – это делал Александр Анатольевич Конрадов. По оси абсцисс – величина периода (в двухчасовых интервалах), по оси ординат – выраженность этого периода, или "минус логарифм достоверности".


Рис.8. Результат анализа
случайного ряда с нормальным распределением
методом пробных периодов, аналогично рис 7.

В общей сложности было обработано пять физических рядов данных, каждый длительностью примерно две с половиной недели. На всех обнаружен достоверный период в этом диапазоне, от трех до четырех с половиной суток.

Для контроля таким же точно образом был просмотрен ряд чисел, полученный посредством генератора случайных чисел из программы Матлаб 6.0, с теми же параметрами, что и физические ряды – вид распределения, среднее значение, длина ряда. Результаты приведены на рисунке 8. Видно, что в этом ряду гистограмм достоверных периодов не обнаружено.
Таким образом, было показано, что частота сходства гистограмм в ближней зоне непостоянна во времени и имеет период, равный примерно половине недели – от 3.5 до 4.3 суток. В случайном ряду чисел периода нет.


Рис.9.Автокоррелограмма выраженности
ближней зоны (по результатам сравнения
комьютерным методом)


Рис.10. Выраженность "эффекта ближней зоны"
по результатам работы эксперта и программы
(сравнение)

Рассказанный здесь результат является первым, который был надежно подтвержден компьютерным методом анализа. Попытки создать машинный алгоритм, заменяющий эксперта, наталкиваются вот уже много лет на объективные трудности. Дело в том, что гибкий человеческий процесс распознавания необходимо задать алгоритмически жестко. До сих пор это не удавалось сделать достаточно надежно, только эпизодически. Один из авторов этого доклада, Василий Стрелков, разработал критерий, о котором я расскажу чуть позже. Этим критерием ему удалось несколько раз получить «эффект ближней зоны», правда, не во всех случаях, когда его видел эксперт, но достаточно многократно и достоверно, чтобы считать это достигнутым результатом.

Также ему удалось повторить результаты эксперта по периодичности ближней зоны на всех пяти рядах, где эта периодичность была обнаружена, причем и величина периода совпала довольно точно. Результат сравнения работы эксперта и программы для тех же данных, что и на рис 7, показан на рис 9. К сожалению, компьютерный метод работает намного грубее эксперта, и для получения результата пришлось сильно увеличить бин в распределении – построить количество сходных пар за каждые восемь часов, т.е. на каждые 480 гистограмм вместо ста двадцати (как в случае эксперта) – чтобы выявить эту периодичность. И тем не менее – в распределении «ближней зоны» во времени, построенном программой, виден тот же период, что и распределении, полученном экспертом – рис 10. Фаза тоже совпадает, хоть и грубо.

Метод сравнения


Рис.11.Принципиальная схема
сравнения гистограмм,
реализованная в компьютерном
алгоритме .

Теперь коротко о сути самого метода сравнения, примененного при решении этой задачи. Рис 11 изображает две гистограммы, нужно решить, схожи они по форме или нет. Для этого на гистограммах находим максимумы – обычным способом, смена знака производной с плюса на минус. Но отчетливыми максимумами считаем только те, у которых произведение наклонов слева и справа от экстремума больше некоторой заданной величины. Это необходимо для того, чтобы рассматривать именно пики, а не локальные неоднородности на гистограмме.

Все «настоящие» максимумы на гистограмме один (на рисунке она синяя) окружаем прямоугольниками, высота и ширина которых тоже являются, вообще говоря, параметрами, причем высота больше ширины, потому что так смотрит эксперт, для него расхождения по высоте менее критичны при сравнении, чем локализация пика по оси абсцисс.

Каждому найденному экстремуму приписываем «вес» – m, который зависит от абсолютной и относительной высоты экстремума. Чем ближе максимум к центру гистограммы, и чем сильнее выражен – тем больше вес. Сумма всех весов равна единице.

Каждый вес умножаем на единицу, если в прямоугольнике есть пик второй гистограммы (красной), и на ноль, если соответствующего пика не оказалось, и складываем. Получаем некоторую характеристику похожести гистограммы один на гистограмму два – S12.

Однако если во второй гистограмме, скажем, пять отчетливых максимумов, а в первой – три, и все эти три совпали с какими-то тремя максимумами второй, мы можем получить высокое значение величины S12 при не очень-то хорошем сходстве. Поэтому симметризуем процедуру, и точно таким же образом считаем значение S21, т.е. степень похожести гистограммы два на гистограмму один. Находим среднее арифметическое S12 и S21, и это именно число, S, берем как меру сходства первой и второй гистограмм.

На самом деле все несколько сложнее, чем я рассказываю, но подробности у меня есть отдельно для тех, кто интересуется, я могу после доклада рассказать, и скоро планируется статья на эту тему.
Следующий шаг – ищем максимум S при возможных сдвигах, растяжениях и инверсиях гистограмм. Если S максимальное больше установленного порога, гистограммы считаются сходными.
Такой алгоритм сравнения включает довольно много параметров, около семи. Так что при желании можно было бы, варьируя эти параметры, подогнать любое распределение, наверное. Мы делали так – на одном ряду подбирали значения параметров, чтобы повторить результат эксперта, а на других, новых рядах с теми же параметрами пытались его повторить. Повторяю, метод работает намного грубее эксперта, однако им удалось подтвердить наличие «эффекта ближней зоны» во многих случаях. Но реже, чем хотелось бы. В задаче о «периодичности ближней зоны» алгоритм повторил результаты эксперта во всех проанализированных случаях.

Таким образом, было обнаружено, что во временных рядах результатов измерений интенсивности альфа-распада есть неслучайная компонента, которая не выявляется стандартными методами, но выявляется с помощью гистограммного метода исследования временных рядов, разработанным группой Шноля. При исследовании динамики «эффекта ближней зоны» было показано, что частота встречаемости сходных по форме соседних пар гистограмм осциллирует с периодом, равным 3.5 суткам, или половине недели. С чем может быть связана такая модуляция, сказать пока сложно.

Спасибо за внимание.

Вопрос: этот вопрос я задаю не для того, чтобы услышать ответ, который я заранее знаю, а для аудитории, которая могла бы задать этот вопрос: 3,5 суток – это известный космофизический период. Он хорошо, очень хорошо известен в частоте сердечных сокращений, и не может ли этот период появиться в работе эксперта, коль скоро он тоже является такой же системой, подверженной этому ритму?

Ответ: Борис Михайлович, эксперт же не работал круглосуточно в режиме «on-line», анализируя гистограммы «с колес». При получении этих результатов сравнение полученных когда-то(!) гистограмм шло совершенно неравномерно, в разные часы суток и разной длительностью. Временные ряды были разбиты совершенно несоразмерно полученным периодам, файлы были двухсуточные, строго двухсуточные, поэтому, естественно, если влияние на эксперта со стороны внешних факторов и было, в результатах оно проявляться не должно.

Вопрос: Этот период присутствует в самих скоростях радиоактивного распада?

Ответ: Если анализировать стандартными методами – нет, такого периода в самих результатах измерений мы не нашли. Как, собственно, и какого-либо другого, хоть немного достоверного. Но раз примененным методом он выявляется, значит, он там в каком-то виде содержится...

Брунс: Что такое хорошо известный 3.5 суточный период – это период чего?

Владимирский: Этот период есть во всех, без исключения, индексах геомагнитной активности. Халберг, который использовал современную технологию при мониторинге в клиниках, обнаружил этот период в ряде физиологических показателей. В том числе, и в модуляции частоты сердечных сокращений.

Вопрос: вот вы получаете гистограммы для самых разных физических процессов. Есть какое-то впечатление, что для каких-то физических процессов они более отчетливые, яркие, различимые, а для каких-то – более сглаженные, близкие к гауссиане, или такого ощущения нет?

Ответ: Пожалуй, что нет. Формы гистограмм можно привести к некому более-менее единому виду, играя числом сглаживаний, например. Практически невозможно смотреть гистограммы, когда в сигнале изначально присутствует систематическая компонента… Поэтому доложенные здесь результаты были получены на данных с одного прибора, на одном среднем. Было специально проверено, что процент выборки один и тот же разных «несоседних» гистограмм, – это в среднем 16 % из числа возможных сочетаний, как я уже говорила. Именно поэтому, когда в первом столбике их оказывается порядка 27-30%, мы говорим о наличии «ближней зоны».

Председатель: вопросов больше нет? У нас есть время на кофе до 11-40.

Hosted by uCoz