Семинар «ПРОСТРАНСТВЕННАЯ СТАТИСТИКА В ПРОГРАММЕ R»
Место: онлайн
Время: 1 ноября – 22 декабря 2022 г., занятия 2 раза в неделю по 2 ч, 12.00-14.00 по Московскому времени.
Охрана природы часто заключает в себе пространственный аспект. Туристы посещают ООПТ неравномерно, потому что их притягивают достопримечательности, животные и растения предпочитают определенный тип местообитаний, степень загрязнений от рудников зависит от типа почвы, а скорость распространения пожара – от рельефа местности. В итоге нам приходится принимать решения с учетом особенностей местоположения в пространстве. Пространственная статистика – это набор инструментов для анализа данных в тех случаях, когда их взаиморасположение имеет значение.
Анализировать данные мы будем в программе R. R – ведущая статистическая программа для анализа данных на сегодняшний день. Её главное достоинство – после освоения базовых принципов R намного проще в использовании, чем другие инструменты.
Примерно 25% времени семинара составляют лекции, 25% – совместные выполнения заданий «в классе», и еще половина – самостоятельные задания. В конце участники работают со своими данными, чтобы закрепить полученные знания наилучшим образом.
Занятия бесплатные. По окончании всем участникам семинара, защитившим индивидуальный проект, выдается сертификат с указанием наименования курса и количества часов.
Преподаватель
Антон Квит, Университет Джонса Хопкинса.
Если Вы хотите принять участие в семинаре, заполните анкету путем перехода по гиперссылке не позднее 1 октября 2022 г. Количество участников не более 20 человек. В течение недели после подачи анкеты мы уведомляем участников о том, что их заявка получена. Участникам необходимо иметь стабильный интернет. Требования к участникам: базовое владение программой R, желание читать и вникать в незнакомый код, владение базовой статистикой, базовое понимание ГИС. Желательно умение искать в поисковиках ответы на вопросы. Участников, у которых нужные навыки отсутствуют, мы принять не сможем. Если Вы в статистике новичок и самостоятельно изучать ее не хотите, Вы можете пройти вот этот русскоязычный бесплатный курс или записаться на курс АНО «ОСДЖ» по базовой статистике 6 сентября – 27 октября.
Виды данных и вопросы, которым посвящен тренинг:
1. Геостатистические данные: измерения в ограниченном количестве точек
Геостатистика дает возможность предсказать там, где нельзя измерить. Допустим, у нас есть ряд локаций, в которых мы измерили загрязненность земли и воды тяжелыми металлами. В силу ограниченности ресурсов мы не можем провести измерения везде, где нужно. Однако геостатистика позволяет нам правильно предсказать значения в интересующих местах, а также оценить неопределенность предсказания.
2. Точечные данные: координаты точек и есть данные
Мы знаем координаты деревьев, пораженных грибком. Случайно ли поражение распределено в пространстве или кластеризуется особенным образом? Встречается ли он чаще рядом с местами проживания людей или дорогами? Как измерить и визуализировать частоту местонахождения этих деревьев во всем лесу, чтобы справиться с инфекцией? Анализ точечных данных позволяет ответить на эти вопросы.
3. Данные на уровне территорий: измерения привязаны к территориям
У нас есть данные о количестве вырубок леса в разных областях России. Чаще ли вырубки встречаются в соседних областях, или вырубки происходят в пространственной независимости друг от друга? Влияют ли вырубки в соседних областях друг на друга?
4. Визуализация данных
Создание рабочих карт плотности животных, растений, встречаемости браконьеров в R. Делаем красивые картинки используя R как ГИС.
5. Если хватит времени, будет бонус: пространственные и пространственно-временные кластеры
Нахождение и измерение кластеров в пространстве нужно для определения локаций обитания животных или повышенного риска для них. Программа SaTScan позволяет определять кластеры не только в пространстве, но и во времени: например, найти и статистически измерить повышенное количество животных в определенных местах летом, но в других местах зимой.