Обновлен массив данных iNaturalist в GBIF: 2 июля

Дорогие друзья!

У нас повод ещё раз рассказать о публикации данных iNaturalist через Global Biodiversity Information Facility, а также (традиционно) о рейтинге России. Последний раз мы писали о GBIF-массиве iNaturalist 7 дней назад: https://www.inaturalist.org/projects/flora-of-russia/journal/37740-obnovlen-massiv-dannyh-inaturalist-v-gbif-24-iyunya . У нас есть достойный повод посмотреть, как продвигаются наши дела, ведь 2 июля 2020 г. был обновлен массив данных iNaturalist, которые поступают в GBIF (https://doi.org/10.15468/ab3s5x).

Итак, многие из читателей нашего журнала уже знают, что данные (которые каждый из вас загружает на iNaturalist), достигшие исследовательского уровня и имеющие одну из трёх свободных лицензий (CC0, CC-BY, CC-BY-NC), экспортируются в GBIF (https://www.gbif.org/). Это единая точка доступа к 53,6 тысячам баз данных о биоразнообразии. Сейчас в GBIF 1,6 млрд записей, в т.ч. 17 237 578 штук из iNaturalist. В общей сложности, 58,1 млн записей в GBIF имеют сопутствующие изображения, видеофайлы или аудио.

Hi all, this is a traditional overview of the activity of the Russian iNat-community in accumulation of GBIF-mediated data. iNaturalist data that reaches research grade and has one of three free licenses (CC0, CC-BY, CC-BY-NC) is exported to GBIF.

Если вы хотите что-то выгрузить из iNaturalist в табличном виде, то, прежде всего, появится вот такое сообщение: "Большие объёмы экспорта тормозят нашу инфраструктуру и усложняют для нас введение новых изменений. Следует рассмотреть другие источники. GBIF принимает большинство наших лицензированных наблюдений исследовательского уровня, и их инструменты экспорта превосходны. Экспорт GBIF также идет с doi, который вы можете указать, если публикуете исследования на основе данных, которые вы экспортируете, и эти ссылки чрезвычайно полезны для нас, поскольку они позволяют нам видеть, как используются данные iNat". Сейчас таких публикаций уже 689.

Any user can freely study all this data on the GBIF portal as well as download offline data of any size in the form of csv-downloads. The filters allow you to make sophisticated enquires and, in fact, browse better the electronic data on the biodiversity of a particular region.

Наблюдения из России, которые публикуются в iNaturalist, добавляются в GBIF тремя путями:
1) загрузка новых наблюдений (поле и архивы);
2) определение бэклога;
3) изменение пользователями настроек своих лицензий.

По противоположным причинам наблюдения могут быть автоматически отозваны из GBIF:
1) наблюдение удалено пользователем из iNaturalist;
2) наблюдение с исследовательским уровнем лишилось его (было переопределено);
3) пользователь поставил жёсткую лицензию для всех своих фотографий.


Как обычно: догонялки. Для кого-то это самое интересное. Именно в GBIF легко и просто посмотреть насколько активны пользователи iNaturalist разных стран мира. Все мы видим борьбу регионов в зачетах "Флоры России" и в Кубке. Все наши данные идут в зачёт России в мировом рейтинге и очень здорово влияют, прежде всего, на репутацию нашей страны в профессиональном научном мире. Чтобы было интереснее, давайте поставим себе на это лето три цели.

*** Цель 1: второе место в мире по наблюдениям сосудистых растений ***

Пока мы занимаем третье место в мире, уступая Канаде 113,4 тыс. наблюдений (в прошлый раз было 146,7 тыс.). Представляете? Отставание сократилось на 33 тыс. за семь дней!!! Но если, например, все пользователи портала "Флора России" решили бы перейти на открытые лицензии, то отрыв составил бы всего 30 тыс. наблюдений. Ну что: попробуем съесть Канаду к концу июля? (см. цель 3). Не снижаем обороты! УЧАСТВУЮТ: наблюдения сосудистых растений с территории России исследовательского уровня с лицензиями CC0, CC-BY, CC-BY-NC.

*** Цель 2: четвертое место по наблюдениям всех организмов ***

ЦЕЛЬ ДОСТИГНУТА!

С Австралией у нас шла борьба в общем зачёте (по всем наблюдениям всех групп живых организмов, которые попадают из iNaturalist в GBIF) за четвёртое место. Сегодня мы обошли австралийцев! Начинаем преследовать Мексику.

Итак, сейчас отрыв от Мексики примерно 189 тыс. наблюдений. Там сейчас летняя засуха, поэтому наблюдений поступает относительно немного. Через неделю станет ясно, как сокращается этот разрыв. УЧАСТВУЮТ: наблюдения всех организмов с территории России исследовательского уровня с лицензиями CC0, CC-BY, CC-BY-NC.

*** Цель 3: первое место по наблюдениям сосудистых растений (в зачёте по месяцам) ***

Эта цель казалась еще пару недель назад нереальной. Обогнать США? Родину iNaturalist? Пусть даже на месячной отметке и только по сосудистым растениям исследовательского уровня. Но... Давайте смотреть на цифры. Немного истории: немногие помнят, но каждый раз по итогам месяца в мае, июне, июле, августе и сентябре 2019 года Россия занимала третье место по сосудистым растениям, уступая США и Канаде. В этом году мы стабильно вторые.

Вот данные за июнь 2020 г.:

Итак, по неокончательной статистике за июнь 2020 года мы не просто занимаем второе место. В этот раз мы уступили США не в 2,3 раза (как неделю назад), а всего в 1,56 раза! УЧАСТВУЮТ: свежие полевые наблюдения 2020 г. сосудистых растений с территории России исследовательского уровня с лицензиями CC0, CC-BY, CC-BY-NC.

Всем спасибо! Каждому спасибо!


Хотите поучаствовать? Нет ничего проще! Каждый пользователь может зайти в личный кабинет (только на сайте, ведь в приложении этой функции нет) и поставить/поменять лицензию. У наблюдений, которые не идут в GBIF, стоит в паспорте наблюдений пометка "Все права защищены" (справа внизу), а у тех, что идут - "Некоторые права защищены". К сожалению, в приложениях по умолчанию стоит "All rights reserved", что запрещает использовать ваши данные даже в научных целях и передавать их в GBIF.

Вот пошаговая инструкция для придания вашим наблюдениям статуса "открытые данные":
1) зайдите через компьютер или интернет-браузер смартфона на сайт iNaturalist.org
2) залогиньтесь и зайдите в раздел "Настройки учётной записи" (по стрелке в правом верхнем углу рядом с вашим аватаром)
3) пролистайте до раздела "Лицензирование"
4) в разделах "Лицензия наблюдения по умолчанию", "Лицензия фото по умолчанию", "Лицензия аудио по умолчанию" проставьте одну из первых трёх лицензий: CC0, CC-BY, CC-BY-NC
5) обязательно поставьте три галочки "Обновить существующие наблюдения (фото, аудио) новыми вариантами лицензий", чтобы лицензия обновилась на всех загруженных прежде фотографиях
6) в конце страницы нажмите синюю кнопку "Сохранить"

Итак, в GBIF-зачет попадают не все наблюдения, а только те, что достигли "Исследовательского уровня" и имеют свободную лицензию - CC0, CC-BY или CC-BY-NC. Успех нашей страны в GBIF/iNaturalist во многом связан с активностью профессиональных ученых, которые подтверждают находки (а, зачастую, и публикуют на iNaturalist свои данные) и разумностью пользователей, которые в личных кабинетах на сайте поставили для своих наблюдений свободные лицензии, а, значит, такие наблюдения могут использоваться научным сообществом.


P.S. Вот пользователи, которые внесли максимальный вклад за последние 7 дней в проект "Флора России" и используют при этом открытые лицензии: ссылка.

P.P.S. Ближайшие недели сообщений в журнале будет совсем немного и они будут короче обычного. Надеемся на понимание.

Posted on July 2, 2020 10:51 AM by apseregin apseregin

Comments

Скажите пожалуйста, а какое минимальное время наблоюдение должно вылежать с Research Grade, чтобы быть добавлену в ГБИФ? И сразу же ли в нем появляется ссылка на соответствующее наблюдение в GBIF?

Мне эта динамика непонятна. Ни в этот, ни в прошлый анонсированнный Вами раз ни в одном моем наблюдении ссылка не добави лась, все стоит на уровне начала июня. (Я проверяю наблюдения простых видов, которые подтверждаются в течение 1-2 дней после добавления).

По моим наблюдениям с начала этого года, наблюдения обычно стоят без ссылки на ГБИФ до двух с половиной месяцев с момента добавления и приобретенияф Research Grade, а потом ссылка разом появляется у всех примерно до полмесяца со времени добавления. Эти потом стоят без ссылки новые два с половиной месяца до следующего цикла. То есть задерюка появления ссылки бывает от полумесяца до двух с половиной. (Не исключено впрочем, что ссылка появляется не сразу после экспорта.)

Posted by oleg_kosterin over 3 years ago

Кажется, что она просто появляется с задержкой.

Posted by marina_gorbunova over 3 years ago

Add a Comment

Sign In or Sign Up to add comments