Обсуждение:Программирование Викиданных/Национальный парк

Идеи для SPARQL-задач

править

@Екатерина, жду Ваших идей в виде трёх задач. --Andrew Krizhanovsky (обсуждение) 20:09, 11 ноября 2021 (UTC)Ответить

  1. Найти субъект России, в котором находится наибольшее количество национальных парков.
  2. Найти список самых молодых национальных парков России, к примеру, получивших статус после 2010 года.
  3. Подсчитать и построить графики площадей национальных парков России, по отношению к национальным паркам всего мира.
Екатерина Федоренко (обсуждение) 14:59, 12 ноября 2021 (UTC)Ответить
@Екатерина, спасибо. Добавьте эти три задачи в раздел "Будущая работа" на странице "Национальный парк". Формулировка задачи в следующем разделе. --Andrew Krizhanovsky (обсуждение) 11:02, 18 ноября 2021 (UTC)Ответить
Добрый день, @Andrew Krizhanovsky. Три задачи добавила в список. Екатерина Федоренко (обсуждение) 13:45, 3 декабря 2021 (UTC)Ответить

Площади парков

править

@Екатерина, хотелось бы продолжить анализ парков России и всего мира. Но теперь будем считать не количество, а качество. Мерой качества выступит площадь парка. Если она, конечно, указана. Хотелось бы увидеть следующие скрипты с рассказом в виде исследования в новом разделе "Площади парков". Этот раздел будет после раздела "Диаграмма парков..." перед разделом "Полнота Викиданных по паркам".

Сначала подсчитайте, у скольки парков в России мире в ВД не заполнено свойство "площадь", в абсолютных числах и в процентах. Сравните эти числа.

Поскольку парки обычно не закрывают (приведите число, сколько парков было закрыто по Викиданным, см. свойство d:Property:P576 (дата закрытия)), то будем считать, что раз парк открыли, то площадь добавилась.

Итак, что хотелось бы увидеть — это график или диаграмму роста площади парков по странам по годам. Я предполагаю, что график будет тот же (цветные квадратики), но теперь будем добавлять не по одному парку, а по сколько-то квадратных километров, свойство парка "area". --Andrew Krizhanovsky (обсуждение) 11:02, 18 ноября 2021 (UTC)Ответить

Добрый день! Все пункты готовы, скрипты написаны на странице статьи. Екатерина Федоренко (обсуждение) 13:09, 10 декабря 2021 (UTC)Ответить

Площади парков Норвегии

править
площади национальных парков Норвегии - вот что у меня получается: https://w.wiki/4Zfc
Напомню, что в диаграмме, которую я считала - Норвегия выделяется из всех остальных
Максимальный по площади парк - https://www.wikidata.org/wiki/Q1400776
Но там в графе AREA указано 181,811,039±0.5 hectare, а спаркл почему-то видит это как число 1818110390000 -- Екатерина Федоренко
@Екатерина, много вопросов к Вашему скрипту.
Комментарии не все понятные. Например, вместо
  ?park wdt:P17 ?country. #definition of _country
я бы написал:
  ?park wdt:P17 ?country. # park belongs to country 
  1. Я убрал GROUP BY и получил те же 98 записей. То есть группировка у Вас не работает, число объектов меньше не становится. Вот мой временный рабочий скрипт: https://w.wiki/4aD2 Обратите внимание, что я ушёл от rdfs:label к SERVICE wikibase:label и получил названия парков на русском.
  2. У Вас в скрипте есть переменная ?sumArea. При чём здесь "сумма", если Вы ничего не складываете?
  3. Возьмём первый результат по моему скрипту (https://w.wiki/4aCw). Парк Ондердален. На странице этого парка в Викиданных указано три значения площади: 135 кв. км, 133.996 кв. км и 13,399.62468 гектаров. Второе и третье значение почти равны, но в разных единицах измерения. В результатах скрипта мы видим три числа: 133996246.8, 135000000, 133996000. Видим, что числа уже переведены в км.
  4. Мы можем себе упростить задачу и взять максимальное значение из всех возможных. То есть оптимистичное предположение, что площади парков или постоянны или увеличиваются. Используйте функцию MAX(). Для парка Ондердален максимальной площадью будет 135000000 (или 135 кв. км). --Andrew Krizhanovsky (обсуждение) 21:29, 19 декабря 2021 (UTC)Ответить
@Andrew Krizhanovsky, здравствуйте, изменила последний скрипт, который выбирает максимальное значение из всех возможных по площади https://w.wiki/4ee9. Екатерина Федоренко (обсуждение) 22:52, 7 января 2022 (UTC)Ответить
@Екатерина, давайте упростим Вам задачу.
  • Уберите из скриптов "[AUTO_LANGUAGE]". В русской версии "ru,en", в английской только "en".
  • В разделе "Заполнение 100 объектов" предлагаю убрать информацию о собственно заполнении. То есть убрать две фразы: "Необходимо заполнить поле 'location'... ... ввиду заполнения поля.". И переименовать раздел "Заполнение 100 объектов" в какое-то имя, соответствующее его содержанию.
  • По упрощению задачи. Оставим LaTeX на следущий год другим студентам. Ваша задача доперевести на английский то, что Вы дописали в Русском Викиверситете и добавить в Вашу статью в Английском Викиверситете: en:Research in programming Wikidata/National park.
  • То есть надо будет сделать английскую версию "Рис. 4: Диаграмма роста площади национальных парков по странам по годам", загрузить её на Викисклад. Просьба, у тех рисунков, которые сделали Вы, указать год: 2021 или 2022. Те, которые достались Вам "в наследство", тоже указать год в подписи к рисунку.
  • Раздел "Полнота..." Сейчас есть ссылка на одну книгу ("Вокруг Света. Национальные парки России. Поволжье и Северный Кавказ. Путеводитель"). Ссылки на литературу оформляются с помощью либо сносок ref, либо с помощью sfn. Пример оформления ссылки на книгу "Крижановский А.А. Работа в вики-среде на примере Русской Википедии (препринт). — Петрозаводск, 2015. — 114 с." есть на странице Работа в вики-среде (с упражнениями). Не забудьте создать раздел "Примечания" с магической конструкцией {{примечания}}. В Английском Викиверситете сделайте ссылку на книги по упрощённой схеме, через "<ref>", см. описание там: en:Wikiversity:Cite sources.
  • Одной книжки для полноценного описания мало. Я Вам пришлю 3 PDF-файла во ВКонтакте. Посмотрите, где там указано, сколько у нас парков. Добавьте ссылки (см. выше) на эти книги, и укажите номера страниц, где именно указаны числа парков. После перечисления книг, просуммируйте число нац. парков по книгам, сравните - сколько парков есть на 2022 год в Викиданных и напишите, какую долю парки по Викиданным составляют от числа парков по бумажным источникам.
  • Добавьте, пожалуйста, пояснение к рис. 4: что означает один квадратик (или прямоугольник) одного цвета за один год. И добавьте пример, то есть в такой-то стране за такой-то год было ... поэтому мы видим на рис. 4 то-то. --Andrew Krizhanovsky (обсуждение) 14:04, 8 января 2022 (UTC)Ответить
@Andrew Krizhanovsky, Здравствуйте, выходит некоторая нестыковка по открытым данным о количестве национальных парков в России.
  • ) Все три книги, которые вы прислали, содержат одинаковое введение с указанием одного и того же числа парков: 35. Данные в книгах устарели (это 2007 год).
  • ) Я нашла несколько статей:
Джанджугазова Е. А. Развитие экологического туризма на территории национальных парков России //Российские регионы: взгляд в будущее. – 2019. – Т. 6. – №. 2.
(https://cyberleninka.ru/article/n/razvitie-ekologicheskogo-turizma-na-territorii-natsionalnyh-parkov-rossii)
Здесь число такое: 47. (это 2019г.)
  • ) Так же есть работа от 2018г
Щербакова Е. А. НАЦИОНАЛЬНЫЕ ПАРКИ В ПРИРОДООХРАННОМ ЗАКОНОДАТЕЛЬСТВЕ РОССИИ. ПУТЬ К ПРИЗНАНИЮ //Степи Северной Евразии. – 2018. – С. 1143-1148.
https://www.elibrary.ru/item.asp?id=36261753
В которой "С начала 2018 г. основу федеральной системы ООПТ составляют 105 государственных природных заповедника, 52 национальных парка и 57 заказников федерального значения"
  • ) "После перечисления книг, просуммируйте число нац. парков по книгам, сравните - сколько парков есть на 2022 год в Викиданных и напишите, какую долю парки по Викиданным составляют от числа парков по бумажным источникам." - по открытым данным в Викиданных число парков описано большим числом - "По состоянию на конец 2015 года на территории России действовало 49 национальных парков...... За 2016—2019 годы их общее число достигло 62." - это из статьи https://ru.wikipedia.org/wiki/Список_национальных_парков_России#Действующие_парки
  • ) Я сравнила данные в Википедии и на сайте Министерства природы (офиц.сайт) https://www.mnr.gov.ru/activity/oopt/ - здесь указано в списке 51 парк. (это меньше, чем в Викиданных).
Как в таком случае описывать долю? Екатерина Федоренко (обсуждение) 21:47, 8 января 2022 (UTC)Ответить
  • @Екатерина, спасибо за поиск. Раз так, то книжки отменяются. Давайте возьмём и добавим одну статью Джанджугазова. Статья Щербаковой в пролёте, поскольку текст доступен только тем, кто зарегистрирован в elibrary, к сожалению.
  • Если в Викиданных парков больше, то процентов не надо, пишем, что по нашим сведениям получается так, что все национальные парки представлены в Викиданных (со ссылкой на число парков у Джанджугазова). Пусть нам возразят :)
  • Обратите внимание, что на сайте Киберленинки, на странице со статьёй есть кнопка "Цитировать" в виде кавычки и там есть вкладка "Wiki". Это, возможно, упростит Вам оформление ссылки в Викиверситете. Рабочий пример оформления ссылки именно на "статью" есть на странице Работа в вики-среде (с упражнениями)/Основы работы в Википедии, статья "Langlais, 2013". --Andrew Krizhanovsky (обсуждение) 08:13, 9 января 2022 (UTC)Ответить
    @Andrew Krizhanovsky, Здравствуйте, по вышеупомянутым заданиям все готово. Екатерина Федоренко (обсуждение) 17:44, 9 января 2022 (UTC)Ответить

Диаграмма парков, упорядоченных по количеству за разные годы и по странам мира

править

@Екатерина, от Никиты Александровича Вам досталось тяжёлое наследство. А именно: есть много вопросов к скрипту, например, этому:

#defaultView:BarChart
SELECT DISTINCT  (SAMPLE(?year) AS ?year) (COUNT(?year) AS ?count) (SAMPLE(?parkLabel) AS ?parkLabel) WHERE {
  ?object (wdt:P31/wdt:P279*) wd:Q46169. #instance of national park of .. (Russia as example)
  BIND(str(YEAR(?inception)) AS ?year) #definition of year
  ?object wdt:P571 ?inception. #definition of _inception
  ?object wdt:P17 ?country. #definition of _country
  ?country rdfs:label ?parkLabel.
  FILTER((LANG(?parkLabel)) = "ru") #filter in parkLabel = ru
}
GROUP BY ?inception ?country #group by inception + country
ORDER BY ?year ?inception #order by year + inception
  1. Строка "FILTER..." выкидывает из рассмотрения парки, названия которых не переведены на русский. Неудачная идея. Лучше уж названия, если нет на русском, приводить на английском, чем совсем выкидывать.
  2. Не понимаю, зачем в GROUP BY и в ORDER BY есть ?inception. И без него можно и нужно.
  3. Почему привязка переменной BIND(...?inception) стоит до её определения (?object wdt:P571 ?inception). Запрос будет очень долгим, лучше строки поменять местами.

И главный вопрос, получим ли мы с помощью этого скрипта картинку, что в статье ниже, или есть какое-то ещё преобразование, которое Никита не написал? --Andrew Krizhanovsky (обсуждение) 11:02, 18 ноября 2021 (UTC)Ответить

Добрый день, @Andrew Krizhanovsky. Как я не пыталась изменить этот скрипт, моих знаний недостаточно, чтобы отсортировать данные по годам так, как они представлены на рисунке. Никакие преобразования не увенчались успехом.
Екатерина Федоренко (обсуждение) 13:39, 3 декабря 2021 (UTC)Ответить

IUCN protected areas category

править

@Сергей, в разделе "Парки мира, являющиеся охраняемыми зонами" вы написали полезный скрипт SPARQL-запрос. Я взял один из получившихся парков и увидел свойство d:Property:P814 (категория МСОП). Посмотрите, пожалуйста:

  1. какие бывают категории МСОП в Викиданных?
  2. что такое "категория МСОП"?
  3. Не построить ли нам гистограмму этих категорий? То есть сколько парков 1 категории, сколько 2 категории и так далее. --Andrew Krizhanovsky (обсуждение) 17:05, 27 сентября 2022 (UTC)Ответить
Добрый день, @Andrew Krizhanovsky. Посмотрел информацию по МСОП, а также по категориям в Викиданных.
IUCN или МСОП - Международный союз охраны природы. Это международная некоммерческая организация, занимающаяся освещением проблем сохранения биоразнообразия планеты, представляет новости, конгрессы, проходящие в разных странах, списки видов, нуждающихся в особой охране в разных регионах планеты. Организация имеет статус наблюдателя при Генеральной Ассамблее ООН. Союз играет важную роль в осуществлении ряда международных конвенций по сохранению природы и биоразнообразия. Участвовал в создании Всемирного фонда природы и Всемирного центра мониторинга охраны природы.
Как я понял, "категория МСОП" указывает на объект, защищаемый данной организацией.
Всего в Викиданных 6 категорий МСОП, однако первая категория подразделяется на Ia и Ib, поэтому можно сказать, что их всего 7.
Гистограмму я построю. По крайней мере постараюсь построить, надеюсь получится.
  1. Разобраться с загрузкой иллюстраций. Загрузить карту на Викисклад SPARQL-запрос.
  2. По России вообще и по России с IUCN - сколько будет парков?
  3. Стоит ли особняком парки США и Канады? Почему на рис. SPARQL-запрос США, Канада и Россия почти не представлены? --Andrew Krizhanovsky (обсуждение) 17:18, 27 сентября 2022 (UTC)Ответить
Вернуться на страницу «Программирование Викиданных/Национальный парк».