Обсуждение:Программирование Викиданных/Виды спорта
Таблица Олимпийских видов спорта с иконками
править@Антон, Вы написали замечательный скрипт 6GJb. Он мне особенно нравится потому, что вызывает вопросы, которые я поставлю, а Вы попробуете ответить.
По мелочи: «олимпийские виды спорта» пишется с маленькой буквы, в отличие от «Олимпийских игр» (это название), см. текст статьи w:Олимпийские виды спорта.
По скрипту 6GJb:
- Скрипт возвращает 45 олимпийских видов спорта с иконками. Если я закомментирую строку 8 (# ?s wdt:P2910 ?icon. # with icons), то я получу 50 видов спорта, например Ачери-биатлон. Что это за 5 олимп. видов без иконки? Опишите этот казус в статье и приведите своё объяснение — почему так. Вообще говоря, 50 видов — это странно, поскольку в следующем скрипте 6FhP Вы получаете один (кстати, сегодня уже два) вид(а) спорта без иконки.
- Если закомментировать строку 7 (то есть получаем любые виды спорта, не только олимпийские) и «поломаем» (или удалим) строку 2 (чтобы получить список), то получаем 94 любых видов спорта с иконками. Мне кажется, это несколько противоречит гипотезе следующего раздела. Стоит это описать в статье в следующем разделе и дать своё толкование этому феномену. Придётся или скорректировать скрипт или изменить выводы о гипотезе. --Andrew Krizhanovsky (обсуждение) 09:59, 27 января 2023 (UTC)
Кстати, в этом скрипте 6GJb предлагаю в строку SELECT добавить ?s. Это позволит получать в выводе гиперссылку на объект Викиданных. Это удобно. --Andrew Krizhanovsky (обсуждение) 10:03, 27 января 2023 (UTC)
- 1. Если не комментировать 8 строку, а написать команду OPTIONAL{ ?s wdt:P2910 ?icon. # with icons} и удалить 2-ю строку - "#defaultView:ImageGrid", то будет выдано 53 результата, и будет видно у каких видов спорта иконок нет.
- Прошелся по всем таким видам спорта:
- Перетягивание каната является видом спорта исключенным из Олимпийских согласно статье «Олимпийские виды спорта».
- Сёрфинг был признан Олимпийским видом спорта совсем недавно в 2021 году, согласно статье о нем на Википедии. Возможно, иконку еще не успели добавить в проект ВикиДанных и Википедии
- Лыжный спорт не является отдельным видом спорта, а является подклассом, соответственно, отдельной иконки у него нет.
- То, что у синхронного плавания нет иконки - это ошибка, т.к. на странице данного вида спорта в Википедии иконка есть.
- У спортивного скалолазания - тоже ошибка скорее всего, иконки нет ни на ВикиДанных, ни на странице в Википедии, но при этом на ВикиМедиа есть - загруженная иконка в категории Sport climbing
- У скейтбординга тоже ошибка, т.к. на ВикиМедиа иконка есть
- У гребли на каное - нет иконки на ВикиДанных, есть иконка на ВикиПедии, только полное название "Гребля на байдарках и каноэ"
- Один из видов спорта, которые получены в результате запроса - Q114729327, не имеет названия ни на английском, ни на русском языке, только изображение - судя по изображению биатлон, но биатлон уже есть в списке с иконкой. Значит, возможно, это просто ошибочно созданная страница, не до конца заполненная.
- Перетягивание каната является видом спорта исключенным из Олимпийских согласно статье «Олимпийские виды спорта».
- 2. Здесь согласен. Выводы в следующей части - не верные. Переделаю
- Скрипт переделал с учетом добавления "?s" - вот обновленный Akovin (обсуждение) 09:35, 1 февраля 2023 (UTC)
- @Антон, отличная работа! Поскольку в этом разделе мы получаем не совсем "таблицу", то название раздела стоит изменить. И заменить слово "таблица" в тексте раздела на что-то более подходящее.
- У картинки в статье должна быть подпись (по-русски). У той же иллюстрации commons:File:Olympic types of sport with icons.png на Викискладе сейчас не хватает описания на русском, есть только английское описание. --Andrew Krizhanovsky (обсуждение) 17:30, 1 февраля 2023 (UTC)
Проверяем гипотезу о том, что «свойство иконка есть только у тех видов спорта, которые относятся к олимпийским»
править@Антон, Ваш скрипт 6FhP возвращает бобслей (Q177275). Однако у этого объекта Q177275 (бобслей) есть иконка?! Почему же Ваш скрипт его возвращает? Попробуйте разобраться, пожалуйста. Напишите своё объяснение в том же разделе своей статьи или исправьте скрипт, если придумаете — как.
Поскольку сегодня этот скрипт возвращает не один, а два вида спорта без иконки, то если скрипт не будете менять, то приведите два этих объекта после скрипта. --Andrew Krizhanovsky (обсуждение) 09:59, 27 января 2023 (UTC)
- Добавил новый скрипт, среди результатов которого есть те, которые опровергают гипотезу. Поменял текст данного раздела. Akovin (обсуждение) 11:14, 1 февраля 2023 (UTC)
Страны происхождения видов спорта
править@Антон, по добавленному тексту (diff).
- В этой фразе "...больше всего видов спорта было придумано..." после названия страны укажите (числом в скобках) — сколько именно видов спорта было придумано в Англии и так далее. В первой скобке пишите развёрнуто (NN видов спорта было придумано), в последующих скобках (YYY видов).
- Антон, Вы пишите: «В остальных 145 странах не было придумано ни одного вида спорта.» Антон, когда Вы будете гостить в одной из этих 145 стран, то хозяева с удовольствием Вам расскажут о тех спортах, которые придумал лично их народ, но просто руки не дошли добавить это в Викиданные. Прошу смягчить формулировку. --Andrew Krizhanovsky (обсуждение) 11:48, 7 февраля 2023 (UTC)
- Кстати, Антон, обратите внимание на рисунок c:File:Origin countries of type of sports.png. Там затесался безымянный объект Q... Вообще-то все страны имеют названия на русском. Похоже на ошибку. --Andrew Krizhanovsky (обсуждение) 11:51, 7 февраля 2023 (UTC)
Олимпийские игры и войны
править@Антон, помните есть легенда, что все воины прекращались на время игр. Мы можем её проверить. Мне кажется, что нужно по порядку делать так:
- На временной шкале (сначала просто таблица) получить даты начала и конца летних и зимних игр. Вот, например, объект 2024 Summer Olympics (Q995653) имеет свойства "start time" и "end time".
- Дальше получить периоды мира и войн для стран (для всех или для нескольких?). См. работу "(Андрей) Голубев А. А. «Исследование периодов мира и войны стран с помощью SPARQL-запросов и анализа данных в Python», 2018." Добавьте раздел "Литература" и сошлитесь на работу Голубева.
- Нужно придумать, как наложить эти две серии данных, чтобы (1) получить рисунок (график) и (2) подсчитать (в своей разработанной программе, Python?). Вопрос — что считать? Ну, например, берём параметр τ - это число дней до начала Игр и после конца Игр. Если война/конфликт заканчивается в период "начало игр — τ" (то есть начало Игр "гасит" войну) или начинается в период с окончания игр до момента + τ (Игры кончились, война зажигается), то наша гипотеза имеет +1 балл, а если война/конфликт пересекается с Играми, то -1.
- Получить список войн/конфликтов, у которых начало или конец срока находятся максимально близко к началу/концу Игр. Типа: сегодня Игры кончились, а завтра была война. --Andrew Krizhanovsky (обсуждение) 11:48, 7 февраля 2023 (UTC)
- @Антон, получилось интересно. Что дальше:
- "Рис. 3: График периодов проведения Олимпийских игр" - после этого рисунка напишите, какие на нём видно два больших интервала. Объясните их наличие.
- "с 1896-01-01 по 2023-01-01" - слишком формально написано. Можно просто годы написать.
- "Рис. 4: График периодов войн" - сейчас рисунок неинформативен. Видно только, что недавно был необъяснимый интервал в 2010-х годах, хотя это не верно. Попробуйте нарисовать гистограмму так, что по оси Y мы видим число одновременно идущих войн и конфликтов, 0 - если в указанный момент времени совершенно нет войн и конфликтов. Тогда и цель несколько изменится - нужно увидеть (и подсчитать) есть ли "ямы", то есть - есть ли снижение войн и битв (значимое, ощутимое снижение) в период олимпиад или рядом с ними. Скорее всего, понадобится программирование на чём-либо для визулизации таких интересных данных.
- c:File:War periods.png — (1) что это за код языка "Ab"? (2) Новую версию картинки не загружайте отдельным файлом, а грузите поверх старого файла, чтобы заново не писать описание. См. кнопку "Upload a new version of this file" на той же странице. (3) Слишком краткое описание "График периодов войн", думаю, что можно было бы более полно написать, но не настаиваю.
- Сообщите, пожалуйста, свой логин на GitHub (это по поводу кода, который Вы написали). --Andrew Krizhanovsky (обсуждение) 13:24, 17 февраля 2023 (UTC)
- @Антон, получилось интересно. Что дальше:
- @Антон, у меня есть уточнения к фразе "Скорее всего, это связано с двумя мировыми войнами, которые проходили в эти периоды. Согласно статье и статье, Первая и Вторая мировые войны проходили приблизительно в эти периоды времени: с 1914 по 1918 год и с 1939 по 1945 год."
- Вы пишите в первом предложении: "войнами, которые проходили в эти периоды". При этом в предыдущем предложении эти периоды не названы, а написано "На графике можно наблюдать два больших перерыва в проведении Олимпийских игр." Будет хорошо для читателя, если Вы напишите словами, каких именно два больших перерыва видно на графике.
- "Согласно статье и статье..." — это, несомненно, перл. Но мы так не будем писать. Идея с гиперссылками понятна, но попробуйте как-то иначе давать ссылки, чтобы текст оставался удобным для чтения.
- "Скорее всего, это связано с двумя мировыми войнами ... " Мне кажется, что можно найти литературу (и поставить в статье ссылку на эту литературу), где будет чётко написано, почему именно этих олимпиад не было.
- "Первая и Вторая мировые войны проходили приблизительно в эти периоды времени: с 1914 по 1918 год и с 1939 по 1945 год". Почему "приблизительно"? Вы же указываете точно годы войны? Именно в эти годы эти войны и шли. --Andrew Krizhanovsky (обсуждение) 16:39, 22 февраля 2023 (UTC)
- @Антон, у меня есть уточнения к фразе "Скорее всего, это связано с двумя мировыми войнами, которые проходили в эти периоды. Согласно статье и статье, Первая и Вторая мировые войны проходили приблизительно в эти периоды времени: с 1914 по 1918 год и с 1939 по 1945 год."
- @Антон, Вы написали скрипт "List of war periods" https://w.wiki/6L$j Получен: 171 период. Если закомментировать строку 6 (instances of "country"), то получим 184 периода, если строку 5 (instances of "sovereign state"), то 176. Почему так? Попробуйте разобраться — баг это или фича — и провести небольшое исследование. Результаты напишите после скрипта словами.
- Я смотрю на рисунок 5. И мне кажется, что некоторое изменение с числом войн в окрестности многих олимпийских игр происходят. Тот вариант с алгоритмом hypothesis_True, который Вы написали — оставляем в тексте. Но я предлагаю ещё один алгоритм.
- У нас снова есть входной параметр τ — это число месяцев (а не дней) до начала Игр и после конца Игр.
- Есть известная нам функция War(date) — это число войн на выбранную дату (месяц). Значение функции представлено на рис. 5.
- Подсчитаем ΔWar (τ), а именно: уменьшилось или увеличилось число войн в момент проведения Олимпийских игр (дата TGame) относительно числа войн в дату до игр (TGame — τ) и после игр (TGame + τ).
- Меняем параметр τ от 1 месяца до максимума (про максимум ниже) и считаем ΔWar (τ). Рисуем график ΔWar (τ). Пытаемся понять и описать — что этот график показывает. Есть ли на графике явно выраженный минимум, то есть эффективное временное расстояние от Игр, на которых число войн уменьшается.
- Ограничение для максимального периода: τ меньше времени между играми, то есть τ < 4 лет. Если всё в месяцах, то τ < 48. --Andrew Krizhanovsky (обсуждение) 08:19, 2 марта 2023 (UTC)