Обсуждение:Программирование Викиданных/Школы
Три объекта
править- В свойстве "chairperson" Вы пишите Raisa и "Anatoli". Следуя Вашей логике, @Арина Юрьевна, в объекте Россия президентом должен быть указан Вова, а не Владимир Путин. Но это не так. То есть, если про директоров лицея, Раису и Анатолия, нет отдельных статей в рувики и объектов в ВД, то тогда свойство chairperson не заполняйте.
- Насчёт основателя лицея аналогичное замечание. Есть большая разница между просто исполкомом и "Исполнительным комитетом Петрозаводского городского совета".
- population ‒ это численность населения. Вы в своих "хороших" школах видели такое свойство? Или у Вас есть данные, что школьники уже днюют и ночуют в Лицее?..
- Число школьников, полагаю, можно указать с помощью свойства students count (P2196).
- Вы видели в какой-либо из школ на Викиданных, чтобы было "legal form" = "Municipal". Причём Вы ссылаетесь на страницу неоднозначностей d:Q6936115, что недопустимо.
- phone number = (814)-73-32-19. Арина, Вы в курсе, что Викиданные ‒ это международный проект. Понятно, что с телефоном не так?..
- e-mail = https://derlyceum@mail.ru Опечатка, однако. Или Вы на самом деле считаете, что это нормальный email? -- Andrew Krizhanovsky (обсуждение) 14:44, 24 сентября 2017 (UTC)
Замечания те же. -- Andrew Krizhanovsky (обсуждение) 14:44, 24 сентября 2017 (UTC)
Замечания те же. -- Andrew Krizhanovsky (обсуждение) 14:44, 24 сентября 2017 (UTC)
email не даёт сохранить в ином формате, пишет "потеря схемы https" -- ArinaDemidova (обсуждение) 15:34, 24 сентября 2017 (UTC)
Все замечания учтены и исправлены, формат телефонов сделан международным (по версии google), email добавлена строка mailto:, сохранить позволил -- ArinaDemidova (обсуждение) 15:45, 24 сентября 2017 (UTC)
- @Арина Юрьевна, спасибо! Работа принята. -- Andrew Krizhanovsky (обсуждение) 16:42, 24 сентября 2017 (UTC)
Задачи на SPARQL
править- Найти школы в России, которым более 100 лет (country, inception).
- Показать диаграмму плотности школ в каждой стране на 1 кв.км. (country, area (в объекте страна)).
- Вывести города России и США, в которых находится больше всего школ, и количество школ в каждом городе (country, located in the administrative territorial entity)
Задача на троих
правитьДля итоговой работы нужно будет указать у известных людей школы, в которых они учились. Известные люди - это те, кто есть в Википедии. Школы тоже только те, что есть в Викиданных.
- Свойство educated at (P69). Но только для таких объектов (дополнительное ограничение), которые являются школами. Вот, например, 9580 человек (возможно, с повторами людей, если учились в нескольких школах за свою жизнь), которые учились в каких-либо школах: SPARQL-запрос
- Кстати, @Арина Юрьевна, в первом скрипте выбрано неудачное ограничение по Label, из-за которого оказалось, что в мире по Викиданным всего 227 школ. Это не так. В Викиданных 227 только таких школ, которые имеют сразу Label на русском и английском, а вообще их намного больше. Нужно написать такой скрипт, который будет выводить школы даже без заполненных полей Label. Поправьте, пожалуйста скрипт. -- Andrew Krizhanovsky, когда-то, пару дней назад :)
- ArinaDemidova (обсуждение) 22:39, 21 октября 2017 (UTC) Скрипт поправлен.
- Хороший запрос. Но хотелось бы видеть столбец Label по-русски и ещё один столбец по-английски. В тех случаях, когда эти пометы есть у объектов. См. пример у Елизаветы. Ну и чтобы записей не стало меньше. А столбец с Q-шками оставьте, конечно. Он удобен, чтобы по гиперссылкам переходить на объекты.
- Странно Вы пишите, @Арина Юрьевна: сначала подпись, затем текст. Обычно пишут наоборот. -- Andrew Krizhanovsky (обсуждение) 16:59, 22 октября 2017 (UTC)
- @Андрей Анатольевич, я не понимаю, как вообще с этим SPARQL работать, по примеру Елизаветы SPARQL-запрос у меня как раз выходит те 227 результатов что и были изначально, у неё тоже выводится только то, у чего заполнено и англ и рус лейблы. Смотрела примеры в интернете, смотрела примеры у других - не получается вообще понять, как на этом языке писать. Вообще не понятно какой у него синтаксис, есть ли переменные, что за названиия после знака "?", в одном случае я могу менять их название, в другом смена названия ломает весь скрипт, как можно использовать то, что не понмиаешь? Было бы неплохо, если бы у нас было хотя бы что-то в вводное по этому странному языку, хотя бы азы, хотя бы обычное объяснение синтаксиса, а то я бьюсь с этими запросами второй день, и как пальцев в воду сослепу тыкаю, ничего не понимаю. ArinaDemidova (обсуждение) 22:18, 28 октября 2017 (UTC)
- ArinaDemidova (обсуждение) 22:39, 21 октября 2017 (UTC) Скрипт поправлен.
Задачу решаете:
- вместе с Лайтинен Никитой Владимировичем, с его институтами РАН. Никите нужно будет свойство персон, но только не "учился", а "работал" (employer (P108)), не где-нибудь, а в институте РАН (ограничение).
- и вместе с Ведешкиным Сергеем Алексеевич, его перепрофилируем с издательств на вузы, по которым была написана статья в прошлом семестре (Университет). Поскольку статья про вузы уже написана, попрошу Сергея решить третью задачу про рейтинг вузов по наградам.
Итак, вот несколько формулировок одной и той же задачи на троих:
- Определить потоки известных персон из школ в вузы, затем в институты.
- Определить, какие школы растят таких хороших учёных, которые потом даже не портятся в вузах, а дорастают до работы в институтах?
- Если в два шага:
- Построить исходный ненаправленный граф, вершины которого соответствуют персонам, школам, вузам и институтам РАН. Если человек учился в некоторой школе и/или вузе, то такую персону и учебное заведение следует связать ребром, вес ребра ‒ единица.
- Удалив вершины-персоны, построить финальный орграф, где вершины связаны направленным ребром, соединяющим между собой школу, вуз или институт. Соединить дугой две такие организации, в которых учился или работал один и тот же человек.
- Пояснения ко второму шагу, построение "финального орграфа":
- Дуги идут от школ к вузам, институтам, от вузов к институтам.
- Ребро соединяет две школы, если какая-либо персона училась в двух этих школах. Аналогично рёбра могут соединять вузы. Рёбра могут соединять институты РАН.
- Вес дуги или ребра вычисляется так. Если два человека учились в школе А, затем в вузе Б, то дуга АБ имеет вес два. Если три человека учились в школе А и в школе Я, то ребро АЯ имеет вес три.
- Практические замечания.
- Полагаю, что для работы будет не обойтись без программирования на Питоне и проекта botva.
- Результат (граф) стройте в формате w:en:Gephi. Чтобы потом загрузить полученный граф в Gephi, покрутить его там, поанализировать, наделать скриншотов или видео и загрузить картинки на Викисклад. -- Andrew Krizhanovsky (обсуждение) 14:53, 16 октября 2017 (UTC)
- Практические замечания.
Загрузка иллюстраций
править@Андрей Анатольевич, иллюстрация загружена и отображена на странице, проверьте пожалуста, вроде все правила описания соблюдены. ArinaDemidova (обсуждение) 19:33, 11 ноября 2017 (UTC)
- @Арина Юрьевна, скриншот таблицы или какого-либо другого текста не является сколько-нибудь интересной визуализацией, достойной включения в статью. Такие иллюстрации не надо делать. Думайте о визаулизации данных, связанных со школами. Посмотрите примеры принятых работ. -- Andrew Krizhanovsky (обсуждение) 08:22, 12 ноября 2017 (UTC)
- @Андрей Анатольевич, более интересные иллюстрации в количестве двух штук загружены. ArinaDemidova (обсуждение) 19:22, 12 ноября 2017 (UTC)
- @Арина Юрьевна, очень хорошо.
- Уберите, пожалуйста, из статьи рисунок-скриншот таблицы. И поставьте этот файл commons:File:Count-of-schools-with-famous-students.png на удаление. См. справку commons:Commons:Criteria for speedy deletion.
- Напишите после "линейной диаграммы" пояснение и Ваш анализ - что изображено, какие можно сделать выводы.
- Переходы в разделе "Примечания" не работают.
- По поводу скрипта после текста "Таким образом, осталось 41 российских школ, по которым не удалось найти нужную информацию". Хотелось бы видеть в этом скрипте не просто Q-шки, а ещё название школ, например на русском языке. Сделаете? -- Andrew Krizhanovsky (обсуждение) 10:59, 13 ноября 2017 (UTC)
- @Арина Юрьевна, очень хорошо.
- @Андрей Анатольевич, замечания учтены. ArinaDemidova (обсуждение) 17:57, 18 ноября 2017 (UTC)
- Спасибо, Арина! -- Andrew Krizhanovsky (обсуждение) 06:30, 26 ноября 2017 (UTC)
- @Андрей Анатольевич, замечания учтены. ArinaDemidova (обсуждение) 17:57, 18 ноября 2017 (UTC)
Аннотация
править@Андрей Анатольевич, аннотация в статье написана. ArinaDemidova (обсуждение) 16:17, 19 ноября 2017 (UTC)
Упражнения
править@Андрей Анатольевич, упражнения сделаны. ArinaDemidova (обсуждение) 15:09, 26 ноября 2017 (UTC)
- @Арина Юрьевна, а можете сделать одно упражнение с картинками? -- Andrew Krizhanovsky (обсуждение) 09:37, 27 ноября 2017 (UTC)
Известные выпускники школ
правитьСписок школ в ВП, где перечислены известные ученики (на будущее задание "сотня", прошёлся только по Москве):
- Удалённый список, но у нас он есть: https://ru.wikipedia.org/w/index.php?title=%D0%A4%D0%B8%D0%B7%D0%B8%D0%BA%D0%BE-%D0%BC%D0%B0%D1%82%D0%B5%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BB%D0%B8%D1%86%D0%B5%D0%B9_%E2%84%96_239&oldid=59844700 "Физико-математический лицей № 239", см. раздел "Известные люди, учившиеся в школе".
- w:Лицей «Вторая школа», раздел "Известные люди, учившиеся в школе".
- w:Медведниковская гимназия
- w:Центр образования № 1239
- w:Школа № 1215 имени Ромена Роллана
- w:Школа № 1212 (Северо-Западный административный округ)
- w:Школа № 1414
- w:Школа № 1384 (внуков и внучек не надо брать)
- w:Лицей № 1581 -- Andrew Krizhanovsky (обсуждение) 13:11, 19 октября 2017 (UTC)
- @Андрей Анатольевич, я не поняла, что мне делать с этими данными в рамках задачи "Сотня". Какие объекты-то заполнять? те 82 русские школы, которые нашлись при выполнении задания "полнота википедии" с помощью SPARQL запроса? У них заполнять известных учеников что ли? Или у тех только, которые вы здесь обозначили? ArinaDemidova (обсуждение) 21:16, 28 октября 2017 (UTC)
- @Арина Юрьевна, я бы предложил и те, и другие школы обработать, но не более ста. Andrew Krizhanovsky (обсуждение) 18:47, 29 октября 2017 (UTC)
- По поводу вот этого SPARQL-запроса:
- Добавьте комментариев по-английски к строкам два и три.
- Добавьте столбец - число известных учеников по школе. У кого-то из студентов видел недавно похожий суммирующий SPARQL-скрипт.
- Почему только одна страна? У нашего отечества на Викиданных три страны. См. скрипты Максима.
- Отличная работа, Арина. Спасибо! -- Andrew Krizhanovsky (обсуждение) 18:47, 29 октября 2017 (UTC)
- @Андрей Анатольевич, Замечания по этому скрипту исправлены. ArinaDemidova (обсуждение) 15:14, 30 октября 2017 (UTC)
- Спасибо, Арина! -- Andrew Krizhanovsky (обсуждение) 06:29, 26 ноября 2017 (UTC)
Название статьи на Authorea
править- Географический и структурный анализ школ России
- Исследование школ России
- Викиданные и школы России
- Анализ Викиданных в контексте школ России
- Анализ школ России с помощью Викиданных
@Андрей Анатольевич, 5 названий представлены к выбору. ArinaDemidova (обсуждение) 15:38, 13 декабря 2017 (UTC)
@Андрей Анатольевич, русский/английский викиверситет о школах и статья на authorea исправлены. ArinaDemidova (обсуждение) 14:34, 14 декабря 2017 (UTC)
- @Арина Юрьевна, название предлагаю для Authorea и Научкора: "Географический анализ школ России и их выпускников". Статьи распечатал. Спасибо за работу! -- Andrew Krizhanovsky (обсуждение) 13:02, 15 декабря 2017 (UTC)