Обсуждение:Программирование Викиданных/Аниме
Задача по актёрам, озвучивающим аниме
править@Дарья Михайловна, набросал следующий скрипт: SPARQL-запрос, который предлагаю Вам взять за основу, разместить его на странице своей главы, добавить к нему входные данные с описанием.
И заняться анализом специалистов по сэйю и вообще Voice actor'ам (не владею терминологией, для краткости буду их называть "актёрами", если Вы знаете, как их правильно по-русски называют, то поправьте меня, пожалуйста). Хотелось бы увидеть следующее:
- упорядоченный список актёров по числу озвученных ими аниме,
- гистограмма, по оси X — число озвученных аниме (0, 1, 2 и так далее), по оси Y — число актёров, которые озвучили 0 аниме (наверное, таких нет), озвучили одно аниме (наверное, большинство актёров), озвучили по два аниме и так далее. См. гистограмму в главе Александра Дмитриевича Курбеева и СО его главы, где мы как раз обсуждали с ним подобную гистограмму.
- граф, связывающий друг с другом актёров через аниме, которые они вместе озвучивали. Вершины графа двух типов: аниме и актёры. Рёбра соединяют аниме и актёра, если актёр озвучивал аниме. SVG графа добавьте на Викисклад и вставьте в свою главу. Так же как и рисунок с гистограммой. -- Andrew Krizhanovsky (обсуждение) 14:57, 11 марта 2017 (UTC)
Аналогичная задача, только вместо актёров (voice actor) анализируются персонажи манг (characters). Вот скрипт: SPARQL-запрос. Даша, выбирайте, что Вам интереснее - с персонажами повозится или с актёрами? -- Andrew Krizhanovsky (обсуждение) 15:04, 11 марта 2017 (UTC)
- Скрипт с иллюстрациями -- Boollieva (обсуждение) 05:28, 6 июня 2017 (UTC)
- Викификация упражнений. -- Boollieva (обсуждение) 05:32, 6 июня 2017 (UTC)
Темпоральные странности
править- В 2017 г. число аниме - 683, в 2021 г. - всего 216. Предполагаю (не проверял), что общую категорию "аниме" делили на подкатегории по жанру/направлению.
- Также уменьшилось число сэйю в графовом запросе - с 826 до 284. Причина, вероятно, аналогична п. 1.
Жанры и подклассы аниме
править- @Евгений, с подклассами довольно легко разобраться. См. листинг 7.19 в нашем PDF-файл и описание к нему на предыдущей странице. Вот такой скрипт https://w.wiki/49yV даёт 4756 результатов (с учётом подклассов).
- Я бы предложил оставить первый скрипт (только везде вместо "[AUTO_LANGUAGE]" пишите "ja"). И добавить скрипт (или одну главную строчку из него), учитывающий подклассы. И дальше во всех скриптах использовать подклассы, поскольку получаем более полные результаты. (Используйте подклассы и в тех двух скриптах с графами, которые я привёл во ВКонтакте.)
- Перечислите в тексте самые популярные подклассы аниме в Викиданных с указанием числа объектов по подклассам. Посмотрите, как это сделано в тексте Елизаветы (см. листинг 2 и 3, таблицу 1). Хорошо, если Вы сошлётесь на этот труд в своей работе. --Andrew Krizhanovsky (обсуждение) 14:13, 2 октября 2021 (UTC)
- @Андрей Анатольевич, получился такой скрипт: https://w.wiki/4A9K. Проверьте его, пожалуйста, по возможности. Комментарии переведу позже, когда будет ясно, что скрипт верный. --Eugene Newman (обсуждение) 07:02, 3 октября 2021 (UTC)
- @Евгений, не хватало общего комментария, что же этот скрипт делает... Но я вспомнил, мы считаем количество аниме по подклассам. Вроде, всё хорошо.
- После скрипта опишите результаты и отметьте, что основная масса аниме попала в класс "аниме-сериал" (Q63952888) (2917 аниме, столько-то процентов от всех аниме). Отметьте, что эту классификацию нельзя назвать совершенной, здесь смешаны несколько классификаций: по форме вещания (OVA, ONA), по типу (аниме, аниме на основе манги), ещё какие-то можно выделить классификации? --Andrew Krizhanovsky (обсуждение) 08:40, 3 октября 2021 (UTC)
- Андрей Анатольевич, скрипт дополнен комментариями и размещён в первом разделе статьи. На английском Викиверситете также обновил скрипты с учётом локали. --Eugene Newman (обсуждение) 12:00, 3 октября 2021 (UTC)
- @Евгений, отлично! Прошёлся по первому разделу. Оставил кое-где запросы, чтобы Вы что-то добавили. Предлагаю вместо слова "поджанры" использовать "жанры", при этом продолжаем использовать слово "подклассы", когда говорим о подклассах аниме. Поправьте, пожалуйста, соответственно в других разделах. --Andrew Krizhanovsky (обсуждение) 19:04, 3 октября 2021 (UTC)
Рисунки
править- @Евгений, укажите, пожалуйста, в подписи к рисункам - год создания рисунка. --Andrew Krizhanovsky (обсуждение) 19:08, 3 октября 2021 (UTC)
- Рисунок на английском, к сожалению, не читабельный. Выберите фрагмент, чтобы в итоговой картинке текст был крупнее и читался.
- категории
- Женя, посмотрите любой рисунок в одной из принятых работ. Например, c:File:Logarithm of the number of cities having given number of sister cities according to Wikidata, 2020.png. Вы увидите, какую категорию решено ставить для рисунков нашего курса.
+ конкретно в этот рисунок (из Вашей статьи про аниме) можно добавить категорию "Аниме", наверняка такая есть на Викискладе. Если у категории "Аниме" есть более подходящая подкатегория (например, "графики аниме"), то лучше её указать. --Andrew Krizhanovsky (обсуждение) 19:14, 3 октября 2021 (UTC)
- Андрей Анатольевич, в соответствии с комментариями обновил рисунки и добавил источники в русскоязычную статью. --Eugene Newman (обсуждение) 15:40, 4 октября 2021 (UTC)
- @Евгений, спасибо за работу. По поводу второй ссылки (shikimori, 2021). Форум — это хорошо, но хотелось бы научную статью для ссылки. Вот 80 научных статей на Google Scholar по запросу (аниме тайтл японский). Читайте и выбирайте для ссылки.
- Такая внешняя ссылка [https://ru.wikipedia.org/wiki/%D0%95%D0%B2%D0%B0%D0%BD%D0%B3%D0%B5%D0%BB%D0%B8%D0%BE%D0%BD «Евангелион»] в вики-проектах не годится. Здесь нужна специальная короткая ссылка на сестринские проекты, см. w:en:Help:Interwiki linking. См. столбец Shortcut в таблице. У Вас несколько раз в статье встречаются ссылки; поправьте их, пожалуйста.
- В хорошо оформленных текстах не принято сокращение "г.". Поэтому вместо "(2021 г.)" пишите (2021) или (2021 год).
- Английский рисунок меня порадовал. Для Викиверситета отлично годится. Когда будете этот рисунок копировать в LaTeX, то сделайте скриншот ещё раза в 2-3 крупнее, поскольку в книге не получится раскрыть на весь экран.
- Для Вашего удобства, если будете делать новые версии рисунков в будущем, то не создавайте новый файл с новым описанием на Викискладе, а грузите новый файл поверх старого. На странице с рисунком (на Викискладе) есть ссылка "Upload a new version of this file". Нужно только комментарий написать при загрузке - что именно изменилось в новой версии. --Andrew Krizhanovsky (обсуждение) 18:21, 4 октября 2021 (UTC)
- Андрей Анатольевич, спасибо за комментарии. Пункты 1-3 внёс в статью с последними правками. --Eugene Newman (обсуждение) 13:05, 5 октября 2021 (UTC)
Статья Кузьминой на Elibrary
править@Евгений, спасибо. Правда, у меня не получается скачать статью Кузьминой (Д. П. Кузьмина, «Аниме: от социализации к межкультурной коммуникации», 2021). А у Вас? --Andrew Krizhanovsky (обсуждение) 14:55, 6 октября 2021 (UTC)
- Андрей Анатольевич, да, со скачиванием с Elibrary есть некоторые трудности. Но в других работах, что я просмотрел, определения тайтла в явном виде я не обнаружил, в этой же оно есть уже в результатах поиска, то есть и в полном тексте оно, очевидно, будет. --Eugene Newman (обсуждение) 15:06, 6 октября 2021 (UTC)
- @Женя, поскольку мы пишем для людей, а не для галочки, то хотелось бы иметь доступ к материалам, на которые ссылаемся. Варинты: (1) найти эту же статью онлайн где-то в сети и поставить на ней ссылку, (2) сослаться на другую статью, более доступную. --Andrew Krizhanovsky (обсуждение) 15:31, 6 октября 2021 (UTC)
- Андрей Анатольевич, удалось найти "тайтл" в Викисловаре. Странно, что Яндекс не видел эту страницу (просто привык пользоваться Яндексом). Такой вариант подойдёт? --Eugene Newman (обсуждение) 15:44, 6 октября 2021 (UTC)
- @Евгений, про авторитетные источники я ещё буду рассказывать на лекции. Если в двух словах, то вики-проекты (Википедия, Викисловарь) не являются АИ. Подробности здесь: w:ВП:АИ. Поэтому ответ: нет, к сожалению, не подойдёт. --Andrew Krizhanovsky (обсуждение) 16:13, 6 октября 2021 (UTC)
- Андрей Анатольевич, статью можно выкачать, если авторизоваться на Elibrary. По крайней мере, при авторизации через сети университета или "Ситилинка" полный текст доступен. PDF у меня скачан. Других научных работ, где бы упоминалось определение слова "тайтл", в общем доступе я так и не встретил. Возможно ли в таком случае откатиться к использованию статьи Кузьминой? --Eugene Newman (обсуждение) 11:30, 7 октября 2021 (UTC)
- @Евгений, предлагаю такой вариант. Если хотите, то можете оставить ссылку на Кузьмину. И добавьте, пожалуйста, ссылку на статью: История появления первых японских комиксов на русском языке. Таки целый журнал есть "Японские исследования"! На 18 с. статьи есть определение термина "тайтл". Предлагаю целиком взять это определение и сослаться на статью.
- Не уверен, что такая ссылка будет нам нужна в английской версии, поскольку "английское" title, вряд ли, также специфично, как русское "тайтл". --Andrew Krizhanovsky (обсуждение) 17:12, 7 октября 2021 (UTC)
- Андрей Анатольевич, решил сохранить оба определения. Спасибо. --Eugene Newman (обсуждение) 17:29, 7 октября 2021 (UTC)
- Отлично! --Andrew Krizhanovsky (обсуждение) 17:43, 7 октября 2021 (UTC)
- Андрей Анатольевич, решил сохранить оба определения. Спасибо. --Eugene Newman (обсуждение) 17:29, 7 октября 2021 (UTC)
- Андрей Анатольевич, статью можно выкачать, если авторизоваться на Elibrary. По крайней мере, при авторизации через сети университета или "Ситилинка" полный текст доступен. PDF у меня скачан. Других научных работ, где бы упоминалось определение слова "тайтл", в общем доступе я так и не встретил. Возможно ли в таком случае откатиться к использованию статьи Кузьминой? --Eugene Newman (обсуждение) 11:30, 7 октября 2021 (UTC)
- @Евгений, про авторитетные источники я ещё буду рассказывать на лекции. Если в двух словах, то вики-проекты (Википедия, Викисловарь) не являются АИ. Подробности здесь: w:ВП:АИ. Поэтому ответ: нет, к сожалению, не подойдёт. --Andrew Krizhanovsky (обсуждение) 16:13, 6 октября 2021 (UTC)
- Андрей Анатольевич, удалось найти "тайтл" в Викисловаре. Странно, что Яндекс не видел эту страницу (просто привык пользоваться Яндексом). Такой вариант подойдёт? --Eugene Newman (обсуждение) 15:44, 6 октября 2021 (UTC)
- @Женя, поскольку мы пишем для людей, а не для галочки, то хотелось бы иметь доступ к материалам, на которые ссылаемся. Варинты: (1) найти эту же статью онлайн где-то в сети и поставить на ней ссылку, (2) сослаться на другую статью, более доступную. --Andrew Krizhanovsky (обсуждение) 15:31, 6 октября 2021 (UTC)
Обложка статьи в английском LaTeX
править@Андрей Анатольевич, добавил вариант оформления аннотации своего раздела на GitHub. В качестве обложки использовал этот файл, однако а) он в довольно посредственном качестве; б) в поле нет текста, из-за чего обложка кажется пустой. Лицензия Creative Commons Attribution-Share Alike 3.0 Unported, насколько я понимаю, позволяет редактировать изображение, так что, если есть необходимость, я мог бы попробовать увеличить его разрешение и что-то написать в табличке. Ещё есть, например, такой вариант, но он вертикальный, так что если и использовать его, то только добавив белые поля (а это, как я понимаю, тоже акт редактирования).
- @Евгений, добрый день. Не забывайте подписываться, пожалуйста. Да, файлы Викисклада можно редактировать и загружать снова на Викисклад или использовать в любых целях. Согласен, что можно что-то написать в табличке, но качество оставляет желать лучшего, маловаты картинки. Добавил на эту страницу (справа) ещё фото с большим качеством, вроде, это аниме. И ещё есть рисунке на странице автора с открытой лицензией. Можете там выбрать. --Andrew Krizhanovsky (обсуждение) 07:15, 12 октября 2021 (UTC)
- @Андрей Анатольевич, спасибо за предложение. Однако не уверен, что этот персонаж подойдёт: Krita - это графический редактор, а Kiki - соответственно, маскот этого ПО. Стилистика напоминает аниме, согласен, но правильно ли будет добавлять обложку с ним для иллюстрации статьи? --Eugene Newman (обсуждение) 12:54, 12 октября 2021 (UTC)
- @Евгений, поскольку это учебник для, в первую очередь, школьников, то красота, на мой взгляд, важнее точности. Красота иллюстрации. Но Вы хозяин этой главы, поэтому Вам решать. Плюс ещё в том, что можно заодно пояснить школьникам, что такое маскот — как связаны животные, изящные искусства и программирование. Есть ещё поисковик https://search.creativecommons.org, можно там поискать. --Andrew Krizhanovsky (обсуждение) 15:12, 12 октября 2021 (UTC)
- @Андрей Анатольевич, спасибо, полезный ресурс. Всё же я остановился на варианте с Kiki. В выборке на Creative Commons мне понравился только один рисунок, но у него лицензия NC-ND, и для Викисклада он не подошёл. Финальную версию загрузил в репозиторий. --Eugene Newman (обсуждение) 16:57, 12 октября 2021 (UTC)
- @Евгений, отличная картинка, но её сплющило в PDF. Может, обрезать по уши маскота? То есть верхнего лебедя почти убрать, нижнего лебедя оставить. Как думаете? Если картинка совсем испортится с таким кропом, то оставить как есть. --Andrew Krizhanovsky (обсуждение) 18:01, 12 октября 2021 (UTC)
- @Андрей Анатольевич, согласен, с обрезанной картинкой получше. GitHub обновил. --Eugene Newman (обсуждение) 20:03, 12 октября 2021 (UTC)
- Отлично, Евгений. Вполне волшебно получилось. Спасибо! --Andrew Krizhanovsky (обсуждение) 06:18, 13 октября 2021 (UTC)
- @Андрей Анатольевич, согласен, с обрезанной картинкой получше. GitHub обновил. --Eugene Newman (обсуждение) 20:03, 12 октября 2021 (UTC)
- @Евгений, отличная картинка, но её сплющило в PDF. Может, обрезать по уши маскота? То есть верхнего лебедя почти убрать, нижнего лебедя оставить. Как думаете? Если картинка совсем испортится с таким кропом, то оставить как есть. --Andrew Krizhanovsky (обсуждение) 18:01, 12 октября 2021 (UTC)
- @Андрей Анатольевич, спасибо, полезный ресурс. Всё же я остановился на варианте с Kiki. В выборке на Creative Commons мне понравился только один рисунок, но у него лицензия NC-ND, и для Викисклада он не подошёл. Финальную версию загрузил в репозиторий. --Eugene Newman (обсуждение) 16:57, 12 октября 2021 (UTC)
- @Евгений, поскольку это учебник для, в первую очередь, школьников, то красота, на мой взгляд, важнее точности. Красота иллюстрации. Но Вы хозяин этой главы, поэтому Вам решать. Плюс ещё в том, что можно заодно пояснить школьникам, что такое маскот — как связаны животные, изящные искусства и программирование. Есть ещё поисковик https://search.creativecommons.org, можно там поискать. --Andrew Krizhanovsky (обсуждение) 15:12, 12 октября 2021 (UTC)
Граф, связывающий сэйю и озвученные ими аниме
править@Евгений, вопрос по скрипту w.wiki/49$8, по предпоследней строчке:
BIND(IF(?toggle,"",?anime) AS ?link).
Что она означает? Что изменится, если вместо неё написать:
BIND(IF(?toggle,?seiyu,?anime) AS ?link).
Возможно, будет легче понять результат скрипта в виде списка, для этого нужно убрать или нарушить вторую строчку (#defaultView:Graph). --Andrew Krizhanovsky (обсуждение) 06:24, 14 октября 2021 (UTC)
- @Андрей Анатольевич, если честно, затрудняюсь вспомнить, почему я остановился именно на варианте в скрипте https://w.wiki/49$8. Я, кажется, решил, что в варианте https://w.wiki/4DUM некорректно отображались дуги в графе (возможно, я потом изменил что-то ещё, и граф стал нормальным). Однако первый вариант возвращает 500 результатов, второй - 538. --Eugene Newman (обсуждение) 12:05, 14 октября 2021 (UTC)
Гистограмма по числу сэйю, озвучивших одно и более аниме
править@Евгений, если использовать логарифмическую шкалу, то лучше будет видно кривую? --Andrew Krizhanovsky (обсуждение) 09:38, 15 октября 2021 (UTC)
- @Андрей Анатольевич, пробовал такой способ логарифмирования в SPARQL, однако в скрипте этот вариант вызывает ошибку java.lang.IllegalArgumentException: Not an aggregate. Не подскажете, как правильно пользоваться логарифмированием? Спасибо. --Eugene Newman (обсуждение) 07:32, 16 октября 2021 (UTC)
Идеи для SPARQL-задач
править@Андрей Анатольевич, есть такие идеи для новых скриптов:
- отметить на карте места рождения сэйю (предположить, какой регион «самый богатый на таланты»);
- построить гистограмму/bubble chart национальностей сэйю (среди них должны быть и не-японцы);
- построить гистограмму количества вышедших аниме по годам или количества сэйю по годам рождения. --Eugene Newman (обсуждение) 07:38, 16 октября 2021 (UTC)
- @Евгений, отлично! Добавьте эти три задачи в раздел "Будущая работа" в Вашей статье.
- Вы меня натолкнули на следующую идею. Зная год выпуска аниме и дату рождения актёра, можно подсчитать в каком возрасте сейю озвучил некоторую роль. Посмотрите в работе «Ранжирование отечественных математиков и научных сообществ мира» рис. 4, 5, 6. Можно нарисовать подобный график, где по оси X указан возраст сейю, по оси Y — число аниме, озвученных в возрасте X.
- Тогда означает, что в возрасте было озвучено аниме суммарно по всем сейю и аниме.
- В решении этой задачи я не ограничиваю Вас требованием сделать всё в одном скрипте и только в Wikidata Query Service (WDQS). Вы можете разбить задачу на несколько запросов. Сохранить полученные данные из WDQS в табличном формате (в CSV), затем загрузить в Excel (или любую программу, или воспользоваться каким-либо языком программирования) и нарисовать красивый график. В Викиверситете нужно описать ключевые моменты решения и показать иллюстрацию. --Andrew Krizhanovsky (обсуждение) 08:08, 16 октября 2021 (UTC)
- @Андрей Анатольевич, есть первый вариант решения.
- В SPARQL:
- Экспортируем результаты в csv-файлы. Гистограмму строим средствами Python (блокнот на Google Colab).
- Интересные моменты, возникшие в ходе решения:
- в SPARQL-скрипте (1) строка SERVICE почему-то работает не так, как в остальных скриптах: список имён сэйю вернулся на английском и частично почему-то на арабском, хотя в остальных двух скриптах список русско-английско-японский, как и ожидалось;
- в данных есть забавные моменты, когда сэйю родился(-ась) позже, когда вышло аниме с его (её) участием. Предполагаю, что это связано с отсутствием информации на Вики о втором сезоне/перезапуске аниме. В логах Python выводятся сообщения о таких фактах со ссылками на объекты Викиданных.
- Заранее спасибо за комментарии. --Eugene Newman (обсуждение) 09:29, 17 октября 2021 (UTC)
- @Евгений, здорово всё получилось! Скрипт "получаем список ссылок со страниц сэйю на аниме и наоборот" немного поправил по оформлению, лучше так (поправил комментарий в строке 11).
- Три листинга приведите в Викиверситете, а в тексте LaTeX'а листингов не надо, только ссылки на скрипты.
- Картинку можно загружать на Викисклад. + Аналогичная картинка, где подписи осей по-русски, тоже загрузите, пожалуйста, на Викисклад. Название (вверху) обрежьте, подпись будет текстом, под картинкой.
- Логично было бы поставить из текста ссылку на блокнот на Google Colab. Как это сделать более перманентно на будущее? Можете сохранить на GitHub в проект wd_book? --Andrew Krizhanovsky (обсуждение) 11:26, 17 октября 2021 (UTC)
- @Андрей Анатольевич, добавил раздел 4 в русскоязычную статью. Если у Вас не будет по нему замечаний, переведу на английский. Удобно ли, что я добавил Python-код и csv-файлы в отдельный каталог на GitHub, или же перенести файлы в другое место? --Eugene Newman (обсуждение) 12:40, 17 октября 2021 (UTC)
- @Евгений, скрипт отлично разместили на GitHub. Здорово, что GitHub сразу исполняет .ipynb файл при его просмотре на сайте.
- Здесь точка лишняя: SERVICE wikibase:label { bd:serviceParam wikibase:language "ru,en,ja". }, предлагаю такой вариант (немного поправил комментарий): https://w.wiki/4EMG
- Вопросы к этому же скрипту. Сейчас 7-ая строчка "SERVICE wikibase:label..." бесполезна (уберёте?), поскольку Вы получаете ?seiyuLabel не через "SERVICE wikibase:label...", а с помощью конструкции SAMPLE. Постарайтесь добавить два пояснения к этому скрипту: (1) зачем нужна группировка GROUP BY, (2) почему нельзя использовать напрямую ?seiyuLabel в SELECT, как мы это делаем в других скриптах, а нужно изголяться с rdfs:label и с SAMPLE. Благодаря этим пояснениям скрипт становится настолько интересным, что листинг и пояснения предлагаю тоже добавить в LaTeX.
- Во втором и третьем скриптах есть в листинге "GROUP BY" в последней строке, в скрипте по ссылке группировки нет. Опечатки.
- Читателю удобнее будет пойти по ссылке сразу на файл age_act_hist.ipynb, чтобы увидеть результаты вычислений.
- Текст из раздела "Интересные наблюдения" предлагаю оставить, не выделяя в отдельный подраздел. Там же, после рисунка. И приведите один или два конкретных примера этих странностей в Викиданных, с указанием, что так на 2021 год.
- В "будущей работе" в пункте 5 используйте русское название типа диаграммы для "bubble chart".
- Можете переводить на английский. --Andrew Krizhanovsky (обсуждение) 13:46, 17 октября 2021 (UTC)
- @Андрей Анатольевич, по комментариям к скрипту:
- зачем нужна группировка GROUP BY - если не ошибаюсь, она нужна для привязки идентификатора объекта сэйю к метке: как говорится в учебнике, "We GROUP BY both variables ?mother and ?motherLabel because if we would leave out the label we would end up with an error "Bad Aggregate";
- почему нельзя использовать напрямую ?seiyuLabel в SELECT: если честно, затрудняюсь сказать. Кажется, я просто модифицировал один из старых скриптов, где было сделано через SAMPLE. Про rdfs:label здесь (Query #5) написано, что это просто "a common predicate for giving a human-friendly label to a resource". За размышлениями у меня появился вариант скрипта с "обычной" меткой. К тому же такое решение справляется с проблемой, что имена сэйю возвращаются только на английском. Может быть, просто заменить нынешний скрипт на него? --Eugene Newman (обсуждение) 13:15, 19 октября 2021 (UTC)
- @Евгений, по поводу 1. GROUP BY. Мне очень нравится, что теперь у нас есть два варианта скрипта: раз и два (во втором Вашем скрипте поправил комментарии). Хотелось бы увидеть параллельно эти два листинга в латехе. Вероятно, без занятия полей не обойтись, тогда на всю ширну страницы fullwidth*. Нашёл два примера оформления: первый и второй. Первый как-то попроще. Мне, как читателю, нравятся задания "найди картинки", в том числе для листингов.
- И, наверное, небольшие комментарии после или до скриптов, чем они отличаются. Как раз и про GROUP BY можно будет ввернуть комментарий. --Andrew Krizhanovsky (обсуждение) 09:25, 20 октября 2021 (UTC)
- @Андрей Анатольевич, по комментариям к скрипту:
Вспоминается милый отрывок:
Юрий Коваль, Пять похищенных монахов:
Похититель сидел в кресле, держа в руках журнал. Он разглядывал в журнале две картинки, на вид совершенно одинаковые. На одной был нарисован барсук, и на другой – барсук. Под барсуками было напечатано мелким шрифтом: «Найдите на этих картинках шестнадцать различий».
Прицеливаясь взглядом то в одного барсука, то в другого, Похититель искал различия.
«Ага, – думал он, – у этого барсука две ноги, а у этого три. Вот вам и различие».
Довольно скоро Похититель справился с этим нехитрым делом и вдруг неожиданно для себя обнаружил семнадцатое.
«Что за чертовщина! – подумал Похититель и принялся раздраженно подсчитывать различия, загибая пальцы. – Так точно – семнадцать!»
Похититель отбросил журнал, достал лист бумаги и ручку. Он решил немедленно написать письмо в редакцию и обругать сотрудников покрепче. Некоторое время сидел он задумавшись. Хотелось сразу же, с первой строчки, уязвить редакцию, но ничего особо хлесткого он придумать не мог и начал так:
«Дорогие товарищи! Недавно я смотрел тут на ваших барсуков…»
Вот. --Andrew Krizhanovsky (обсуждение) 09:25, 20 октября 2021 (UTC)
Перенос статьи в русский LaTeX
править@Андрей Анатольевич, перенёс в LaTeX первый раздел (первые 3 листинга). Посмотрите, пожалуйста, как будет время. Ошибка с файлом listings_python.prf, к счастью, компиляции не мешала. Надеюсь, позднее разберусь и с ней.
По оформлению предлагаю пару вопросов для обсуждения:
1. Заметил странность при оформлении ссылок: иногда LaTeX пропускает номера. Первый пример из ранее созданной статьи про самолёты (пропущен номер 6), второй - из моей (пропущен номер 5).
2. Возможно ли модифицировать шаблон для оформления скриптов, чтобы текст автоматически переносился на новую строку? В статьях предыдущих авторов я тоже видел, как скобки заходят за поля, но у них это не столь заметно. Пример проблемы.
Заранее спасибо за рекомендации. --Eugene Newman (обсуждение) 12:38, 23 октября 2021 (UTC)
- @Евгений, хорошо, посмотрю. Ответы на вопросы.
- Странная странность с пропуском номеров. Пока не знаю, что с этим делать.
- Здесь на перенос не надеемся. Варианты: (1) оформляем листинг на всю ширину страницы, (2) делаем более короткие строки. Конкретно здесь можно ужаться так: (1) перенести "WHERE" на следующую строку, (2) в нулевой строке перенести последнее слово, (3) в пятой строке укоротить комментариц "and their" → "with", (4) в SERVICE убрать точку, убрать лишние пробелы внутри скобок, сдвинуть влево. И комментарий если в первой строке не умещается, то вторую строку тоже начните с диеза "#". --Andrew Krizhanovsky (обсуждение) 15:48, 23 октября 2021 (UTC)
- @Андрей Анатольевич, полный текст статьи перенёс в LaTeX. Посмотрите, пожалуйста, по возможности. Однако осталась ещё пара вопросов для обсуждения.
- В основном я опирался на раздел aircrafts как пример, и мне осталось не очень ясным, какие ссылки нужно оформлять просто как \href, а какие - оборачивать в \cite и вносить в библиографию. Уточните этот момент, пожалуйста.
- Сделать в разделе про возраст озвучки (с новой задачей) скрипты в двух колонках у меня, к сожалению, не вышло. fullwidth почему-то работать у меня отказался. Я применял такой код, но скрипты всё равно шли друг за другом.
- Буду благодарен за Ваши комментарии. --Eugene Newman (обсуждение) 16:35, 27 октября 2021 (UTC)
- Спасибо, @Евгений, за работу. Посмотрю обязательно.
- \cite или \href можно обсудить на занятие. Напомните, пожалуйста. --Andrew Krizhanovsky (обсуждение) 18:17, 27 октября 2021 (UTC)
- @Андрей Анатольевич, не подскажете, где можно посмотреть примеры оформления ссылок на полях без внесения в библиографию в LaTeX? Я смотрел уже существующие статьи, но, например, в Населённых пунктах в библиографию вынесены все ссылки, даже на обычные веб-ресурсы. Спасибо. --Eugene Newman (обсуждение) Eugene Newman (обсуждение) 10:19, 30 октября 2021 (UTC)
- @Евгений, в этом учебнике к стилевому файлу Tufte-LaTeX на с. 21 есть \footnote. Тогда Вы можете вынести текст, включающий гиперссылку на какой-либо материал, на поля. Если на какой-то источник Вы хотите сослаться несколько раз, то целесообразнее будет оформить ссылку как библиографическую с обязательной её публикацией в разделе "Литература".
- Ещё предложение. Попробуйте использовать короткий вариант ссылки на литературу для полей и длинный для раздела "Литература", см. рецепт: citations shorter in the margin, detailed in the list. Для этого нужно будет добавить одну команду \shortcite в главный файл русского LaTeX. Если у Вас получится, то обяжем всех использовать \shortcite вместо \cite. --Andrew Krizhanovsky (обсуждение) 11:19, 30 октября 2021 (UTC)
- @Андрей Анатольевич, обработал Ваши рекомендации по первым четырём разделам (до графа включительно), а также раздел упражнений. Проверьте, пожалуйста.
- Пока у меня есть предложение и вопрос.
- Предложение: может быть, стоит добавить pdf-файлы в .gitignore? Ясно, что в репозитории они не нужны, но перед коммитом порой хочется ещё раз проверить правки, а компилировать заново/восстанавливать файл из корзины не хочется :) Заодно никто случайно не выложит pdf.
- Вопрос: размышляю, как лучше расположить граф связи сэйю и аниме. Если его просто расширять, то он уходит на следующую страницу, и LaTeX начинает писать перед графом новый раздел (что усложняет читаемость, как на скриншоте). Пока я расположил граф в начале новой страницы, но так остаётся много пустого места, так как под листингом писать больше особенно нечего, только короткий комментарий про функцию BIND.
- Спасибо за обсуждение. --Eugene Newman (обсуждение) 08:45, 31 октября 2021 (UTC)
- @Евгений, спасибо за работу! Это очень хорошая идея — добавить *.pdf в .gitignore. Добавьте, пожалуйста.
- У рисунков в LaTeX есть ключ h и H (забыл в чём разница). Эти ключи означают, что нужно расположить рисунок именно здесь (h от слова here), + ещё восклицательный знак "!" какое-то магическое действие имеет. Поэкспериментируйте. По умолчанию LaTeX ведёт себя очень вольно с местоположением иллюстрации, пытаясь оптимально расположить текст на странице. Можно этими ключами добавить ограничение на местоположение картинки относительно текста. --Andrew Krizhanovsky (обсуждение) 09:00, 31 октября 2021 (UTC)
- @Андрей Анатольевич, первоначальный вариант правок внёс по всей статье. Есть ещё пара моментов, которую можно обсудить:
- По позиции графа более интересного решения, чем перенос на следующую страницу, найти не смог. "!" не меняет поведение LaTeX'а, а если вместо h написать H, то компилятор ругается на неизвестную опцию. В сети описания модификатора H тоже не нашёл. Наверное, какой-то пакет его определяет (я видел что-то подобное, когда писал курсовую в LaTeX пару лет назад), но в нашей сборке его, вероятно, нет.
- По поводу количества аниме в секции про полноту. Я считал его так: открывал на сайте меню поиска, смотрел число аниме на одной странице, число страниц поиска и умножал одно на другое. Цифры в разделе должны быть актуальными, т.к. я обновлял их где-то неделю назад.
- Вышлите, пожалуйста, в беседу ВКонтакте ссылку на сервис сокращения ссылок. У меня пока везде стоит clck.ru, но это временная мера. Потом переделаю через нужный сервис.
- Не очень понял последнее замечание в разделе про возраст сэйю: "Поставьте на поля цитату из фильма "Формула любви"..." Если честно, не уверен, что такая цитата хорошо бы согласовалась с тематикой всей статьи, посвящённой не отечественному, а японскому кинематографу.
- Спасибо за разъяснения. --Eugene Newman (обсуждение) 14:35, 2 ноября 2021 (UTC)
- @Андрей Анатольевич, первоначальный вариант правок внёс по всей статье. Есть ещё пара моментов, которую можно обсудить:
- @Евгений, хорошо.
- Хорошо.
- Ссылка: URL Shortener
- Это я увлёкся. Хорошо, не надо здесь цитаты. --Andrew Krizhanovsky (обсуждение) 15:40, 2 ноября 2021 (UTC)
Русский LaTeX от 12.11
правитьЗдравствуйте, Андрей Анатольевич. В основном правки от прошлой пятницы обработал и выложил на GitHub. К индексированию ключевых слов пока не приступал, хочу перейти, когда обсудим основные моменты по статье. Вопросы у меня следующие:
- Раздел "Экземпляры объекта Аниме":
- напишите, пожалуйста, комментарий про "короткие ссылки на полях и длинные в списке литературы";
- допустимо ли добавлять иллюстрации с Rawgraphs в png-формате? SVG LaTeX у меня принимать отказался, а попытка сконвертировать в подходщий формат (https://tex.stackexchange.com/a/2107/255230) из Linux-подсистемы Windows отправила ноутбук в перезагрузку, и дальше экспериментировать я побоялся :)
- Раздел "Список сэйю, упорядоченный..."
- Какого типа график Вы подразумевали добавить для листинга 6.5? Если нужен просто линейный график, но сделанный в Rawgraphs (как у меня есть сейчас), то а) он громоздкий, и при попытке разместить его на полях он становится нечитаемым; б) он просто дублирует содержание графика, полученного средствами SPARQL. Важен ли он, или можно его убрать, чтобы не перегружать статью?
- Упражнения:
- "сэйю-женщина" пишется через дефис, см. http://www.bolshoyvopros.ru/questions/3776975-kak-pishetsja-muzhchina-vrach-ili-muzhchina-vrach-pochemu.html#answer10968625
Спасибо за комментарии. --Eugene Newman (обсуждение) 18:07, 15 ноября 2021 (UTC)
- @Евгений, добрый день. Отвечаю на вопросы.
- 1.1. Вот пример команды, который создаётся в главном файле русского латеха: https://groups.google.com/g/tufte-latex/c/4fKzsy-VRmI Поэкспериментируйте, пожалуйста.
- 1.2. Пока SVG не пробовал включать в PDF, хотя пишут что это возможно. Поэтому включайте в PNG формате.
- 2. Хорошо, понял. Тогда не надо дублирующего графика.
- 3. Спасибо! --Andrew Krizhanovsky (обсуждение) 15:02, 16 ноября 2021 (UTC)
- @Андрей Анатольевич, график-дубликат удалил. Заменил ссылки на статьи и ProWD на краткие. Получились ссылки вида "фамилия_автора, год", например, "Кузьмина, 2018". Также добавил в индекс ссылки на команды SPARQL и графики своей главы. Посмотрите, пожалуйста, по возможности. --Eugene Newman (обсуждение) 18:21, 16 ноября 2021 (UTC)
Русский LaTeX от 19.11
правитьЗдравствуйте, Андрей Анатольевич. Изменения текущей итерации внёс, вопросы такие:
- Стр. 41: может быть, ссылку на cadelta.ru оформить как-то иначе? Надпись на полях "Slowpoke 2020" выглядит, как по мне, несколько странно. Tsar Slowpoke - это явно неформальный никнейм, да и сайт не претендует на то, чтобы быть АИ.
- Стр. 43: по проблеме с нумерацией, к сожалению, новых идей на решение у меня нет. Я использую тег \footnote, который, по идее, не предполагает ручной расстановки нумерации, а то, что LaTeX делает автоматически, не всегда верно. Подобный баг я видел ещё в октябре (в разделе обсуждения "Перенос статьи в русский LaTeX" есть об этом комментарии от 23 октября).
- Стр. 49: по поводу формулировки вывода о полноте Викиданных. К сожалению, оригинал уже утерян, но Вами была предложена формулировка наподобие "новые аниме выходят быстрее, чем заполняется информация о них в Викиданных". Я просто подумал, что такая формулировка довольно формальная, и тот вариант, что есть сейчас (про несоответствие качества и количества данных), может быть воспринят читателем более легко и забавно.
Спасибо за обсуждение. --Eugene Newman (обсуждение) 17:14, 20 ноября 2021 (UTC)
Английский LaTeX: 26.11-03.12
правитьАндрей Анатольевич, проверьте, пожалуйста, изменения в первом разделе и дополненный второй. Спасибо. --Eugene Newman (обсуждение) 17:00, 29 ноября 2021 (UTC)
- Есть ли в англоязычном шаблоне аналог команды wdProperty? В примерах я видел только такое оформление: \href{https://www.wikidata.org/wiki/Property:P31}{instance of (P31)}, а при попытке написать \wdProperty{} компилятор ругается. --Eugene Newman (обсуждение) 19:45, 29 ноября 2021 (UTC)
- Андрей Анатольевич, если Вы ещё не приступали к проверке, можно будет ещё взглянуть на раздел с графиком сэйю и числа озвученных ими аниме. --Eugene Newman (обсуждение) 13:28, 30 ноября 2021 (UTC)
- @Евгений, изменения проверю, спасибо! Не понял последнего предложения: "можно будет ещё взглянуть на раздел..." Кому можно (мне или Вам)? Ещё не приступал к проверке. Надеюсь, что завтра. --Andrew Krizhanovsky (обсуждение) 20:51, 1 декабря 2021 (UTC)
- @Андрей Анатольевич, я имел в виду, что раздел с графиком готов, и его можно проверять. Также я заменил href на свойство Р31 на wdProperty, так что на GitHub уже версия с wdProperty (относительно прошлой изменилась одна строчка). --Eugene Newman (обсуждение) 12:14, 2 декабря 2021 (UTC)
- @Евгений, изменения проверю, спасибо! Не понял последнего предложения: "можно будет ещё взглянуть на раздел..." Кому можно (мне или Вам)? Ещё не приступал к проверке. Надеюсь, что завтра. --Andrew Krizhanovsky (обсуждение) 20:51, 1 декабря 2021 (UTC)
- Андрей Анатольевич, если Вы ещё не приступали к проверке, можно будет ещё взглянуть на раздел с графиком сэйю и числа озвученных ими аниме. --Eugene Newman (обсуждение) 13:28, 30 ноября 2021 (UTC)
Английский LaTeX: 03.12-10.12
правитьАндрей Анатольевич, разобрал правки в английской версии по Вашему списку. Правда, ещё думаю насчёт расположения sunburst-диаграммы распределения аниме по жанрам (рис. 6.2). Текущий вариант получилось уместить, только убрав описание "Стального алхимика" в нижний колонтитул, т.к. иначе диаграмма либо перекрывала текст на полях, либо "уползала" слишком далеко от своего упоминания в тексте. Если у Вас есть другие идеи насчёт её расположения, напишите, пожалуйста. Также за эту неделю планирую добавить раздел с графом. Когда сделаю, напишу здесь. --Eugene Newman (обсуждение) 11:17, 4 декабря 2021 (UTC)
- @Андрей Анатольевич, я добавил в английскую версию раздел с графом, его можно проверять. Также вносил мелкие правки в русский Latex, убрал некоторые недочёты по типу уехавших комментариев в скриптах. Нашёл пару странностей:
- окружение \widepar в английском Latex перекрывает caption к скриптам, в то время как \fullwidth в русском просто переносит подпись под скрипт. См. листинги 6.2 и 6.6 в английской версии. Как вариант решения - дать комментарий к скрипту обычным текстом после него, но это будет не единообразно с другими скриптами;
- \autocite в русской версии не отображает ссылку при повторном её использовании: для строки 31 (файла ru/chapter/anime.tex) ссылка на Shikimori отображается нормально, а для строки 239 вместо ссылки в PDF отображается просто точка. Если не будет идей, как это исправить, предлагаю убрать \autocite из строки 31. Тогда в 239 отображаться будет правильно, т.к. ссылка используется только единожды, я это проверял.
- Спасибо за обсуждение. --Eugene Newman (обсуждение) 12:12, 5 декабря 2021 (UTC)
- @Евгений Олегович, спасибо, что для моего удобства указываете номера листингов.
- По рис. 6.2 "Sunburst diagram". Хочу попробовать сделать его посимпатичнее. Загрузите этот рисунок в SVG на Викисклад и добавьте, пожалуйста на страницу v:en:Research in programming Wikidata/Anime.
- окружение \widepar — с этим я ещё поразбираюсь. Пока не редактируйте английский LaTeX. --Andrew Krizhanovsky (обсуждение) 08:27, 6 декабря 2021 (UTC)
- @Андрей Анатольевич, добавил svg-файл на указанную страницу с последней правкой. --Eugene Newman (обсуждение) 12:56, 6 декабря 2021 (UTC)
- @Евгений Олегович, спасибо!
- Ура, я сделал костыль, теперь листинги можно делать во всю ширину страницы. Обновление залил на GitHub.
- \autocite ещё не смотрел.
- Напомните, пожалуйста, какие два скрипта (листинги) в русской версии мы хотели поставить бок о бок, но не получилось? --Andrew Krizhanovsky (обсуждение) 17:36, 6 декабря 2021 (UTC)
- @Андрей Анатольевич, спасибо за доработки. Рядом мы хотели поставить листинги 6.9 и 6.10 (раздел "Анализ возраста, в котором сэйю озвучивают аниме") в русском Latex, т.к. это два варианта одного и того же скрипта. --Eugene Newman (обсуждение) 18:11, 6 декабря 2021 (UTC)
- @Евгений Олегович, спасибо!
- @Евгений Олегович, спасибо, что для моего удобства указываете номера листингов.
Итерация LaTeX 10.12-17.12
правитьАндрей Анатольевич, убрал конструкции SAMPLE в русских и английских скриптах, где они были. Использование обычной label убирает проблему с языком меток, так что, полагаю, проблема, которую вчера обсуждали, решена. Диаграммы числа ролей актёров с Rawgraphs теперь тоже на правильных языках. Я их раскрасил и поправил размер лепестков (просто не сразу понял, как это сделать, поэтому прошлая версия была одноцветной и с одинаковым размером сегментов).
По поводу раздела полноты Викиданных: в английской версии я привёл только одну ссылку на сайт с каталогом аниме, а не несколько, как в русской версии, т.к. многие англоязычные фан-сайты, которые есть в выдаче поисковика, либо заблокированы, либо содержат сплошную рекламу. Если одной ссылки недостаточно, напишите, пожалуйста. --Eugene Newman (обсуждение) 08:38, 11 декабря 2021 (UTC)
- @Андрей Анатольевич, я закончил перенос в английский LaTeX. Единственный баг, который не смог решить - в скрипте 6.12 описание снова "спряталось" за рамкой. --Eugene Newman (обсуждение) 17:25, 13 декабря 2021 (UTC)
- @Евгений Олегович, спасибо! Распечатаю, проверю.
- Хотелось бы те же иллюстрации увидеть в Викиверситетах. --Andrew Krizhanovsky (обсуждение) 19:49, 13 декабря 2021 (UTC)
Итерация LaTeX 17.12-24.12
правитьАндрей Анатольевич, добавил Rawgraphs в индекс в обеих версиях и внёс сегодняшние правки. Взгляните, пожалуйста, на скрипт 6.12, который для построения ссылок между сэйю и аниме в разделе про даты рождения, там caption уехал за скрипт. --18:04, 17 декабря 2021 (UTC) --Eugene Newman (обсуждение) 18:05, 17 декабря 2021 (UTC)
Андрей Анатольевич, хотел обсудить листинг 6.7 (раздел "Полнота Викиданных") в английском LaTeX, который про получение актёров озвучки. Вопрос выношу сюда, а не в ВК, т.к. он довольно громоздкий и не самый срочный, но важный.
Адам верно заметил, что в разделе есть определённый пробел в логике: мы сравниваем количество ролей сэйю в аниме с количеством ролей всех актёров озвучки во всех проектах (не только аниме, но и в мультфильмах/кино), и вывод, касающийся сэйю, кажется нелогичным. Изначально я идею Дарьи не трогал, но теперь она мне тоже кажется не очень связанной с текстом.
Может быть, стоит переписать как-то в духе "количество ролей всех актёров озвучки в 5 раз больше количества ролей сэйю в аниме, поскольку на самом деле индустрия озвучки намного шире, чем только дубляж аниме"? Ну и заменить переменную ?anime в скрипте на ?movie или ?project. Редактировать саму логику скрипта я бы не хотел, поскольку времени остаётся немного, а отладка может затянуться.
Спасибо за комментарий. --Eugene Newman (обсуждение) 14:52, 20 декабря 2021 (UTC)
- Евгений, согласен с тем, чтобы заполнить пробел в логике. Согласен с обоими предложениями (про количество ролей и про имена переменных). Хорошо, логику скрипта оставляем - как она есть. Звал Адама расставить артикли, а пришлось менять содержание. Вот это ответственный человек. --Andrew Krizhanovsky (обсуждение) 15:06, 20 декабря 2021 (UTC)
- @Андрей Анатольевич, предложил новый вариант. Переписал скрипт и вывод и в русском, и английском ВВ и LaTeX, плюс вынес на обсуждение с Адамом. --18:25, 20 декабря 2021 (UTC) Eugene Newman (обсуждение) 18:25, 20 декабря 2021 (UTC)
- @Андрей Анатольевич, прошёлся первым проходом по правкам Адама. Можно уже частично смотреть ВВ и LaTeX, но я ещё пойду на второй круг, чтобы разрешить те вопросы, которые остались на потом. Заодно хотел бы напомнить про проблему со скрытой подписью к листингу 6.12 в английском Техе. Также хотел бы увидеть Ваш комментарий в Google-документе в разделе Future work. Не уверен, что хотел бы касаться в тексте таких деликатных тем. Спасибо. --Eugene Newman (обсуждение) 15:20, 21 декабря 2021 (UTC)
- @Евгений, спасибо! Написал ответы в Google Docs, где увидел вопросы. Мне кажется, что слово "идентичность" уточняет нашу мысль. Кстати, сообразил, возможно, это фразеологизм или хотя бы достаточно устойчивый оборот. По крайней мере в современной Европе.
- Скрытую подпись и то, что я хотел два листинга (сорри, запроса) напечатать параллельно в два столбца. Помню. И сейчас попробую поколдовать. --Andrew Krizhanovsky (обсуждение) 16:01, 21 декабря 2021 (UTC)
Итерация LaTeX 24.12 - 2022 год
правитьАндрей Анатольевич,правки в русскую версию внёс, можно смотреть. --Eugene Newman (обсуждение) 17:37, 24 декабря 2021 (UTC)