Обсуждение:Программирование Викиданных/Аниме

Задача по актёрам, озвучивающим аниме править

@Дарья Михайловна, набросал следующий скрипт: SPARQL-запрос, который предлагаю Вам взять за основу, разместить его на странице своей главы, добавить к нему входные данные с описанием.

И заняться анализом специалистов по сэйю и вообще Voice actor'ам (не владею терминологией, для краткости буду их называть "актёрами", если Вы знаете, как их правильно по-русски называют, то поправьте меня, пожалуйста). Хотелось бы увидеть следующее:

  1. упорядоченный список актёров по числу озвученных ими аниме,
  2. гистограмма, по оси X — число озвученных аниме (0, 1, 2 и так далее), по оси Y — число актёров, которые озвучили 0 аниме (наверное, таких нет), озвучили одно аниме (наверное, большинство актёров), озвучили по два аниме и так далее. См. гистограмму в главе Александра Дмитриевича Курбеева и СО его главы, где мы как раз обсуждали с ним подобную гистограмму.
  3. граф, связывающий друг с другом актёров через аниме, которые они вместе озвучивали. Вершины графа двух типов: аниме и актёры. Рёбра соединяют аниме и актёра, если актёр озвучивал аниме. SVG графа добавьте на Викисклад и вставьте в свою главу. Так же как и рисунок с гистограммой. -- Andrew Krizhanovsky (обсуждение) 14:57, 11 марта 2017 (UTC)Ответить

Аналогичная задача, только вместо актёров (voice actor) анализируются персонажи манг (characters). Вот скрипт: SPARQL-запрос. Даша, выбирайте, что Вам интереснее - с персонажами повозится или с актёрами? -- Andrew Krizhanovsky (обсуждение) 15:04, 11 марта 2017 (UTC)Ответить

Темпоральные странности править

  1. В 2017 г. число аниме - 683, в 2021 г. - всего 216. Предполагаю (не проверял), что общую категорию "аниме" делили на подкатегории по жанру/направлению.
  2. Также уменьшилось число сэйю в графовом запросе - с 826 до 284. Причина, вероятно, аналогична п. 1.

Eugene Newman (обсуждение) 08:37, 2 октября 2021 (UTC)Ответить

Жанры и подклассы аниме править

  • @Евгений, с подклассами довольно легко разобраться. См. листинг 7.19 в нашем PDF-файл и описание к нему на предыдущей странице. Вот такой скрипт https://w.wiki/49yV даёт 4756 результатов (с учётом подклассов).
  • Я бы предложил оставить первый скрипт (только везде вместо "[AUTO_LANGUAGE]" пишите "ja"). И добавить скрипт (или одну главную строчку из него), учитывающий подклассы. И дальше во всех скриптах использовать подклассы, поскольку получаем более полные результаты. (Используйте подклассы и в тех двух скриптах с графами, которые я привёл во ВКонтакте.)
  • Перечислите в тексте самые популярные подклассы аниме в Викиданных с указанием числа объектов по подклассам. Посмотрите, как это сделано в тексте Елизаветы (см. листинг 2 и 3, таблицу 1). Хорошо, если Вы сошлётесь на этот труд в своей работе. --Andrew Krizhanovsky (обсуждение) 14:13, 2 октября 2021 (UTC)Ответить
  • @Евгений, не хватало общего комментария, что же этот скрипт делает... Но я вспомнил, мы считаем количество аниме по подклассам. Вроде, всё хорошо.
  • После скрипта опишите результаты и отметьте, что основная масса аниме попала в класс "аниме-сериал" (Q63952888) (2917 аниме, столько-то процентов от всех аниме). Отметьте, что эту классификацию нельзя назвать совершенной, здесь смешаны несколько классификаций: по форме вещания (OVA, ONA), по типу (аниме, аниме на основе манги), ещё какие-то можно выделить классификации? --Andrew Krizhanovsky (обсуждение) 08:40, 3 октября 2021 (UTC)Ответить
    Андрей Анатольевич, скрипт дополнен комментариями и размещён в первом разделе статьи. На английском Викиверситете также обновил скрипты с учётом локали. --Eugene Newman (обсуждение) 12:00, 3 октября 2021 (UTC)Ответить
  • @Евгений, отлично! Прошёлся по первому разделу. Оставил кое-где запросы, чтобы Вы что-то добавили. Предлагаю вместо слова "поджанры" использовать "жанры", при этом продолжаем использовать слово "подклассы", когда говорим о подклассах аниме. Поправьте, пожалуйста, соответственно в других разделах. --Andrew Krizhanovsky (обсуждение) 19:04, 3 октября 2021 (UTC)Ответить

Рисунки править

категории

+ конкретно в этот рисунок (из Вашей статьи про аниме) можно добавить категорию "Аниме", наверняка такая есть на Викискладе. Если у категории "Аниме" есть более подходящая подкатегория (например, "графики аниме"), то лучше её указать. --Andrew Krizhanovsky (обсуждение) 19:14, 3 октября 2021 (UTC)Ответить

Андрей Анатольевич, в соответствии с комментариями обновил рисунки и добавил источники в русскоязычную статью. --Eugene Newman (обсуждение) 15:40, 4 октября 2021 (UTC)Ответить
  1. @Евгений, спасибо за работу. По поводу второй ссылки (shikimori, 2021). Форум — это хорошо, но хотелось бы научную статью для ссылки. Вот 80 научных статей на Google Scholar по запросу (аниме тайтл японский). Читайте и выбирайте для ссылки.
  2. Такая внешняя ссылка [https://ru.wikipedia.org/wiki/%D0%95%D0%B2%D0%B0%D0%BD%D0%B3%D0%B5%D0%BB%D0%B8%D0%BE%D0%BD «Евангелион»] в вики-проектах не годится. Здесь нужна специальная короткая ссылка на сестринские проекты, см. w:en:Help:Interwiki linking. См. столбец Shortcut в таблице. У Вас несколько раз в статье встречаются ссылки; поправьте их, пожалуйста.
  3. В хорошо оформленных текстах не принято сокращение "г.". Поэтому вместо "(2021 г.)" пишите (2021) или (2021 год).
  4. Английский рисунок меня порадовал. Для Викиверситета отлично годится. Когда будете этот рисунок копировать в LaTeX, то сделайте скриншот ещё раза в 2-3 крупнее, поскольку в книге не получится раскрыть на весь экран.
  5. Для Вашего удобства, если будете делать новые версии рисунков в будущем, то не создавайте новый файл с новым описанием на Викискладе, а грузите новый файл поверх старого. На странице с рисунком (на Викискладе) есть ссылка "Upload a new version of this file". Нужно только комментарий написать при загрузке - что именно изменилось в новой версии. --Andrew Krizhanovsky (обсуждение) 18:21, 4 октября 2021 (UTC)Ответить
    Андрей Анатольевич, спасибо за комментарии. Пункты 1-3 внёс в статью с последними правками. --Eugene Newman (обсуждение) 13:05, 5 октября 2021 (UTC)Ответить

Статья Кузьминой на Elibrary править

@Евгений, спасибо. Правда, у меня не получается скачать статью Кузьминой (Д. П. Кузьмина, «Аниме: от социализации к межкультурной коммуникации», 2021). А у Вас? --Andrew Krizhanovsky (обсуждение) 14:55, 6 октября 2021 (UTC)Ответить

Андрей Анатольевич, да, со скачиванием с Elibrary есть некоторые трудности. Но в других работах, что я просмотрел, определения тайтла в явном виде я не обнаружил, в этой же оно есть уже в результатах поиска, то есть и в полном тексте оно, очевидно, будет. --Eugene Newman (обсуждение) 15:06, 6 октября 2021 (UTC)Ответить
@Женя, поскольку мы пишем для людей, а не для галочки, то хотелось бы иметь доступ к материалам, на которые ссылаемся. Варинты: (1) найти эту же статью онлайн где-то в сети и поставить на ней ссылку, (2) сослаться на другую статью, более доступную. --Andrew Krizhanovsky (обсуждение) 15:31, 6 октября 2021 (UTC)Ответить
Андрей Анатольевич, удалось найти "тайтл" в Викисловаре. Странно, что Яндекс не видел эту страницу (просто привык пользоваться Яндексом). Такой вариант подойдёт? --Eugene Newman (обсуждение) 15:44, 6 октября 2021 (UTC)Ответить
@Евгений, про авторитетные источники я ещё буду рассказывать на лекции. Если в двух словах, то вики-проекты (Википедия, Викисловарь) не являются АИ. Подробности здесь: w:ВП:АИ. Поэтому ответ: нет, к сожалению, не подойдёт. --Andrew Krizhanovsky (обсуждение) 16:13, 6 октября 2021 (UTC)Ответить
Андрей Анатольевич, статью можно выкачать, если авторизоваться на Elibrary. По крайней мере, при авторизации через сети университета или "Ситилинка" полный текст доступен. PDF у меня скачан. Других научных работ, где бы упоминалось определение слова "тайтл", в общем доступе я так и не встретил. Возможно ли в таком случае откатиться к использованию статьи Кузьминой? --Eugene Newman (обсуждение) 11:30, 7 октября 2021 (UTC)Ответить
@Евгений, предлагаю такой вариант. Если хотите, то можете оставить ссылку на Кузьмину. И добавьте, пожалуйста, ссылку на статью: История появления первых японских комиксов на русском языке. Таки целый журнал есть "Японские исследования"! На 18 с. статьи есть определение термина "тайтл". Предлагаю целиком взять это определение и сослаться на статью.
Не уверен, что такая ссылка будет нам нужна в английской версии, поскольку "английское" title, вряд ли, также специфично, как русское "тайтл". --Andrew Krizhanovsky (обсуждение) 17:12, 7 октября 2021 (UTC)Ответить
Андрей Анатольевич, решил сохранить оба определения. Спасибо. --Eugene Newman (обсуждение) 17:29, 7 октября 2021 (UTC)Ответить
Отлично! --Andrew Krizhanovsky (обсуждение) 17:43, 7 октября 2021 (UTC)Ответить

Обложка статьи в английском LaTeX править

@Андрей Анатольевич, добавил вариант оформления аннотации своего раздела на GitHub. В качестве обложки использовал этот файл, однако а) он в довольно посредственном качестве; б) в поле нет текста, из-за чего обложка кажется пустой. Лицензия Creative Commons Attribution-Share Alike 3.0 Unported, насколько я понимаю, позволяет редактировать изображение, так что, если есть необходимость, я мог бы попробовать увеличить его разрешение и что-то написать в табличке. Ещё есть, например, такой вариант, но он вертикальный, так что если и использовать его, то только добавив белые поля (а это, как я понимаю, тоже акт редактирования).

 
Kiki the Cyber Squirrel mascot from Krita version 2.8 Splash
@Евгений, добрый день. Не забывайте подписываться, пожалуйста. Да, файлы Викисклада можно редактировать и загружать снова на Викисклад или использовать в любых целях. Согласен, что можно что-то написать в табличке, но качество оставляет желать лучшего, маловаты картинки. Добавил на эту страницу (справа) ещё фото с большим качеством, вроде, это аниме. И ещё есть рисунке на странице автора с открытой лицензией. Можете там выбрать. --Andrew Krizhanovsky (обсуждение) 07:15, 12 октября 2021 (UTC)Ответить
@Андрей Анатольевич, спасибо за предложение. Однако не уверен, что этот персонаж подойдёт: Krita - это графический редактор, а Kiki - соответственно, маскот этого ПО. Стилистика напоминает аниме, согласен, но правильно ли будет добавлять обложку с ним для иллюстрации статьи? --Eugene Newman (обсуждение) 12:54, 12 октября 2021 (UTC)Ответить
@Евгений, поскольку это учебник для, в первую очередь, школьников, то красота, на мой взгляд, важнее точности. Красота иллюстрации. Но Вы хозяин этой главы, поэтому Вам решать. Плюс ещё в том, что можно заодно пояснить школьникам, что такое маскот — как связаны животные, изящные искусства и программирование. Есть ещё поисковик https://search.creativecommons.org, можно там поискать. --Andrew Krizhanovsky (обсуждение) 15:12, 12 октября 2021 (UTC)Ответить
@Андрей Анатольевич, спасибо, полезный ресурс. Всё же я остановился на варианте с Kiki. В выборке на Creative Commons мне понравился только один рисунок, но у него лицензия NC-ND, и для Викисклада он не подошёл. Финальную версию загрузил в репозиторий. --Eugene Newman (обсуждение) 16:57, 12 октября 2021 (UTC)Ответить
@Евгений, отличная картинка, но её сплющило в PDF. Может, обрезать по уши маскота? То есть верхнего лебедя почти убрать, нижнего лебедя оставить. Как думаете? Если картинка совсем испортится с таким кропом, то оставить как есть. --Andrew Krizhanovsky (обсуждение) 18:01, 12 октября 2021 (UTC)Ответить
@Андрей Анатольевич, согласен, с обрезанной картинкой получше. GitHub обновил. --Eugene Newman (обсуждение) 20:03, 12 октября 2021 (UTC)Ответить
Отлично, Евгений. Вполне волшебно получилось. Спасибо! --Andrew Krizhanovsky (обсуждение) 06:18, 13 октября 2021 (UTC)Ответить

Граф, связывающий сэйю и озвученные ими аниме править

@Евгений, вопрос по скрипту w.wiki/49$8, по предпоследней строчке:

BIND(IF(?toggle,"",?anime) AS ?link).

Что она означает? Что изменится, если вместо неё написать:

BIND(IF(?toggle,?seiyu,?anime) AS ?link).

Возможно, будет легче понять результат скрипта в виде списка, для этого нужно убрать или нарушить вторую строчку (#defaultView:Graph). --Andrew Krizhanovsky (обсуждение) 06:24, 14 октября 2021 (UTC)Ответить

@Андрей Анатольевич, если честно, затрудняюсь вспомнить, почему я остановился именно на варианте в скрипте https://w.wiki/49$8. Я, кажется, решил, что в варианте https://w.wiki/4DUM некорректно отображались дуги в графе (возможно, я потом изменил что-то ещё, и граф стал нормальным). Однако первый вариант возвращает 500 результатов, второй - 538. --Eugene Newman (обсуждение) 12:05, 14 октября 2021 (UTC)Ответить

Гистограмма по числу сэйю, озвучивших одно и более аниме править

@Евгений, если использовать логарифмическую шкалу, то лучше будет видно кривую? --Andrew Krizhanovsky (обсуждение) 09:38, 15 октября 2021 (UTC)Ответить

@Андрей Анатольевич, пробовал такой способ логарифмирования в SPARQL, однако в скрипте этот вариант вызывает ошибку java.lang.IllegalArgumentException: Not an aggregate. Не подскажете, как правильно пользоваться логарифмированием? Спасибо. --Eugene Newman (обсуждение) 07:32, 16 октября 2021 (UTC)Ответить

Идеи для SPARQL-задач править

@Андрей Анатольевич, есть такие идеи для новых скриптов:

  • отметить на карте места рождения сэйю (предположить, какой регион «самый богатый на таланты»);
  • построить гистограмму/bubble chart национальностей сэйю (среди них должны быть и не-японцы);
  • построить гистограмму количества вышедших аниме по годам или количества сэйю по годам рождения. --Eugene Newman (обсуждение) 07:38, 16 октября 2021 (UTC)Ответить
@Евгений, отлично! Добавьте эти три задачи в раздел "Будущая работа" в Вашей статье.
Вы меня натолкнули на следующую идею. Зная год выпуска аниме и дату рождения актёра, можно подсчитать в каком возрасте сейю озвучил некоторую роль. Посмотрите в работе «Ранжирование отечественных математиков и научных сообществ мира» рис. 4, 5, 6. Можно нарисовать подобный график, где по оси X указан возраст сейю, по оси Y — число аниме, озвученных в возрасте X.
Тогда   означает, что в возрасте   было озвучено   аниме суммарно по всем сейю и аниме.
В решении этой задачи я не ограничиваю Вас требованием сделать всё в одном скрипте и только в Wikidata Query Service (WDQS). Вы можете разбить задачу на несколько запросов. Сохранить полученные данные из WDQS в табличном формате (в CSV), затем загрузить в Excel (или любую программу, или воспользоваться каким-либо языком программирования) и нарисовать красивый график. В Викиверситете нужно описать ключевые моменты решения и показать иллюстрацию. --Andrew Krizhanovsky (обсуждение) 08:08, 16 октября 2021 (UTC)Ответить
@Андрей Анатольевич, есть первый вариант решения.
В SPARQL:
  1. получаем список сэйю и их дней рождения;
  2. получаем список аниме и их дат выхода (свойства P577 для полнометражных фильмов и P580 для сериалов);
  3. получаем список ссылок со страниц сэйю на аниме и наоборот.
Экспортируем результаты в csv-файлы. Гистограмму строим средствами Python (блокнот на Google Colab).
Интересные моменты, возникшие в ходе решения:
  1. в SPARQL-скрипте (1) строка SERVICE почему-то работает не так, как в остальных скриптах: список имён сэйю вернулся на английском и частично почему-то на арабском, хотя в остальных двух скриптах список русско-английско-японский, как и ожидалось;
  2. в данных есть забавные моменты, когда сэйю родился(-ась) позже, когда вышло аниме с его (её) участием. Предполагаю, что это связано с отсутствием информации на Вики о втором сезоне/перезапуске аниме. В логах Python выводятся сообщения о таких фактах со ссылками на объекты Викиданных.
Заранее спасибо за комментарии. --Eugene Newman (обсуждение) 09:29, 17 октября 2021 (UTC)Ответить
@Евгений, здорово всё получилось! Скрипт "получаем список ссылок со страниц сэйю на аниме и наоборот" немного поправил по оформлению, лучше так (поправил комментарий в строке 11).
Три листинга приведите в Викиверситете, а в тексте LaTeX'а листингов не надо, только ссылки на скрипты.
Картинку можно загружать на Викисклад. + Аналогичная картинка, где подписи осей по-русски, тоже загрузите, пожалуйста, на Викисклад. Название (вверху) обрежьте, подпись будет текстом, под картинкой.
Логично было бы поставить из текста ссылку на блокнот на Google Colab. Как это сделать более перманентно на будущее? Можете сохранить на GitHub в проект wd_book? --Andrew Krizhanovsky (обсуждение) 11:26, 17 октября 2021 (UTC)Ответить
@Андрей Анатольевич, добавил раздел 4 в русскоязычную статью. Если у Вас не будет по нему замечаний, переведу на английский. Удобно ли, что я добавил Python-код и csv-файлы в отдельный каталог на GitHub, или же перенести файлы в другое место? --Eugene Newman (обсуждение) 12:40, 17 октября 2021 (UTC)Ответить
@Евгений, скрипт отлично разместили на GitHub. Здорово, что GitHub сразу исполняет .ipynb файл при его просмотре на сайте.
Здесь точка лишняя: SERVICE wikibase:label { bd:serviceParam wikibase:language "ru,en,ja". }, предлагаю такой вариант (немного поправил комментарий): https://w.wiki/4EMG
Вопросы к этому же скрипту. Сейчас 7-ая строчка "SERVICE wikibase:label..." бесполезна (уберёте?), поскольку Вы получаете ?seiyuLabel не через "SERVICE wikibase:label...", а с помощью конструкции SAMPLE. Постарайтесь добавить два пояснения к этому скрипту: (1) зачем нужна группировка GROUP BY, (2) почему нельзя использовать напрямую ?seiyuLabel в SELECT, как мы это делаем в других скриптах, а нужно изголяться с rdfs:label и с SAMPLE. Благодаря этим пояснениям скрипт становится настолько интересным, что листинг и пояснения предлагаю тоже добавить в LaTeX.
Во втором и третьем скриптах есть в листинге "GROUP BY" в последней строке, в скрипте по ссылке группировки нет. Опечатки.
Читателю удобнее будет пойти по ссылке сразу на файл age_act_hist.ipynb, чтобы увидеть результаты вычислений.
Текст из раздела "Интересные наблюдения" предлагаю оставить, не выделяя в отдельный подраздел. Там же, после рисунка. И приведите один или два конкретных примера этих странностей в Викиданных, с указанием, что так на 2021 год.
В "будущей работе" в пункте 5 используйте русское название типа диаграммы для "bubble chart".
Можете переводить на английский. --Andrew Krizhanovsky (обсуждение) 13:46, 17 октября 2021 (UTC)Ответить
@Андрей Анатольевич, по комментариям к скрипту:
  1. зачем нужна группировка GROUP BY - если не ошибаюсь, она нужна для привязки идентификатора объекта сэйю к метке: как говорится в учебнике, "We GROUP BY both variables ?mother and ?motherLabel because if we would leave out the label we would end up with an error "Bad Aggregate";
  2. почему нельзя использовать напрямую ?seiyuLabel в SELECT: если честно, затрудняюсь сказать. Кажется, я просто модифицировал один из старых скриптов, где было сделано через SAMPLE. Про rdfs:label здесь (Query #5) написано, что это просто "a common predicate for giving a human-friendly label to a resource". За размышлениями у меня появился вариант скрипта с "обычной" меткой. К тому же такое решение справляется с проблемой, что имена сэйю возвращаются только на английском. Может быть, просто заменить нынешний скрипт на него? --Eugene Newman (обсуждение) 13:15, 19 октября 2021 (UTC)Ответить
@Евгений, по поводу 1. GROUP BY. Мне очень нравится, что теперь у нас есть два варианта скрипта: раз и два (во втором Вашем скрипте поправил комментарии). Хотелось бы увидеть параллельно эти два листинга в латехе. Вероятно, без занятия полей не обойтись, тогда на всю ширну страницы fullwidth*. Нашёл два примера оформления: первый и второй. Первый как-то попроще. Мне, как читателю, нравятся задания "найди картинки", в том числе для листингов.
И, наверное, небольшие комментарии после или до скриптов, чем они отличаются. Как раз и про GROUP BY можно будет ввернуть комментарий. --Andrew Krizhanovsky (обсуждение) 09:25, 20 октября 2021 (UTC)Ответить

Вспоминается милый отрывок:

Юрий Коваль, Пять похищенных монахов:

Похититель сидел в кресле, держа в руках журнал. Он разглядывал в журнале две картинки, на вид совершенно одинаковые. На одной был нарисован барсук, и на другой – барсук. Под барсуками было напечатано мелким шрифтом: «Найдите на этих картинках шестнадцать различий».

Прицеливаясь взглядом то в одного барсука, то в другого, Похититель искал различия.

«Ага, – думал он, – у этого барсука две ноги, а у этого три. Вот вам и различие».

Довольно скоро Похититель справился с этим нехитрым делом и вдруг неожиданно для себя обнаружил семнадцатое.

«Что за чертовщина! – подумал Похититель и принялся раздраженно подсчитывать различия, загибая пальцы. – Так точно – семнадцать!»

Похититель отбросил журнал, достал лист бумаги и ручку. Он решил немедленно написать письмо в редакцию и обругать сотрудников покрепче. Некоторое время сидел он задумавшись. Хотелось сразу же, с первой строчки, уязвить редакцию, но ничего особо хлесткого он придумать не мог и начал так:

«Дорогие товарищи! Недавно я смотрел тут на ваших барсуков…»

Вот. --Andrew Krizhanovsky (обсуждение) 09:25, 20 октября 2021 (UTC)Ответить

Перенос статьи в русский LaTeX править

@Андрей Анатольевич, перенёс в LaTeX первый раздел (первые 3 листинга). Посмотрите, пожалуйста, как будет время. Ошибка с файлом listings_python.prf, к счастью, компиляции не мешала. Надеюсь, позднее разберусь и с ней.

По оформлению предлагаю пару вопросов для обсуждения:

1. Заметил странность при оформлении ссылок: иногда LaTeX пропускает номера. Первый пример из ранее созданной статьи про самолёты (пропущен номер 6), второй - из моей (пропущен номер 5).

2. Возможно ли модифицировать шаблон для оформления скриптов, чтобы текст автоматически переносился на новую строку? В статьях предыдущих авторов я тоже видел, как скобки заходят за поля, но у них это не столь заметно. Пример проблемы.

Заранее спасибо за рекомендации. --Eugene Newman (обсуждение) 12:38, 23 октября 2021 (UTC)Ответить

@Евгений, хорошо, посмотрю. Ответы на вопросы.
  1. Странная странность с пропуском номеров. Пока не знаю, что с этим делать.
  2. Здесь на перенос не надеемся. Варианты: (1) оформляем листинг на всю ширину страницы, (2) делаем более короткие строки. Конкретно здесь можно ужаться так: (1) перенести "WHERE" на следующую строку, (2) в нулевой строке перенести последнее слово, (3) в пятой строке укоротить комментариц "and their" → "with", (4) в SERVICE убрать точку, убрать лишние пробелы внутри скобок, сдвинуть влево. И комментарий если в первой строке не умещается, то вторую строку тоже начните с диеза "#". --Andrew Krizhanovsky (обсуждение) 15:48, 23 октября 2021 (UTC)Ответить
@Андрей Анатольевич, полный текст статьи перенёс в LaTeX. Посмотрите, пожалуйста, по возможности. Однако осталась ещё пара вопросов для обсуждения.
  1. В основном я опирался на раздел aircrafts как пример, и мне осталось не очень ясным, какие ссылки нужно оформлять просто как \href, а какие - оборачивать в \cite и вносить в библиографию. Уточните этот момент, пожалуйста.
  2. Сделать в разделе про возраст озвучки (с новой задачей) скрипты в двух колонках у меня, к сожалению, не вышло. fullwidth почему-то работать у меня отказался. Я применял такой код, но скрипты всё равно шли друг за другом.
Буду благодарен за Ваши комментарии. --Eugene Newman (обсуждение) 16:35, 27 октября 2021 (UTC)Ответить
  1. @Евгений, в этом учебнике к стилевому файлу Tufte-LaTeX на с. 21 есть \footnote. Тогда Вы можете вынести текст, включающий гиперссылку на какой-либо материал, на поля. Если на какой-то источник Вы хотите сослаться несколько раз, то целесообразнее будет оформить ссылку как библиографическую с обязательной её публикацией в разделе "Литература".
  2. Ещё предложение. Попробуйте использовать короткий вариант ссылки на литературу для полей и длинный для раздела "Литература", см. рецепт: citations shorter in the margin, detailed in the list. Для этого нужно будет добавить одну команду \shortcite в главный файл русского LaTeX. Если у Вас получится, то обяжем всех использовать \shortcite вместо \cite. --Andrew Krizhanovsky (обсуждение) 11:19, 30 октября 2021 (UTC)Ответить
    @Андрей Анатольевич, обработал Ваши рекомендации по первым четырём разделам (до графа включительно), а также раздел упражнений. Проверьте, пожалуйста.
    Пока у меня есть предложение и вопрос.
    • Предложение: может быть, стоит добавить pdf-файлы в .gitignore? Ясно, что в репозитории они не нужны, но перед коммитом порой хочется ещё раз проверить правки, а компилировать заново/восстанавливать файл из корзины не хочется :) Заодно никто случайно не выложит pdf.
    • Вопрос: размышляю, как лучше расположить граф связи сэйю и аниме. Если его просто расширять, то он уходит на следующую страницу, и LaTeX начинает писать перед графом новый раздел (что усложняет читаемость, как на скриншоте). Пока я расположил граф в начале новой страницы, но так остаётся много пустого места, так как под листингом писать больше особенно нечего, только короткий комментарий про функцию BIND.
    Спасибо за обсуждение. --Eugene Newman (обсуждение) 08:45, 31 октября 2021 (UTC)Ответить
  1. @Евгений, спасибо за работу! Это очень хорошая идея — добавить *.pdf в .gitignore. Добавьте, пожалуйста.
  2. У рисунков в LaTeX есть ключ h и H (забыл в чём разница). Эти ключи означают, что нужно расположить рисунок именно здесь (h от слова here), + ещё восклицательный знак "!" какое-то магическое действие имеет. Поэкспериментируйте. По умолчанию LaTeX ведёт себя очень вольно с местоположением иллюстрации, пытаясь оптимально расположить текст на странице. Можно этими ключами добавить ограничение на местоположение картинки относительно текста. --Andrew Krizhanovsky (обсуждение) 09:00, 31 октября 2021 (UTC)Ответить
    @Андрей Анатольевич, первоначальный вариант правок внёс по всей статье. Есть ещё пара моментов, которую можно обсудить:
    1. По позиции графа более интересного решения, чем перенос на следующую страницу, найти не смог. "!" не меняет поведение LaTeX'а, а если вместо h написать H, то компилятор ругается на неизвестную опцию. В сети описания модификатора H тоже не нашёл. Наверное, какой-то пакет его определяет (я видел что-то подобное, когда писал курсовую в LaTeX пару лет назад), но в нашей сборке его, вероятно, нет.
    2. По поводу количества аниме в секции про полноту. Я считал его так: открывал на сайте меню поиска, смотрел число аниме на одной странице, число страниц поиска и умножал одно на другое. Цифры в разделе должны быть актуальными, т.к. я обновлял их где-то неделю назад.
    3. Вышлите, пожалуйста, в беседу ВКонтакте ссылку на сервис сокращения ссылок. У меня пока везде стоит clck.ru, но это временная мера. Потом переделаю через нужный сервис.
    4. Не очень понял последнее замечание в разделе про возраст сэйю: "Поставьте на поля цитату из фильма "Формула любви"..." Если честно, не уверен, что такая цитата хорошо бы согласовалась с тематикой всей статьи, посвящённой не отечественному, а японскому кинематографу.
    Спасибо за разъяснения. --Eugene Newman (обсуждение) 14:35, 2 ноября 2021 (UTC)Ответить
  1. @Евгений, хорошо.
  2. Хорошо.
  3. Ссылка: URL Shortener
  4. Это я увлёкся. Хорошо, не надо здесь цитаты. --Andrew Krizhanovsky (обсуждение) 15:40, 2 ноября 2021 (UTC)Ответить

Русский LaTeX от 12.11 править

Здравствуйте, Андрей Анатольевич. В основном правки от прошлой пятницы обработал и выложил на GitHub. К индексированию ключевых слов пока не приступал, хочу перейти, когда обсудим основные моменты по статье. Вопросы у меня следующие:

  1. Раздел "Экземпляры объекта Аниме":
    1. напишите, пожалуйста, комментарий про "короткие ссылки на полях и длинные в списке литературы";
    2. допустимо ли добавлять иллюстрации с Rawgraphs в png-формате? SVG LaTeX у меня принимать отказался, а попытка сконвертировать в подходщий формат (https://tex.stackexchange.com/a/2107/255230) из Linux-подсистемы Windows отправила ноутбук в перезагрузку, и дальше экспериментировать я побоялся :)
  2. Раздел "Список сэйю, упорядоченный..."
    1. Какого типа график Вы подразумевали добавить для листинга 6.5? Если нужен просто линейный график, но сделанный в Rawgraphs (как у меня есть сейчас), то а) он громоздкий, и при попытке разместить его на полях он становится нечитаемым; б) он просто дублирует содержание графика, полученного средствами SPARQL. Важен ли он, или можно его убрать, чтобы не перегружать статью?
  3. Упражнения:
    1. "сэйю-женщина" пишется через дефис, см. http://www.bolshoyvopros.ru/questions/3776975-kak-pishetsja-muzhchina-vrach-ili-muzhchina-vrach-pochemu.html#answer10968625

Спасибо за комментарии. --Eugene Newman (обсуждение) 18:07, 15 ноября 2021 (UTC)Ответить

@Евгений, добрый день. Отвечаю на вопросы.
1.1. Вот пример команды, который создаётся в главном файле русского латеха: https://groups.google.com/g/tufte-latex/c/4fKzsy-VRmI Поэкспериментируйте, пожалуйста.
1.2. Пока SVG не пробовал включать в PDF, хотя пишут что это возможно. Поэтому включайте в PNG формате.
2. Хорошо, понял. Тогда не надо дублирующего графика.
3. Спасибо! --Andrew Krizhanovsky (обсуждение) 15:02, 16 ноября 2021 (UTC)Ответить
@Андрей Анатольевич, график-дубликат удалил. Заменил ссылки на статьи и ProWD на краткие. Получились ссылки вида "фамилия_автора, год", например, "Кузьмина, 2018". Также добавил в индекс ссылки на команды SPARQL и графики своей главы. Посмотрите, пожалуйста, по возможности. --Eugene Newman (обсуждение) 18:21, 16 ноября 2021 (UTC)Ответить

Русский LaTeX от 19.11 править

Здравствуйте, Андрей Анатольевич. Изменения текущей итерации внёс, вопросы такие:

  1. Стр. 41: может быть, ссылку на cadelta.ru оформить как-то иначе? Надпись на полях "Slowpoke 2020" выглядит, как по мне, несколько странно. Tsar Slowpoke - это явно неформальный никнейм, да и сайт не претендует на то, чтобы быть АИ.
  2. Стр. 43: по проблеме с нумерацией, к сожалению, новых идей на решение у меня нет. Я использую тег \footnote, который, по идее, не предполагает ручной расстановки нумерации, а то, что LaTeX делает автоматически, не всегда верно. Подобный баг я видел ещё в октябре (в разделе обсуждения "Перенос статьи в русский LaTeX" есть об этом комментарии от 23 октября).
  3. Стр. 49: по поводу формулировки вывода о полноте Викиданных. К сожалению, оригинал уже утерян, но Вами была предложена формулировка наподобие "новые аниме выходят быстрее, чем заполняется информация о них в Викиданных". Я просто подумал, что такая формулировка довольно формальная, и тот вариант, что есть сейчас (про несоответствие качества и количества данных), может быть воспринят читателем более легко и забавно.

Спасибо за обсуждение. --Eugene Newman (обсуждение) 17:14, 20 ноября 2021 (UTC)Ответить

Английский LaTeX: 26.11-03.12 править

Андрей Анатольевич, проверьте, пожалуйста, изменения в первом разделе и дополненный второй. Спасибо. --Eugene Newman (обсуждение) 17:00, 29 ноября 2021 (UTC)Ответить

Есть ли в англоязычном шаблоне аналог команды wdProperty? В примерах я видел только такое оформление: \href{https://www.wikidata.org/wiki/Property:P31}{instance of (P31)}, а при попытке написать \wdProperty{} компилятор ругается. --Eugene Newman (обсуждение) 19:45, 29 ноября 2021 (UTC)Ответить
Андрей Анатольевич, если Вы ещё не приступали к проверке, можно будет ещё взглянуть на раздел с графиком сэйю и числа озвученных ими аниме. --Eugene Newman (обсуждение) 13:28, 30 ноября 2021 (UTC)Ответить
@Евгений, изменения проверю, спасибо! Не понял последнего предложения: "можно будет ещё взглянуть на раздел..." Кому можно (мне или Вам)? Ещё не приступал к проверке. Надеюсь, что завтра. --Andrew Krizhanovsky (обсуждение) 20:51, 1 декабря 2021 (UTC)Ответить
@Андрей Анатольевич, я имел в виду, что раздел с графиком готов, и его можно проверять. Также я заменил href на свойство Р31 на wdProperty, так что на GitHub уже версия с wdProperty (относительно прошлой изменилась одна строчка). --Eugene Newman (обсуждение) 12:14, 2 декабря 2021 (UTC)Ответить

Английский LaTeX: 03.12-10.12 править

Андрей Анатольевич, разобрал правки в английской версии по Вашему списку. Правда, ещё думаю насчёт расположения sunburst-диаграммы распределения аниме по жанрам (рис. 6.2). Текущий вариант получилось уместить, только убрав описание "Стального алхимика" в нижний колонтитул, т.к. иначе диаграмма либо перекрывала текст на полях, либо "уползала" слишком далеко от своего упоминания в тексте. Если у Вас есть другие идеи насчёт её расположения, напишите, пожалуйста. Также за эту неделю планирую добавить раздел с графом. Когда сделаю, напишу здесь. --Eugene Newman (обсуждение) 11:17, 4 декабря 2021 (UTC)Ответить

@Андрей Анатольевич, я добавил в английскую версию раздел с графом, его можно проверять. Также вносил мелкие правки в русский Latex, убрал некоторые недочёты по типу уехавших комментариев в скриптах. Нашёл пару странностей:
  1. окружение \widepar в английском Latex перекрывает caption к скриптам, в то время как \fullwidth в русском просто переносит подпись под скрипт. См. листинги 6.2 и 6.6 в английской версии. Как вариант решения - дать комментарий к скрипту обычным текстом после него, но это будет не единообразно с другими скриптами;
  2. \autocite в русской версии не отображает ссылку при повторном её использовании: для строки 31 (файла ru/chapter/anime.tex) ссылка на Shikimori отображается нормально, а для строки 239 вместо ссылки в PDF отображается просто точка. Если не будет идей, как это исправить, предлагаю убрать \autocite из строки 31. Тогда в 239 отображаться будет правильно, т.к. ссылка используется только единожды, я это проверял.
Спасибо за обсуждение. --Eugene Newman (обсуждение) 12:12, 5 декабря 2021 (UTC)Ответить
@Евгений Олегович, спасибо, что для моего удобства указываете номера листингов.
  1. По рис. 6.2 "Sunburst diagram". Хочу попробовать сделать его посимпатичнее. Загрузите этот рисунок в SVG на Викисклад и добавьте, пожалуйста на страницу v:en:Research in programming Wikidata/Anime.
  2. окружение \widepar — с этим я ещё поразбираюсь. Пока не редактируйте английский LaTeX. --Andrew Krizhanovsky (обсуждение) 08:27, 6 декабря 2021 (UTC)Ответить
@Андрей Анатольевич, добавил svg-файл на указанную страницу с последней правкой. --Eugene Newman (обсуждение) 12:56, 6 декабря 2021 (UTC)Ответить
@Евгений Олегович, спасибо!
  • Ура, я сделал костыль, теперь листинги можно делать во всю ширину страницы. Обновление залил на GitHub.
  • \autocite ещё не смотрел.
  • Напомните, пожалуйста, какие два скрипта (листинги) в русской версии мы хотели поставить бок о бок, но не получилось? --Andrew Krizhanovsky (обсуждение) 17:36, 6 декабря 2021 (UTC)Ответить
@Андрей Анатольевич, спасибо за доработки. Рядом мы хотели поставить листинги 6.9 и 6.10 (раздел "Анализ возраста, в котором сэйю озвучивают аниме") в русском Latex, т.к. это два варианта одного и того же скрипта. --Eugene Newman (обсуждение) 18:11, 6 декабря 2021 (UTC)Ответить

Итерация LaTeX 10.12-17.12 править

Андрей Анатольевич, убрал конструкции SAMPLE в русских и английских скриптах, где они были. Использование обычной label убирает проблему с языком меток, так что, полагаю, проблема, которую вчера обсуждали, решена. Диаграммы числа ролей актёров с Rawgraphs теперь тоже на правильных языках. Я их раскрасил и поправил размер лепестков (просто не сразу понял, как это сделать, поэтому прошлая версия была одноцветной и с одинаковым размером сегментов).

По поводу раздела полноты Викиданных: в английской версии я привёл только одну ссылку на сайт с каталогом аниме, а не несколько, как в русской версии, т.к. многие англоязычные фан-сайты, которые есть в выдаче поисковика, либо заблокированы, либо содержат сплошную рекламу. Если одной ссылки недостаточно, напишите, пожалуйста. --Eugene Newman (обсуждение) 08:38, 11 декабря 2021 (UTC)Ответить

@Андрей Анатольевич, я закончил перенос в английский LaTeX. Единственный баг, который не смог решить - в скрипте 6.12 описание снова "спряталось" за рамкой. --Eugene Newman (обсуждение) 17:25, 13 декабря 2021 (UTC)Ответить
@Евгений Олегович, спасибо! Распечатаю, проверю.
Хотелось бы те же иллюстрации увидеть в Викиверситетах. --Andrew Krizhanovsky (обсуждение) 19:49, 13 декабря 2021 (UTC)Ответить

Итерация LaTeX 17.12-24.12 править

Андрей Анатольевич, добавил Rawgraphs в индекс в обеих версиях и внёс сегодняшние правки. Взгляните, пожалуйста, на скрипт 6.12, который для построения ссылок между сэйю и аниме в разделе про даты рождения, там caption уехал за скрипт. --18:04, 17 декабря 2021 (UTC) --Eugene Newman (обсуждение) 18:05, 17 декабря 2021 (UTC)Ответить

Андрей Анатольевич, хотел обсудить листинг 6.7 (раздел "Полнота Викиданных") в английском LaTeX, который про получение актёров озвучки. Вопрос выношу сюда, а не в ВК, т.к. он довольно громоздкий и не самый срочный, но важный.

Адам верно заметил, что в разделе есть определённый пробел в логике: мы сравниваем количество ролей сэйю в аниме с количеством ролей всех актёров озвучки во всех проектах (не только аниме, но и в мультфильмах/кино), и вывод, касающийся сэйю, кажется нелогичным. Изначально я идею Дарьи не трогал, но теперь она мне тоже кажется не очень связанной с текстом.

Может быть, стоит переписать как-то в духе "количество ролей всех актёров озвучки в 5 раз больше количества ролей сэйю в аниме, поскольку на самом деле индустрия озвучки намного шире, чем только дубляж аниме"? Ну и заменить переменную ?anime в скрипте на ?movie или ?project. Редактировать саму логику скрипта я бы не хотел, поскольку времени остаётся немного, а отладка может затянуться.

Спасибо за комментарий. --Eugene Newman (обсуждение) 14:52, 20 декабря 2021 (UTC)Ответить

Евгений, согласен с тем, чтобы заполнить пробел в логике. Согласен с обоими предложениями (про количество ролей и про имена переменных). Хорошо, логику скрипта оставляем - как она есть. Звал Адама расставить артикли, а пришлось менять содержание. Вот это ответственный человек. --Andrew Krizhanovsky (обсуждение) 15:06, 20 декабря 2021 (UTC)Ответить
@Андрей Анатольевич, предложил новый вариант. Переписал скрипт и вывод и в русском, и английском ВВ и LaTeX, плюс вынес на обсуждение с Адамом. --18:25, 20 декабря 2021 (UTC) Eugene Newman (обсуждение) 18:25, 20 декабря 2021 (UTC)Ответить
@Андрей Анатольевич, прошёлся первым проходом по правкам Адама. Можно уже частично смотреть ВВ и LaTeX, но я ещё пойду на второй круг, чтобы разрешить те вопросы, которые остались на потом. Заодно хотел бы напомнить про проблему со скрытой подписью к листингу 6.12 в английском Техе. Также хотел бы увидеть Ваш комментарий в Google-документе в разделе Future work. Не уверен, что хотел бы касаться в тексте таких деликатных тем. Спасибо. --Eugene Newman (обсуждение) 15:20, 21 декабря 2021 (UTC)Ответить
@Евгений, спасибо! Написал ответы в Google Docs, где увидел вопросы. Мне кажется, что слово "идентичность" уточняет нашу мысль. Кстати, сообразил, возможно, это фразеологизм или хотя бы достаточно устойчивый оборот. По крайней мере в современной Европе.
Скрытую подпись и то, что я хотел два листинга (сорри, запроса) напечатать параллельно в два столбца. Помню. И сейчас попробую поколдовать. --Andrew Krizhanovsky (обсуждение) 16:01, 21 декабря 2021 (UTC)Ответить

Итерация LaTeX 24.12 - 2022 год править

Андрей Анатольевич,правки в русскую версию внёс, можно смотреть. --Eugene Newman (обсуждение) 17:37, 24 декабря 2021 (UTC)Ответить

Вернуться на страницу «Программирование Викиданных/Аниме».