Обсуждение модуля:AutoDescriptionHuman: различия между версиями

Содержимое страницы недоступно на других языках.
Материал из Викиновостей, свободного источника новостей
Содержимое удалено Содержимое добавлено
→‎Ошибки: +Мусорные надкатегории на Категория:Генри_Таррио
Строка 197: Строка 197:
=== Мусорные надкатегории ===
=== Мусорные надкатегории ===
На [[:Категория:Генри_Таррио]] висит куча лишних надкатегорий: [[:Категория:Города без склонения]], красная [[:Категория:Организации без склонения]], и даже [[:Категория:Фамилия не установлена (empty)]] (хотя, смотрите, [[d:Q99826651#P734|с полем «фамилия» у него]] всё в порядке). [[Участник:Incnis Mrsi|Incnis Mrsi]] ([[Обсуждение участника:Incnis Mrsi|обсуждение]]) 16:47, 23 января 2021 (UTC)
На [[:Категория:Генри_Таррио]] висит куча лишних надкатегорий: [[:Категория:Города без склонения]], красная [[:Категория:Организации без склонения]], и даже [[:Категория:Фамилия не установлена (empty)]] (хотя, смотрите, [[d:Q99826651#P734|с полем «фамилия» у него]] всё в порядке). [[Участник:Incnis Mrsi|Incnis Mrsi]] ([[Обсуждение участника:Incnis Mrsi|обсуждение]]) 16:47, 23 января 2021 (UTC)
* [[Участник:Incnis Mrsi|Incnis Mrsi]]: [https://www.wikidata.org/?diff=1346868425 diff]. С остальным так же — где-то нужно дописать, что-то просклонять, это технические категории. Они о том, что скрипт сам не может разрешить ситуацию — нужна помощь человека. --cаша ([[User:Krassotkin|krassotkin]]) 18:26, 23 января 2021 (UTC)


== Предложения ==
== Предложения ==

Версия от 18:26, 23 января 2021

Ошибки

Фатальные ошибки

Нуждается в обработке в первую очередь. Страницы с фатальными ошибками в модуле AutoDescriptionHuman собираются в Категория:Страницы с ошибками в модуле AutoDescriptionHuman. Секция архивируется в Обсуждение модуля:AutoDescriptionHuman/Архивы/Фатальные ошибки.

Ошибки без группировки

"Родившиеся в Владимире" > "Родившиеся во Владимире"

Для категорий вида "Что-то в Где-то" нужно добавить обработку ситуаций, когда после предлога "в" идет слово, начинающееся с "В", после котрой согласная. И в этих случаях менять "в" на "во".

"Категория:Род занятий:..." + "Категория:Профессии без склонения"

Категория:Профессии без склонения

Часто создаю категории по футболистам и шахматистам. Везде где есть шаблон {{Оформление категории}} и где категория по человеку, появляется данная категория, походу. Проблема настолько взбесила (я программист, но не понимаю что не так), что решил написать сюда (и даже создал подраздел).

Возьмём шахматиста, например, Категория:Даниил Дубов (он молодой, не уровня Магнуса Карлсена, который уже много чего выиграл — свойств должно быть немного, плюс россиянин). Викиданные о нём: Q3078552. В модуле Declension прописал склонение слова «шахматист». Теперь идём в Викиданные: род занятий (Property:P106): шахматист (Q10873124). Теперь лезу в этот модуль Модуль:AutoDescriptionHuman. Код «Категория:Профессии без склонения» встречается два раза (оба раза в середине). Рассмотрим первый случай, второй похожий (мне кажется). if (p == true), тогда добавляем категорию «Профессии без склонения». Причём человеку добавляется категория «Род занятий: шахматист» (мне сама постановка категории не нравится, но это другой вопрос, а так — понятно, что свойство Викиданных анализируется). Сначала переопределяется переменная: local p=false. True присваивается вот здесь: if(Declension.declineWord(vi, 7) == "Logical error Declension.declineWord(arg): word not found" or Declension.declineWord(ReturnGendered.launch(vi, entitiesArray["P21"], 2), 7)== "Logical error Declension.declineWord(arg): word not found") then p=true

Во-первых, я не очень понимаю, зачем два типа проверок, разделённые словом or (может там and нужен?)? И второе — попадались ли кому категории без данной категории, где нормально работает? --Brateevsky {talk} 13:48, 30 декабря 2018 (UTC)[ответить]

@DonSimon:, что с этим? --Kaganer (обсуждение) 18:58, 31 октября 2019 (UTC)[ответить]

"Род занятий: священнослужитель" + "Род занятий: clergyman"

Пример: Категория:Епифаний (Думенко)

Проблема: "священнослужитель" - это подкласс от "clergyman" (у которого, кстати, в ВД есть русский перевод). Кажется, в данном случае "clergyman" - лишняя сущность. --Kaganer (обсуждение) 12:13, 17 июня 2019 (UTC)[ответить]

"Род занятий: священнослужитель" + "Род занятий: священник"

Наверное, должно быть только второе. --Kaganer (обсуждение) 18:57, 31 октября 2019 (UTC)[ответить]

"Род занятий: магистрат"

Вот это вот, по-моему, нужно убирать. Это наведённая штука от "выпускник". --Kaganer (обсуждение) 18:28, 24 июня 2019 (UTC)[ответить]

Что с этим? --Kaganer (обсуждение) 18:49, 31 октября 2019 (UTC)[ответить]
Тут всё по-прежнему. --Kaganer (обсуждение) 01:07, 16 марта 2020 (UTC)[ответить]

Ошибки в Викиданных, для которых нужен обработчик

Ошибки в Викиданных, которые можно/нужно исправлять в Викиданных

Лимит по длине названия категории

В движке существует лимит на длину имён. Иногда при автоматическом формировании, длина превышается, и движок не может обработать категорию как ссылку. В результате она вылезает в текст. См. пример: Категория:Евгений Томашевский. Возможно то же самое может наблюдаться в автоматически формируемых ссылках на статьи. И там и там нужно проверять. --cаша (krassotkin) 09:23, 3 декабря 2020 (UTC)[ответить]

Члены академий, научных обществ и различных организаций

То же и для большинства других организаций. То есть "Участники шоу", но "члены Академии Наук". Увы, так принято в русском языке. --Kaganer (обсуждение) 02:13, 31 декабря 2020 (UTC)[ответить]

Президент США vs Избранный президент США

См. Категория:Джордж Уокер Буш - "Избранный президент США с 2000 года по 2001 год после Билл Клинтон перед Барак Обама." А про собственно президентство с 2001 по 2009 год ничего не сказано.
Там в элементе ВД в списке занимаемых должностей есть и "президент США" (d:Q11696), и "Избранный президент США" (d:q1467287 - подкласс от d:Q11696). Я бы в этом случае выводил только d:Q11696, ну или оба значения. --Kaganer (обсуждение) 04:11, 16 января 2021 (UTC)[ответить]

Мусорные надкатегории

На Категория:Генри_Таррио висит куча лишних надкатегорий: Категория:Города без склонения, красная Категория:Организации без склонения, и даже Категория:Фамилия не установлена (empty) (хотя, смотрите, с полем «фамилия» у него всё в порядке). Incnis Mrsi (обсуждение) 16:47, 23 января 2021 (UTC)[ответить]

  • Incnis Mrsi: diff. С остальным так же — где-то нужно дописать, что-то просклонять, это технические категории. Они о том, что скрипт сам не может разрешить ситуацию — нужна помощь человека. --cаша (krassotkin) 18:26, 23 января 2021 (UTC)[ответить]

Предложения

Замены

Некоторая терминология у нас устойчиво отражается по-другому. Её нужно заменять в коде. Возможно должен быть отдельный модуль для таких замен, который проверяется в первую очередь, а дальше уже их склонять, добавлять в категории и т.п. --cаша (krassotkin) 13:53, 3 сентября 2018 (UTC)[ответить]

Вопросы к обсуждению

Индивидуальные замечания

Категория:Олег Абарников

Перенесено со страницы Викиновости:Форум/Общий#Категория:Олег Абарников --cаша (krassotkin) 21:56, 1 ноября 2018 (UTC)

Про меня какое-то мракобесие добавлено. Я не википедист, викимедист, писатель и журналист Казахстана, и в Казахстане последний раз был в возрасте 9 лет в 1994 году. Я исключительно россиянин, и не согласен даже на двойную категоризацию исходя из места рождения. Далее, я нахожусь в «красных» категориях Московский государственный университет (выпускники) (я учился в аспирантуре, и не являюсь выпускником МГУ), Образовательные учреждения без склонения (what?), Род занятий: писатель-документалист (может я и работаю с документами, но в писатели пока точно не гожусь, пока не выпустив ни одной книги), Организации без склонения (what?). Где это всё редактируется? В Викиданных такого нет.—Soul Train (обсуждение) 20:46, 1 ноября 2018 (UTC)[ответить]

  • Да, ты прав, реальное мракобесие. Где-то работает отлично, а где-то сбоит во всех местах. Но работаем над этим, вон выше список багов, которые обнаружили и которые чиним постепенно. Продвигается не быстро. Просто не хватает рук. Извини. В письме пояснил подробнее. Всё обязательно приведём в порядок. Но очень нужны люди, которые подключаться к разработке. --cаша (krassotkin) 22:10, 1 ноября 2018 (UTC)[ответить]
  • Категория «без склонения» — это специфика русского языка. В категориях слова употребялются в другом роде и числе, не в таком как указано в Викиданных (именительный, единственное). Эти категории сигнализируют о том, что для некоторых слов ещё не создана таблица склонений. Мы пока сделали у себя такую табличка, её можно руками пополнять, что мы и делаем постепенно. Но сейчас хотим переписать на Викиданные и забирать склонения оттуда. Но там эта работа ещё медленней чем у нас продвигается. Затянули они с интеграцией Викисловаря. Только в этом году удалось убедить, что это очень важно, в том числе и для таких вот вопросов. Сейчас инфраструктура создана (пример: d:Lexeme:L14233), но наполнения ещё нет. Как только там напишут робота и заберут всё из Викисловаря, подключимся туда и проблема мгновенно исчезнет. --cаша (krassotkin) 22:10, 1 ноября 2018 (UTC)[ответить]

Плохая логика

Не надо валить все данные, снятые с Викиданных, сразу в один массив для последующей обработки. Надо обрабатывать значения последовательно. Каждую пару «свойство — значение» пропускайте через обработчик, создающий потребный для случая викикод. Наверняка можно где-то найти уже готовые образцы, написанные с разумной логикой.

Я попытался было исправить ахинею, возникшую в категория:Лакшми Татма (см. d:Q2617946 #P569 для объяснения причины), но с вашей последовательностью действий с трудом понимаю, как можно справиться с многозначностью, не городя страницы дополнительного кода. И такое же может случиться с другими (нечётко известными) атрибутами персоны, да и не только персоны. Incnis Mrsi (обсуждение) 19:09, 3 февраля 2020 (UTC)[ответить]

  • Многие утверждения создаются на основе сразу нескольких полей. Вытаскивать их из Викиданных — непрозрачная операция с кучей проверок, и если её делать многократно, совмещая с логикой формирования утверждений, получится совсем нечитабельно. Но сейчас тоже не гуд, согласен. Если кто может рефакторить симпатичней, будет здорово. --cаша (krassotkin) 11:50, 3 января 2021 (UTC)[ответить]

Ключ сортировки

Необходимо добавлять ключ сортировки по фамилии (как это уже делается на Викискладе), на основании языковой метки для элемента-значения свойства "Фамилия".
Если автоматический ключ отличается от заданного вручную, нужно выводить сообщение (также по аналогии с Викискладом).
Если у элемента Викиданных нет свойства "Фамилия" или для фамилии нет русской языковой метки, добавлять специальную категорию отслеживания (чтобы можно было увидеть фронт работ по добавлению значений в ВД). --Kaganer (обсуждение) 23:13, 26 декабря 2020 (UTC)[ответить]