Господа! Извините, накипело. Сколько ещё мы будем созерцать эти бестолковые и абсолютно неэффективные попытки реализации хорошего замысла по отслеживанию плагиата? Ведь просто так, на ровном месте, унижают необоснованными обвинениями совершенно неповинных людей. Более того, никаких извинений не последует.
Вот ещё один вопиющий случай. Совсем свежий. Уже не знаю какой по счёту, семидесятый или 358-й. Созерцаю подобное ежедневно.
Уважаемый и интересный автор @kavalsky, практикующий юрист, опубликовал в качестве иллюстрации к статье опись материалов одного дела из своей практики:
В результате ему предъявили. И что бы вы думали? Какой-то совершенно непохожий документ, даже отдалённо не напоминающий авторский. Как можно было это перепутать с этим? Прийти и ткнуть автора носом в какую-то несуразицу? Мол, покайся публично. Вот этот, с позволения сказать, документ (ниже), по мнению "Культуры голоса" автор бесчестно использовал в своих подлых, корыстных целях:
Почему-то никакого сходства не улавливается. Какие-то инсинуации и попытки навести тень на плетень. Кому и зачем это нужно?
Так мы культуру не поднимем. Один бот оскорбил на ровном месте, второй это дело лайкнул. С миру по 6 центов, голому репутация 71 балл. А извиняться некому.
"Господа! Вы звери, господа..." Х/ф "Раба любви"
Если робот/бот/ИИ настолько сырой и несовершенный, возможно имеет смысл его сначала доработать, а потом уже экспериментировать на живых людях? Мне возразят, что в противном случае будет вал плагиата. Да ничего подобного. Сама идея вполне здравая и нужная. Но бот (робот, ИИ) не годится для этих целей. Он может использоваться, конечно же, как вспомогательный фильтр, чтобы сигнализировать "хозяину" о подозрительных текстах, но решения принимать должен человек.
@cheetah и @anyx — не последние люди на платформе, насколько я понимаю. Не побоюсь этого слова, делегаты. Один использует анонимного бота с кривыми настройками, с лёгкостью обвиняющего приличных авторов в плагиате, а второй ходит следом и ставит апвоуты 60% СГ. Я усматриваю в этом не борьбу с копипастой, а её имитацию, а также благовидный предлог для заработка и промоушена, ведь такими нехитрыми манёврами они разогнали собственную репутацию до 71 балла.
Предлагаю прекратить это "культурное хамство" и внести некоторые изменения в работу проекта "Культура голоса". Нанять на место бота за 150 евро исполнительного и расторопного сотрудника на полный рабочий день, выйдет лучше и дешевле. От человека можно требовать ответственного подхода и конкретных результатов в борьбе за чистоту текстов и защиту авторских прав.
Выгоним менял из храма.
[Канал на youtube — Михаил Александров]
Ещё раз извините за резкий тон. Высказываюсь на эту тему не впервые, но натыкаюсь на стену или вернее на сплочённую греческую фалангу "взаимолайкеров", которым всё нравится в работе КГ. Их мало, но они решили, что пишут правила для всех, а наше дело помалкивать "в тряпочку" и не попадаться.
В посте @kavalsky содержится один абзац текста и длинный список документов, который, особенно если исключить повторяющиеся пункты, скорее всего будет более менее стандартен для любого уголовного дела. На этот список и навелся бот, так как нашел, скажем, на 60% такой же на другом сайте.
Учтите, что бот скорее всего исключил из списка @kovalsky повторяющиеся пункты и отбросил номера страниц и номера пунктов. Порядок этих пунктов тоже роли для него не играет. Попробуйте мысленно проделать это и вы увидите, что списки довольно таки похожи.
Это достаточно типичная проблема, возникает, когда в тексте используются данные из справочников/учебников или нечто на них похожее. Копирайтеры иногда обходят эту проблему, вставляя такие данные в виде картинки - особенно часто это касается таблиц, ну и списков тоже.
Понятно, что обычный пользователь не знакомый с SEO вполне может не знать таких нюансов. Но с другой стороны в комментарии cheetah, ведь четко написано, что это бот - как-то странно на него обижаться или приписывать его действия живым людям.
Использование студентов проблему скорее всего не решит. Им придется применять все тот же софт для определения плагиата, а потом пытаться разобраться, почему возникла проблема с уникальностью. И часто это совсем не тривиально разобраться, когда произошло досадное совпадение, как с текстом @kavalsky, а когда человек просто неудачно уникализировал чужой контент добавив каких-то циферек и копий пунктов в списки.
скорее всего будет более менее стандартен для любого уголовного дела. На этот список и навелся бот, так как нашел, скажем, на 60% такой же на другом сайте.
Верно, список не претендует на текстовую оригинальность. Он оригинален в целом, так как является частью уголовного дела. Но если рассматривать его в контексте посыла моего поста , то я хотел подчеркнуть объем работы, которая выпадает на следователя.
К тому же, я все таки поработал над этим списком два раза - первый раз, когда его писал лет 5-6 назад, а второй раз, когда его "обезличивал", чтобы опубликовать.
Поэтому получить первым комментом обвинение в плагиате, скажу честно - не очень приятно. В данном конкретном случае избежать лайка от @cheetah я мог единственным способом - не публиковать этот список, а соответственно и пост.
Тем не менее я на него зла не держу, он же бот) и по большому счету ничего плохого мне не сделал - флагов не понаставил, так что все норм!)
Это достаточно неочевидная проблема, особенно, если вы не сталкивались раньше с проверками текстов на уникальность. К сожалению, сделать идеальную автоматическую проверку на данный момент невозможно, они все так или иначе глючат. Остается только разруливать все это вручную, причем для этого во многих случаях будет требоваться непосредственное участие автора.
Если провести аналогию, это как штрафы за разбрасывание мусора. Да, вас могут оштрафовать по ошибке или вообще не законно. Но отменить штрафы, тоже вариант так себе, есть шанс через время обнаружить, что живешь на натуральной помойке. Издержки. так сказать, цивилизации.
Спасибо за понимание и за то, что не обижаетесь на Читах бота!
Да, нет проблем)
Мы благодарны @wealthycat за такое подробное объяснение.
Мы можем просто добавить, что другой популярный бот Антиплагиат, показывает уникальность текста у обсуждаемого поста - 56%
Поэтому не удивительно, что Читах бот оставил комментарий, возможно он ошибся с первоисточником, но причины вами хорошо описаны...
Спасибо за неравнодушие к теме уникальности текста на платформе ГОЛОС!
Если позволите, попробую высказать свое, чисто субъективное мнение, ни в коем случае никого ни к чему не призывая и никого не стремясь обидеть.
Мне cheetah нравится. Он мягкий и пушистый.
Интересно читать, как люди общаются с роботами и реагируют на его сообщения. Меня он пока не кусал, но интересно (не страшно, а именно интересно), как я поступлю когда укусит. Может быть дело в отношении? Как относиться к сообщениям робота ? Насколько я понял из Вашей статьи, он сожрал чьи-то деньги или голоса. То есть поступил неправильно и ошибочно. А как бы Вы отнеслись к котенку, который набедокурил в Вашей квартире ?
Некоторые вышвыривают на улицу. Некоторые нанимают дополнительного работника для присмотра. Некоторые пытаются воспитать. Мне, почему-то, по душе больше третий способ. Вы предлагаете второй.
То, что натворил cheetah в данном случае, как мне кажется, один из (и далеко не первый и не последний) программный баг (ошибка программы). То, что Вы это обнаружили и написали данную статью - спасибо Вам огромное за интересную тему и поднятую проблему, я Вас поддерживаю. Отсылать информационные сигналы от робота разработчику при возникновении нештатных ситуаций (например мяукать) - да, хорошая идея, хорошо бы роботу этому научиться. Про наемного работника - мы идем в будущее, к каждому роботу человека не приставишь. Это ручное управление. Что мы будем делать, когда роботов будет больше чем нас и они станут сильнее чем мы? Нам просто не хватит людей. Нам нужны будут свои cheetah-ы, выращенные из таких вот котят. Может стоит сообществу, по желанию отдельных его представителей, взять над ним шефство, и статьями подобными Вашей, при выявлении недостатков (ошибок, багов), сообщать разработчику о возникшей проблеме? cheetah же только мяукать, рычать, и кусаться может :) А разработчикам, по мере возможностей, контролировать ситуацию с его подопечным, реагировать на сигналы, исправлять баги, и, в целях общего развития всего сообщества (опять же по мере возможностей), сообщать о состоянии питомцев и принятых мерах по недопущению впредь. Пока cheetah не вырос и не сожрал все сообщество. Ух, как много наговорил. Призываю не относиться к данному комментарию слишком серьезно, это всего-лишь предложение. Просто точка зрения компьютерщика и программиста.
Чита - это бот, принадлежащий аниксу.
Отдельный прикол, кстати, что состав КГ засекречен.
@eee А почему засекречен состав доблестной команды?
тоже столкнулась с этим, и не могу понять, для чего нужно им скрывать свои честные имена.
Я-то откуда знаю? )
Они обычно в ответ на этот вопрос делают загадочное лицо и спрашивают: "А вам зачем это знать?".
а меня посылают читать все отчеты
Один человек функционирует как два делегата? Это законно вообще?
Почему нет? Где написан запрет?
Там большая конкуренция за место в топ-19, насколько мне известно. Больше сотни желающих. А при таком подходе один человек может застолбить 3, 5 или 10 мест вверху списка. Здравый смысл подсказывает правило: 1 человек = 1 депутат.
Это невозможно отследить. Требовать паспорта у делегатов? С чего бы вдруг?
Делегатов выбирает народ (как бы). Если народ готов предоставить кому-то два места (да хоть десять), то кто может возражать?
И Чита в топ-19 не входит, т.е. никаких решений не принимает. По сути, это не "делегат" в полном смысле, а просто нода, изредка подписывающая блоки.
Голос уже копирует структуру и атрибутику общества: политические распри, битвы за власть, деление на политические партии. Так и до вооруженного переворота не далеко)
Так в основе же деньги, а где они, там и всё остальное.
Ваш пост поддержали следующие Инвесторы Сообщества "Добрый кит":
gidlark, losos, ukrainian, kavalsky, oleg257, vadbars, elviento, dr-boo, vasilisapor2, chika25, varvar, renat242, romapush, voltash, gloriya, yuriks2000, anomalywolf, amelina.elena, lushaya, mixtura, kertar, nerengot, now, igrinov, ifingramota, foxycat
Поэтому я тоже проголосовал за него!
Если Вы проголосуете за этот комментарий, то поможете сделать "Доброго Кита" сильнее!
Как у вас все запущено... (с)
@romapush Спасибо за поддержку!)
Мы не нашли комментария от Культуры Голоса в указанном вами посте пользователя @kavalsky
Принципы работы Читах бота, описаны в посте: Часто задаваемые вопросы о Cheetah (FAQ)
Согласно статье:
Поэтому, если вы обнаружили ошибку в выявлении копипасты, вы можете обратиться к создателю бота...
Мы не против если кто-то создаст своего Бота и откроет свою группу. Может даже нанять за деньги персонал...
В данном случае конкретный косяк. Может, Чите перейти на уведомительный режим? Зачем сразу флаговать не разобравшись?
да, на мой взгляд чита должна информировать, а тот кто голосует, уже изучать ссылку и пост на голосе и решать, плагиат тут или нет
Это еще раз говорит о том, что любая автоматизация должна быть без голосования.
Голос не нанимает. Голос предлагает побыть волонтером в той области, в которой ты разбираешься, два часа в неделю. Я много в чем разбираюсь, но я плохо представляю себе, как можно что-то сделать за два часа в неделю. И даже за два часа в день
Да эти два-три бота, занимающиеся проектом КГ, самоналайкиванием под сомнительными, по их мнению, текстами зарабатывают больше, чем получает программист в странах "третьего мира", а проку мало.
В конце концов, давайте скинемся 150 человек по доллару и наймём толкового специалиста на полный рабочий день. В наших странах зоны .ru - это нормальная зарплата. С него можно требовать ответственного подхода и конкретных результатов.
скидываться готова. про толковых специалистов за 9 тыс руб на полный раб день никогда не слышала)
В Украине выстроится очередь за такой оклад.
Да, по поводу этой «чистоты» трескотни очень много последнее время…
А вот интересно: в чем смысл-то, то есть зачем надо копипаст отслеживать и так далее?
Это плохо для сайта «Голос», что тут типа неподлинные тексты, или что?
@bhagavat , посети мероприятие и отметься ;)
https://golos.id/ru--golos/@wealthycat/chto-takoe-kopipasta-i-chem-imenno-ona-opasna-dlya-platformy-golos
Спасибо! посетил, отметился… Все понял, буду думать. -))-))
Насколько я понял, изначально Golos.io задумывался в качестве платформы для журналистов и блогеров. А эти категории граждан чувствительны к защите авторских прав.
Ошибочка. Журналисты к этому абсолютно бесчувственны) Да и блогеры. Разве что начинающие
Еще две недели назад офиц причиной был индекс цитирования в поисковых. Что сейчас, не знаю
Ладно, что бы ни было причиной, цель хорошая. Сейчас речь о методах её достижения и о том, что под раздачу часто попадают ни в чём не повинные.
Зато от читы я узнаю, что некоторые мои статьи, которые я считала утерянными, были не только опубликованы без редактуры, но и перепечатаны уездными вестниками
Официальная версия команды - проблемы с SEO при неоригинальном контенте.
Версия "группы товарищей", истово следящих за чистотой (расы) контента - недопущение зарабатывания на чужой "собственности". Пограничная ситуация - когда чужой контент используется с согласия автора. КГ как бы не против (меня они не трогали, когда я фигачил статьи из Коммерсанта по договору), но тут уже напрягается команда по поводу SEO.
Ну да, это верно – для интернета плохо иметь неоригинальный контент на своем сайте.
Это как на пафосную вечеринку прийти в поддельном Ролексе и китайском Gucci
Сразу все подумают, что ты «чмо»
-)))
Ха-ха