Обнаруживающее обман программное обеспечение определяет поддельные бумаги

Все это началось как розыгрыш в 2005. Три аспиранта информатики в Массачусетском технологическом институте — Джереми Стриблинг, Макс Крон, и Дэн Агайо — создали программу для генерации бессмысленных научно-исследовательских работ информатики. Цель, говорит Стриблинг, теперь разработчик программного обеспечения в Пало-Альто, Калифорния, должен был “выставить отсутствие экспертной оценки на низкокачественных конференциях, по существу обманывающих исследователей с публикацией и сборами за конференцию”.

Программа — назвала SCIgen  — скоро найденным пользователями в мировом масштабе, и в ближайшее время его автоматически сгенерированные создания принимались научными конференциями и издавались в согласно заявлению рассмотренных пэрами журналах. Но SCIgen, возможно, наконец встретил свой матч.

Академический издатель Спрингер на этой неделе выпускает SciDetect, общедоступная программа для автоматического обнаружения автоматически сгенерированных бумаг.SCIgen использует “контекстно-свободную грамматику” для создания салата слова, который похож на разумный текст издалека, но легко определен как ерунда читателем. Например:Cyberneticists соглашаются, что семантические методы являются интересной новой темой в области языков программирования, и теоретики соглашаются.

Это – прямой результат развития веб-браузеров. После лет востребованного исследования точек доступа мы подтверждаем визуализацию ядер.

Земноводные подходы являются особенно теоретическими когда дело доходит до обработки крупных многопользовательских онлайновых ролевых игр.SCIgen также генерирует выглядящие впечатляющим образом но бессмысленные участки данных, блок-схемы и цитаты. Трио под названием SCIgen в честь Мировой Мультиконференции по Systemics, Кибернетике и Информатике (WMSCI), ежегодное мероприятие, которое они подозревали, мошеннически утверждало, что использовало человеческих рецензентов пэра для проверки подчинения.

Действительно, две из их бумаг ерунды были приняты WMSCI.Трио тогда поместило SCIgen онлайн как бесплатное обслуживание, ободрительные исследователи для “самозарождений, подчинение к конференциям, которые Вы подозреваете, могло бы иметь очень низкие стандарты подчинения”. И утверждайте, что они сделали. За прошлое десятилетие исследователи надели многочисленные розыгрыши на журналы и конференции, утверждающие, что использовали человеческих рецензентов пэра.

Разновидности на SCIgen появились для других областей от математики до постмодернистской теории. (Этот автор продолжал традицию, но использование различного поддельного генерирующего бумагу метода.)Розыгрыши допускались издателями до 2013, когда 85 бумаг SCIgen были обнаружены в изданных продолжениях 24 различных конференций по информатике между 2008 и 2011. Больше было скоро обнаружено, и от 122 трудов конференции ерунды в конечном счете отрекся Спрингер, академический издательский гигант, базируемый в Гейдельберге, Германия, и Институтом Инженеров-электриков и Инженеров-электроников, базировалась в Нью-Йорке.Вместо того, чтобы создаваться как розыгрыши, кажется, что многие поддельные бумаги прибывали из Китая, где они были “куплены академиками и студентами” для дополнения их учетов публикации, говорит ведущий исследователь позади расследования, Сирил Лэйбб, программист в Университете Жозефа Фурье в Гренобле, Франция.

Позже в том году расследование Наукой раскрыло подземный рынок для поддельных дипломов, в которых некоторые коробейники, возможно, использовали SCIgen для экономии себе усилий писания «подлинных» поддельных работ вручную.В связи с тем кошмаром связей с общественностью Спрингер приблизился к Labbe для помощи. Его метод для нахождения бумаг ерунды был сложен, требуя статистического метода, подобного почтовому обнаружению спама, но на основе грамматических образцов, а не на ключевых словах как «Виагра».

Он согласился за цену.Результат того соглашения был показан в Спрингере 23 марта пресс-релиз. Это объявляет об общественном выпуске SciDetect, программа, созданная исследовательской группой Лэйбба для автоматического обнаружения бумаг, созданных с SCIgen и подобными программами. Его цель, по словам Спрингера, состоит в том, чтобы “гарантировать, чтобы несправедливые методы и быстрые обманы не оставались незамеченными”.

Когда спросили, сколько деньги Спрингер заплатили бригаде Лэйбба, представитель ответил, что, “к сожалению, мы не можем предоставить Вам финансовые числа”, но отметили, что было достаточно финансировать 3-летнего аспиранта в лаборатории Лэйбба.Но некоторые рассматривают SciDetect как инструмент для предотвращения затруднения вместо того, чтобы ловить мошенников. “Поскольку кто-то, кто использовал SCIgen для демонстрации отсутствия передовой статьи и экспертной оценки подозрительного журнала, любого с капелькой английского языкового мастерства, должен быть в состоянии обнаружить работу, написанную SCIgen или подобным программным обеспечением”, говорит Филип Дэвис, независимый исследователь, консультирующийся для издательского дела. “Мне это, кажется, шаг издателя для защиты себя от нежелания редакторов журнала избавиться от самих этих мошеннических бумаг”.

Или поскольку Пол Джинспарг, основатель arXiv и уже алгоритма в свободном доступе для обнаружения тарабарщины, говорит, “Замечательно, что Спрингер двинулся для устранения статей, сгенерированных программным обеспечением, преднамеренно производящим ерунду, но что относительно непреднамеренно бессмысленных статей, созданных человеческими авторами?”В почтовом обмене с Наукой написал представитель Спрингера, “Мы соглашаемся с тем, что Сирил Лэйбб говорит в своей цитате [в пресс-релизе]: ‘Программное обеспечение не может заменить экспертные оценки и академическую оценку, но SciDetect предоставляет издателям дополнительную руку в борьбе с мошенничеством и поддельными бумагами’”.

Она добавила, что никакие статьи тарабарщины SCIgen не были представлены конференциям Спрингера или журналам начиная с сокращений 2013 года.Что касается шутников, они должны будут просто работать тяжелее, говорит Стриблинг, создатель SCIgen. “Я готов держать пари, хотел ли кто-то объявить гонку вооружений, они могли бы придумать другой способ генерировать бумаги, которые одурачили бы [SciDetect] снова некоторое время”.