Лента новостей

20:20
Почему Казахстан переходит на латиницу
20:14
За Серебренникова поручились Киркоров, Малахов, Бондарчук и пр.
20:10
Будущее под прицелом: Как предупреждать теракты нового типа и к чему готовиться завтра?
20:09
Рекс Тиллерсон пошел по пути своего предшественника-русофоба
20:04
В Раде хотят принять закон о «гибридной войне», чтобы закрывать СМИ, которые «очерняют действительность»
20:03
Украинцы на экспорт: британское рабство по европейскому безвизу
19:08
Польша: шизофрения прогрессирует
19:07
Безработицей по всепропальщикам! Рынок труда растет больше полугода
19:04
США продолжают провокации и конфронтации. КНДР моделирует атаку
19:04
Сатановский об Акербатском «котле» в Сирии: Неправильно давать какие-то прогнозы
19:03
Печальные новости, Европа: своих деток мало, а мусульман много?
19:02
The New York Times – рупор «кремлевской пропаганды»
19:02
Миф об украинских миротворцах. О чем говорили Сурков и Волкер
19:01
В Киеве украинцы жгут покрышки, требуя расследовать дело о похищении людей на Майдане
18:59
Гулять – так на последние! Украина нашла уголь на краю земли
18:59
На рубль надвигается «идеальный шторм»
18:58
«Тигры» и ВКС России сжимают котёл, завершая разгром ИГИЛ
18:58
Запад готовит грандиозный удар по России со всех направлений
18:56
Киев вывел на парад независимости Украины весь свой металлолом
18:56
Американцы подсчитали украденные у России триллионы
18:55
«Кузнецов» уходит в отпуск. Каким станет российский авианосец после ремонта
18:54
Советское танковое наследие на Украине близко к исчерпанию
18:10
Уроки сирийской войны
13:45
Окончательно потерялись в «перемогах». Украина прошла точку невозврата
13:44
Тополь-М против Minuteman III: почему наша ракета мощнее
12:50
Ядерное оружие КНДР: Сделано в США
11:38
В Киеве опять оценили Крым: хроники украинского стяжательства
11:37
Режиссёра Кирилла Серебренникова поместили в изолятор временного содержания
11:35
Украинская церковь заставит поляков покаяться за Волынскую резню
11:34
Важный свидетель Украины в «ракетном деле» наговорил лишнего
11:29
О режиссере Серебренникове, кастовости, и гораздо более равных свиньях
11:25
Ким Чен Ын зауважал Трампа?
11:09
Санкционные войны: Россия нанесет ответный удар
11:04
Почему украинским переселенцам не рады в соседней Белоруссии
11:03
Россия доедает теневые резервы валюты
10:59
Угроза на триллион рублей: ЦБ спешит на помощь банкам
10:59
Украина оказалась под прицелом российских ракет
10:55
Решить корейский кризис Трампу поможет звонок в Кремль
10:50
США собираются оккупировать энергетический рынок Европы
09:07
Frankfurter Allgemeine Zeitung: Контрсанкции Путина вредят россиянам
09:04
Варшава сошла с ума, потребовав от Москвы триллионы за войну
09:00
Do Rzeczy: Конфронтация у Рубикона
08:52
Nation Alreview: «Украина не достойна уважения»
08:44
KCNA Wath: Россия ослепла или притворяется?
08:40
России предлагают развивать ЕАЭС за свой счёт
Все новости

Архив публикаций

«    Август 2017    »
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031 
» » Lsjbot - программа-бот, "перу" которой принадлежит 2.7 миллиона статей Википедии

Lsjbot - программа-бот, "перу" которой принадлежит 2.7 миллиона статей Википедии

Бот

Люди, которые интенсивно пользуются интернет-энциклопедией Wikipedia, наверняка стали замечать, что в ней стало появляться все больше и больше материала, наполненного цифрами и фактами, и написанного "сухим", иногда даже кажущимся неестественным языком. Это является прямым следствием того, что подавляющее большинство новых материалов для Википедии уже создается не людьми-энтузиастами, авторами этого материала являются специализированные программы-боты, которые в автоматическом режиме собирают данные из множества достоверных источников, обрабатывают эти "сырые" данные и производят удобочитаемый текст статьи на основе одного из стандартизованных шаблонов.

Согласно информации, опубликованной недавно издательством Wall Street Journal, самой продуктивной программой-ботом является программа Lsjbot, которая добавляет в Википедию около 10 тысяч статей в день, а всего ее "перу" принадлежит около 2.7 миллиона уже размещенных статей, что составляет 8.5 процентов от общего количества. Программа Lsjbot является детищем Сверкера Йоханссона (Sverker Johansson), сотрудника Шведского университета, которые имеет ученые степени в области лингвистики, гражданского строительства, экономики и физики элементарных частиц.

Большинство статей, генерируемых программой Lsjbot, касается видов животных и описаний небольших городов на Филлипинах. Две трети статей написаны на языке филлипино и одна треть - на шведском языке. Как только программе указывают объекты для написания статей, к сожалению, она пока не может искать их самостоятельно, программа собирает из разных уголков Интернета всю доступную информацию, пишет статью и отправляет ее на Википедию.

Википедия принимает статьи от нескольких видов программ-ботов, к примеру от программы rambot, которая используется для сбора данных и написания статей об американских городах, округах и штатах. Но создание Сверкера Йоханссона является безусловным лидером, как по качеству, так и по количеству посылаемого в Википедию материала. 

У практики использования автоматизированных программ-ботов для наполнения Википедии имеется масса противников. Но Йоханссон яро защищает такой подход, аргументируя это тем, что достаточно большое количество материала в Википедии написано "малолетними кретинами". В качестве примера он приводит, что в шведском сегменте Википедии присутствует 150 статей, касающихся темы "Властелина колец", а тематике войны во Вьетнаме посвящено всего 10 статей, да и те не блещут информативностью. В статьях же, сформированных программой Lsjbot, предоставлена только достоверная информация, взятая из надежных источников, эти статьи точны, за крайне редкими исключениями, и с помощью программ-ботов можно осветить в Википедии те темы, до которых у живых людей никогда не дошли бы руки.
 


Первоисточник





Опубликовано: legioner     Источник

Похожие публикации


Добавьте комментарий

Новости партнеров


Loading...

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.
Наверх