Новости / Hi-Tech / Компьютер научили отличать факты от вымысла
Фото с сайта olms.cte.jhu.edu
Компьютер научили отличать факты от вымысла
Ученые разработали алгоритм, который позволяет компьютеру отличать новостные сообщения от художественных текстов — к примеру, рассказов. Алгоритм, придуманный авторами этой научной работы, анализирует, сколько раз любое слово из текста встречается вместе с другими словами в рассказах и новостных сообщениях. Полученные данные впоследствии сравнивали.
Оказалось, что для двух данных типов текстов этот показатель заметно отличается. Исследователи проверили созданную ими методику при помощи 400 новостных заметок, случайным образом выбранных с новостного сайта, и 400 случайных рассказов из базы электронной библиотеки.
Чтобы исключить влияние исторических особенностей языка, авторы выбирали для анализа произведения писателей XX века. В итоге для новостных заметок точность угадывания составила 69,1% с погрешностью 1,22%, а для рассказов — 73,8% с погрешностью 5,15%.