3D-модель: «IBM Selectric II Typewriter» by maxdragonn

Искусственный интеллект в журналистике: помощник или конкурент?

Ведущие мировые медиа все чаще используют искусственный интеллект для создания материалов, а в некоторых СМИ роботы уже сами пишут новости. Какой будет журналистика будущего и не заменит ли ИИ живых авторов? Разбирается автор сверхновой и телеграм-канала «Работник культуры» Степан Ботарев.

Затишье перед бурей

В интернете можно часто встретить предсказания о том, что ИИ однажды отберет у людей их рабочие места. Среди жертв цифровизации могут оказаться и журналисты, считает профессор компьютерных наук Кристиан Хаммонд. Согласно его прогнозам, к концу 2020-х роботы будут писать больше 90% всех новостей.

Как бы ни было грустно, с описанной тенденцией уже можно встретиться и в реальности. К примеру, весной 2020 года компания Microsoft уволила больше 50 журналистов и редакторов, писавших новости для Microsoft News и других сервисов компании. Их место займет искусственный интеллект, объяснили сотрудникам.

Пока Microsoft увольняет новостников, проект JournalismAI предлагает авторам поработать совместно с нейросетями. Пока одни обвиняют ИИ в распространении фейк-ньюс, другие, напротив, видят в нем средство для борьбы с ложной информацией. Впрочем, несмотря на такое неоднозначное отношение к ИИ в журналистской среде, в целом, к внедрению новых технологий большинство относятся с одобрением. Согласно опросу, проведенному в 2018 году Институтом исследования журналистики Reuters, 78% руководителей считают, что инвестиции в ИИ необходимы.

Дата-журналист и автор книги «Создатели новостей: искусственный интеллект и будущее журналистики» Франческо Маркони сравнивает происходящее с этапом развития западных медиа в поздние 1990-е. Тогда интернет-бум заставил традиционные СМИ полностью перестроить подход и к написанию текстов, и к их распространению.

Сегодня мы видим результаты этой перестройки: в 2018 году онлайн-СМИ стали основным источником новостей для 39% читателей. Перемены, которые произойдут после внедрения искусственного интеллекта в работу СМИ, будут еще более радикальными, уверен Маркони.

Обложка книги «Создатели новостей: искусственный интеллект и будущее журналистики» Франческо Маркони

Как в журналистике уже применяют ИИ

ИИ — это зонтичный термин. К нему относятся разные идеи, техники и технологии, среди них — машинное обучение и обработка естественного языка. Франческо Маркони выделяет три сферы применения ИИ в журналистике:

Рассмотрим каждый из способов применения ИИ на примерах.

Сбор данных: от распознавания эмоций до поимки работорговцев

ИИ видит то, чего не замечает человек. Бот газеты The Washington Post, например, умеет выделять необычные паттерны данных, достойные внимания журналистов. Похожую технологию использует и редакция Bloomberg News: ИИ изучает большие данные и отправляет журналистам уведомление, когда находит повторяющиеся взаимосвязи или аномалии.

Публикация знаменитого «Панамского архива» тоже была бы невозможна без участия ИИ. Участники Международного консорциума журналистов-расследователей (ICIJ) разработали инструмент, который позволил распознать и проиндексировать более 13 миллионов конфиденциальных документов, оказавшихся в их распоряжении. В результате журналистам, а затем и всему миру, стало известно о секретных счетах мировой элиты в панамских офшорах.

Обработка естественного языка (англ. Natural Language Processing, NLP) — одна из технологий, которую используют журналисты, чтобы находить смысл в наборах данных (например, архивах). Эта разновидность ИИ, появившаяся в 1950-е, позволяет распознавать структуру и семантику предложений, идентифицировать людей и организации и, что самое важное, определять повторяющиеся паттерны.

Онлайн-медиа Vox использовало NLP для анализа ежегодных посланий Конгрессу бывшего президента США Барака Обамы. Подсчитав частоту употребления определенных терминов — таких как «экономика», «рабочие места» и «война», ИИ смог определить главные темы каждого из посланий. Похожий анализ проводили и другие американские СМИ.

После массовой стрельбы в Лас-Вегасе в октябре 2017 года в американском обществе с новой силой разгорелись дебаты о природе насилия. Издание Quartz восприняло полемику как повод для исследования. С помощью NLP редакция проанализировала 141 час видеоэфиров ведущих кабельных телеканалов. Среди прочего, выяснилось, что эпитет «радикальный» чаще всего использовали по отношению к убийцам, которые не были белыми.

Годом ранее Quartz применил ИИ для распознавания эмоций. Проанализировав выражения лиц Дональда Трампа и Хиллари Клинтон во время предвыборных дебатов, искусственный интеллект пришел к выводу, что Клинтон выглядела счастливее оппонента. А в 2017 году в The Wall Street Journal объяснили, как ИИ распознает выражение лица, встроив в статью инструмент для определения эмоций.

Иллюстрация: Sarah Slobin, Quartz

Еще один выдающийся пример использования ИИ в сборе информации показало новостное агентство Associated Press. Частная компания DigitalGlobe предоставила агентству доступ к спутникам, оснащенным ИИ. С их помощью журналисты смогли отыскать в прибрежных водах Юго-Восточной Азии лодки, перевозящие рабов. За эту работу в 2016 году расследователи удостоились Пулитцеровской премии.

Создание контента: от расшифровки интервью до автоматических новостей

Один из самых очевидных способов применения ИИ для создании контента — перевод иноязычных источников и расшифровка интервью. В частности, сервис машинного перевода на основе нейросетей DeepL попал в десятку лучших примеров использования ИИ по мнению самих журналистов. А в 2014 году бывший репортер Джефф Кофман разработал один из первых расшифровщиков речи для СМИ — Trint. После того как программу протестировали и оценили BBC, NPR и The Washington Post, Trint быстро набрала популярность. По словам Кофмана, точность расшифровки составляет от 95 до 99 процентов.

The Forbes пошел еще дальше и в 2018 году разработал систему Bertie, рекомендующую сотрудникам редакции заголовки и темы для статей на основе предыдущих публикаций журнала. По словам руководителя цифровой трансформации The Forbes Салаха Залатимо, команда разработчиков хотела таким образом извлечь пользу из многолетнего наследия издания. Залатимо называет Bertie «бионическим костюмом» для журналистов.

На еще более радикальный шаг решились журналисты Los Angeles Times. В 2014 году издание первым написало о землетрясении неподалеку от калифорнийского Вествуда. Автором новости стал робот Quakebot, разработанный одним из журналистов. Сегодня же, по утверждению The Forbes, ведущие СМИ мира еженедельно публикуют сотни тысяч статей, написанных ИИ.

Для этих целей используют технологию под названием генерация естественного языка (англ. Natural Language Generation, NLG). Собственные роботы-журналисты числятся в штате многих медиа. Для The Washington Post пишет бот Heliograf, для Bloomberg — Cyborg, для австралийской редакции The Guardian — ReporterMate.

Правда, авторы-роботы умеют писать статьи только на основе хорошо структурированных данных: например, графиков и электронных таблиц. На глубокий анализ они не способны. Допустим, Heliograf свои первые тексты написал во время летних Олимпийских игр 2016 года на основе результатов и расписания спортивных матчей, а также таблиц медального зачета.

3D-модель: «IBM Selectric II Typewriter» by maxdragonn

Распространение информации: от персонализации контента до виртуального ведущего

Помогает искусственный интеллект и в дистрибуции контента. Так, в The Wall Street Journal разработали динамический платный доступ. Благодаря машинному обучению в издании определяют, с какой вероятностью читатель оформит подписку. В зависимости от этого ИИ решает, как много статей и какого формата показать посетителю бесплатно. Например, читатель, который отыскал статью, воспользовавшись поиском на сайте издания, заплатит за подписку с большей вероятностью, чем посетитель, наткнувшийся на статью в соцсетях. Поэтому первому пейволл позволит прочитать больше бесплатных материалов.

А британское информационное агентство Press Association прибегает к ИИ для локализации своих материалов. Основанная агентством компания RADAR использует данные из открытых баз, чтобы производить вариации одной и той же статьи для разных регионов страны.

Таким же образом ИИ использовала французская газета Le Monde. Во время региональных выборов 2015 года издание обратилось за сотрудничеством к компании Syllabs. Ботам Syllabs предоставили доступ к открытым государственным базам статистических и экономических данных, а затем обучили их редакционному стилю газеты. Когда выборы начались, боты написали огромное количество локализованных статей. В зависимости от муниципалитета в текстах варьировалась информация об уровне экономического роста, безработицы и инфляции.

ИИ применяют и для персонализации контента. Подобно тому как Facebook подстраивает ленту новостей под предпочтения пользователей, медиа стараются индивидуализировать читательский опыт. Например, в мобильном приложении газеты The New York Times есть раздел «Для вас». Другие не отстают: согласно опросу 2019 года, 70% онлайн-медиа создают персонализированный контент для своей аудитории.

Чтобы облегчить потребление информации, СМИ создают ботов, автоматически преобразующих текст в речь. Скажем, в BBC разработали сервис ALTO, который делает стенограммы видеороликов и переводит их на множество языков. Полученные тексты озвучивают — снова с помощью ИИ. После этого ALTO автоматически накладывает искусственно созданную озвучку поверх основного голоса в видео.

Но британский ALTO не сравнится с изобретением китайского информационного агентства «Синьхуа». В 2018 году редакция создала проекцию ведущего новостей. Сначала — мужчину, и спустя год — женщину. Ведущий, готовый работать круглые сутки, — мечта любой пропаганды.

Опасности использования ИИ в журналистике: ошибки и предрассудки

Впрочем, ИИ работает вовсе не без сбоев. Вот несколько примеров.

В 2015 году робот-новостник написал, что курс акций Netflix упал на 71%. На самом же деле акции более, чем в два раза, выросли. Оказалось, ИИ неверно воспринял обозначение дробления акций «7–1» как число «71».

В 2017 году допустил ошибку упоминавшийся ранее робот Quakebot. Программа сообщила о землетрясении магнитудой в 6,8 баллов, хотя на самом деле оно произошло в 1925 году. Случилось это, потому что один из сейсмологов Геологической службы США решил дополнить данные о старом землетрясении. Изменения сохранились удачно, но система уведомлений 1925 год приняла за 2025-й и разослала предупреждения об опасности. Quakebot, который автоматически пишет новости на основе таких уведомлений, тут же сообщил о подземных толчках.

Иногда в машинных статьях недостает контекста, из-за чего у читателя может сложиться ложная картина происходящего. Какой бы ни была причина ошибки, за достоверность информации ответственны живые журналисты, подытоживает Маркони. Материалы ИИ не должны выходить в печать без редакторской проверки, соглашается другой эксперт.

Впрочем, человеческий фактор тоже может стать источником проблемы, особенно когда алгоритмы наследуют от людей предвзятое отношение или когнитивные искажения. Чаще всего ИИ некорректно определяет пол и расу. Например, в 2018 году в ходе эксперимента ИИ правильно распознал почти 100% белых мужчин, а вот пол черных женщин ИИ в 34% случаев определить не смог. Оказалось, что изображений черных женщин в наборах данных, на которых обучался ИИ, было гораздо меньше, чем белых мужчин.

Именно поэтому, считает Маркони, документы, процессы и алгоритмы, лежащие в основе ИИ, должны быть прозрачными, понятными и подотчетными. Причем проверка должна начинаться уже на этапе разработки — чтобы избежать неприятностей в будущем.

3D-модель: «IBM Selectric II Typewriter» by maxdragonn

Заменит ли ИИ живых журналистов

Внедрению ИИ в журналистику мешает:

Так на вопрос исследователя Чарли Беккетта ответили представители новостных организаций. Автор доклада аккуратно замечает: будущее ИИ-журналистики неопределенно, несмотря на ее большой потенциал. Работники медиа, которых опрашивал Беккетт, впрочем, менее сдержаны в своих оценках. В одной редакции, например, заявили:

«Освоение ИИ — это не выбор, это марафон, к которому должна присоединиться каждая медиа-организация, если она еще этого не сделала».

Как заметил старший редактор The Economist Кенн Кукьер: «Речь о том, что лучше для публики, не о том, что лучше для журналистов». СМИ пережили отказ от печатных машинок, значит, и приходу искусственного интеллекта сопротивляться не нужно, считает Кукьер. При этом, как показал опрос, тексты живых журналистов кажутся аудитории более простыми в чтении, но материалам роботов читатели больше доверяют.

Так заменит ли ИИ живых журналистов? Бывшая журналистка BBC Кейт О’Риордан считает: «Люди хотят читать мнения и аналитику, а не просто структурированные данные, обработанные алгоритмом». Эксперт по цифровизации Марк ван Рейменам соглашается: машины могут собирать данные, расшифровывать интервью и писать новости — но создавать вдумчивые репортажи, аналитику, политические комментарии и колонки мнений им не по силам.

Франческо Маркони того же мнения: машины не отберут рабочие места у людей, а станут лишь подручным средством, ускорителем журналистской работы. Будущее ИИ и журналистов — в коллаборации. Алгоритмы освободят авторов от рутинных и повторяющихся, но трудоемких задач. В итоге у журналистов будет больше времени, чтобы заниматься работой более высокого уровня. Искусственный интеллект, по оценкам Маркони, возьмет на себя всего лишь 8-12% текущих задач журналистов. Автор заключает: будущее медиа вовсе не за автоматизированной журналистикой, но — за журналистикой расширенной, дополненной за счет искусственного интеллекта.

«Перед журналистикой масса других вызовов, среди которых — общественная апатия и антипатия, борьба за внимание и политическая травля», — отмечает Чарли Беккетт. А искусственный интеллект как раз может помочь редакциям пережить этот кризис. Только решение нужно принять довольно быстро. По мнению Беккетта, чтобы сохранить свою социальную значимость, ведущим медиа стоит освоить новые технологии не позднее 2024 года.