Нейросети Яндекса распознали тексты дореволюционного «Коммерсанта» и помогли обеспечить по ним удобный поиск

Иллюстрация предоставлена пресс-службой Яндекса

На сервисе Яндекса «Поиск по архивам» пользователи теперь могут смотреть выпуски дореволюционной деловой газеты «Коммерсант» и искать в них информацию — так же быстро, как по текстовым запросам в интернете. Это стало возможным благодаря сотрудничеству сервиса с Национальной электронной библиотекой (НЭБ) и Российской национальной библиотекой (РНБ). Выпуски дореволюционного «Коммерсанта» могут заинтересовать как исследователей, так и любителей истории, а «Поиск по архивам» поможет им узнать больше о людях и событиях начала XX века.

Пользователям доступно на сервисе 2250 номеров газеты — это больше 10 тыс. страниц. Чтобы такое реализовать, РНБ — один из ключевых участников Национальной электронной библиотеки — передала для проекта оригиналы из своих фондов, а Яндекс преобразовал отсканированные и хранящиеся в НЭБ копии в электронные тексты. Для этого «Поиск по архивам» использовал технологию оптического распознавания символов и нейросеть, которая умеет считывать мелкие газетные шрифты.

Этот проект «Поиска по архивам», РНБ и НЭБ приурочен к 115-летию со дня выхода первого номера дореволюционного «Коммерсанта» — 5 августа (23 июля) 1909 года. Последний выпуск газеты вышел в 1917 году.

В издании можно найти самую разную информацию о людях и событиях начала прошлого века. Например, газета публиковала статьи об экономической жизни Российской империи, списки приезжих покупателей с указанием торговых подворий и гостиниц, где они проживали, данные о торгах на подряды и поставки по всей стране, информацию о банкротствах, извещения о платежах. В издании также можно посмотреть, как выглядела реклама более чем 100 лет назад.

На сервисе «Поиск по архивам» для поиска информации также доступны архивы газет «Советский спорт», «Вечерняя Москва», «Сенатские ведомости», «Русский инвалид» более чем за 100 лет, а ещё архив издания «Красная звезда» за 1924–1953 годы.