|
23.06.2006 19:32 |
| |
"Яндекс" найдет новостной сюжет на карте |
 |
С сегодняшнего дня сюжеты Яндекс.Новостей, в которых упомянуты географические адреса, связанные с описываемыми событиями, иллюстрируются соответствующими фрагментами карты города.
Поиск адресов в новостях и подбор необходимого фрагмента карты для иллюстрации сейчас работает для Москвы и Подмосковья, Санкт-Петербурга, Екатеринбурга, Казани, Нижнего Новгорода, Орла, Ростова-на-Дону, Рязани, Тулы и Киева.
«Бывает, что, читая новость, узнаешь, что в твоем городе что-то происходит или планируется, и пытаешься мучительно догадаться, где же этот переулок или проезд. Теперь пользователь сразу видит нужное место на карте, — говорит Татьяна Платонова, руководитель службы Яндекс.Новости. — А если он захочет рассмотреть подробнее, то одним кликом сможет перейти на большую карту в Яндекс.Картах».
Весь процесс, от поиска и выделения адреса в тексте новости до формирования иллюстрации к сюжету, происходит автоматически. Используется словарь слов, обозначающих адресные объекты (улица, площадь, набережная, мост и пр.). Такой подход позволил создать универсальный инструмент, не зависящий от адресной базы конкретного города.
«С технологической точки зрения интересной задачей оказалось определение города, к которому относится упомянутый в новости адрес. Дело в том, что авторы новостных сообщений достаточно редко пишут город непосредственно рядом с улицей, — сообщает Лев Гершензон, ведущий разработчик компании «Яндекс». — Для решения этой задачи пришлось из каждого новостного сообщения выделять все названия населенных пунктов, а потом выбирать самое «релевантное» — в зависимости от количества вхождений в документ, от расположения в документе и т.п.».
Стоит добавить, что технология извлечения данных (fact extraction) в Яндекс.Новостях впервые была применена почти год назад для автоматического выделения главных действующих лиц новостных сюжетов и составления автоматических рейтингов наиболее популярных персон («Яндекс.Новости в лицах»). Весной был открыт доступ к пресс-портретам — справочной информации о людях, автоматически извлеченной из новостей СМИ. Автоматическое выделение и отождествление адресов построено на той же технологии.
В этой новости нет ни одного адреса. А если бы был упомянут, например, как в сегодняшней новости Очередной семинар «В$е права защищены» пройдет в Санкт-Петербурге, то в результатах поиска Яндекс.Новости был бы фрагмент карты:
|
 |
|