Семантический веб обещаетстать важнейшим этапом в эволюции Интернета. И пионеры этого направления уже вовсю делят участки: в октябре из закрытого тестирования выпорхнул сервис Twine (www.twine.com), использующий смысловой анализ для автоматической классификации документов.
Основой сервиса служат собираемые пользователями коллекции материалов, так называемые твайны. Каждыйиз них посвящен какой-либо теме и в простейшем случае содержит несколько ссылок на веб-страницы, но может также включать файлы офисных форматов, фотографии, музыку и видео. Особенность Twine в том, что сервис самостоятельно извлекает из текста максимум характеризующей его информации. Когда документ построен с учетом требований семантического веба, процесс индексации проходит быстрее всего. Если же семантические теги отсутствуют, в дело вступают алгоритмы анализа естественного языка. Так или иначе, в результате Twine получает не просто набор слов, а знания. К примеру, сервис осведомлен, что NASA - это название организации, Шотландия - страна, а Джордж Буш - человек.
Сервис способенавтоматически предлагать документы, содержащие не только сведения на выбранную тему, но и близкие по смыслу, так что поиск интересных материалов требует лишь пары кликов. Вдобавок поверх семантического движка навешаны привычные социальные функции. Каждый твайн может быть коллективным, в этом случае другие пользователи смогут просматривать его, обсуждать и добавлять новые документы, тем самым пополняя копилку знаний системы.
Внастоящий момент ресурс объединяет примерно 50 тысяч активных пользователей, силами которых создано и поддерживается 20 тысяч тематических твайнов. Это число в ближайшее время должно увеличиться многократно, ведь Twine - один из самых ожидаемых интернет-стартапов, возделывающих ниву веб-семантики. Однако главной его проблемой остается низкое проникновение идей семантического веба и несовершенство соответствующих стандартов в сегодняшней Сети. Пока лишь
Комментарии к книге «Компьютерра, 2008 № 41 (757)», Журнал «Компьютерра»
Всего 0 комментариев