Программно-аппаратный комплекс ROSES представляет собой готовую реализацию масштабируемого и полностью автономного функционального решения, обеспечивающего анализ, индексацию, кэширование и полнотекстовый поиск данных в корпоративной информационной системе с учетом прав доступа пользователей. Поиск осуществляется как по внутренним, так и по внешним источникам:
Локальным и корпоративным файловым репозиториям;
Текстовым полям таблиц баз данных;
Во внутренних и внешних Интернет-узлах;
Репозиторию Oracle AS Portal;
Почтовым репозиториям.
Высокое качество поиска
ROSES предлагает новую, специально оптимизированную для поиска в корпоративной интранет-среде модель, предусматривающую:
Поиск с учетом русской морфологии. Морфологические алгоритмы позволяют осуществлять поиск с учетом словоформ русского языка, повышая полноту и точность выдаваемых результатов;
Анализ URL ссылок;
Устранение алиасов и двусмысленностей. Значительная часть информационных шумов в интранет возникает вследствие большого числа почти идентичных документов. Например, если вы создали и разослали по почте презентацию, десятки её копий могут храниться в различных файловых директориях других сотрудников. ROSES обеспечивает определение идентичности информационных материалов и устраняет их многократное дублирование в представляемых пользователю результатах;
Извлечение метаданных, таких как: автор, дата создания, тип документа, заголовок и так далее в момент индексации документа. Эта информация индексируется отдельно и может использоваться в поиске;
Возможность использования в поиске пользовательских метаданных, содержащихся в информационном источнике;
Анализ служебных файлов с целью выявления ключевых слов, по которым выдаются неадекватные результаты;
Возможность конфигурирования "Рекомендуемых ссылок" для организации поиска по наиболее популярным ключевым словам.
Дополнительные функции ROSES
Поиск слов, близких по написанию;
Нечеткий поиск;
Расширение запроса синонимами, более общими и более частными понятиями на основе тезауруса общей лексики русского языка;
Поиск документов по ключевым темам, которые автоматически выделяются при индексировании;
Выявление смысловых связей между темами документов, что позволяет расширять или уточнять запрос ассоциативно близкими темами;
Составление общих и тематических рефератов документов;
Автоматическое построение иерархических рубрикаторов и классификация документов по рубрикам.
Аутентификация и фильтрация результатов поиска
ROSES позволяет полностью решить задачи защиты информации и разграничения прав доступа к результатам поиска. Все источники — документы в файловых архивах и специализированных репозиториях, страницы OracleAS Portal, архивы электронной почты — могут быть защищены. При этом результаты поиска фильтруются так, что для пользователя видимы ссылки только на те информационные ресурсы, к которым ему разрешён доступ. Предоставляются три способа разграничения доступа:
В соответствии с централизованной схемой аутентификации на основе корпоративных каталогов пользователей, определяющих, к каким информационным источникам пользователю разрешён доступ. Например, если в соответствии с его LDAP — привилегиями пользователь не имеет прав доступа к OracleAS Portal, ему не будет показана ссылка ни на один документ из портального решения;
Для достижения большей гранулированности доступа ROSES может хранить информацию о правах доступа в списках контроля доступа (Account Control List — ACL), ассоциированных с каждым документом. ROSES получает ACL для каждого документа непосредственно из информационного репозитория. Если репозиторий не поддерживает данной функциональности, администратор имеет возможность определить права доступа к каждому из источников непосредственно из административной консоли ROSES. В этом случае права присваиваются прописанным в LDAP группам или непосредственно пользователям, определенным LDAP. Например, группа источников, проиндексированных в процессе поиска, может быть отмечена как видимая для групп "Аналитики", "Маркетинг" и пользователей "Петров", "Сидоров", "Ковалёв";
Фильтрация результатов поиска через механизм авторизации исходного информационного источника (авторизация в момент выполнения).
Для того, чтобы избежать дублирования информации о правах доступа, ROSES интегрирован с каталогом пользователей на основе Oracle Internet Directory (OID), который может синхронизироваться с каталогами других производителей, например, Microsoft Active Directory.
Пользователь ROSES получает настраиваемый, интуитивно понятный русскоязычный интерфейс, аналогичный интерфейсу других популярных систем поиска в Интернете.
Технологии
Программно-аппаратный комплекс ROSES реализован на базе Oracle Secure Enterprise Search 10g и продукта компании RCO (Гарант-Парк-Интернет) — Russian Context Optimizer.