|
|
Обзор поиска файлов для Web
Создание и сопровождение индекса для поиска файлов в Web
Средство поиска файлов для Web позволяют индексировать документы Office (включая файлы HTML) на HTTP-серверах, в общих папках в сети интранет и на серверах Интернета. Это дает конечным пользователям возможность выполнять поиск слов, фраз и значений свойств (например, Автор или Название) по всему тексту индекса. Сами индексы создаются службой поиска файлов, работающей на сервере или рабочей станции Windows NT. При этом компьютер с Windows NT должен быть сконфигурирован как HTTP-сервер с помощью специального программного обеспечения, например Microsoft Internet Information Server (IIS).
Пользователи обращаются к страницам запросов и результатов с помощью средства просмотра Web, например Microsoft Internet Explorer версии 3.0. Чтобы открыть нужный документ, достаточно выделить его имя на странице результатов. В некоторых случаях открыть соответствующее приложение Office можно непосредственно в окне средства просмотра Web.
Поиск документов с помощью диалогового окна Открыть (меню Файл) ограничивается последовательным просмотром индексов для отдельных дисков и папок. Средства поиска для Web допускают, однако, поиск с помощью индексов, охватывающих сразу несколько папок или дисков, а также создание набора индексов. Следует учесть, что реальную пользу индекс принесет лишь в том случае, если для него правильно выбрана область охвата.
Все примеры в этом документе предполагают, что в качестве программного обеспечения для Web-сервера используется Microsoft IIS. При работе с другим программным обеспечением эквиваленты описанных команд можно найти в документации к соответствующему продукту.
Текущую версию Internet Explorer можно также найти в сети Web. Чтобы получить дополнительные сведения, воспользуйтесь этой ссылкой.
Для назначения пользователям привилегий администратора используется диспетчер пользователей. Наряду с правами администратора пользователи должны получить доступ к папке управления поиском в Web.
Наконец, необходимо убедиться, что Web-сервер правильно взаимодействует с системой безопасности Windows NT. Для сервера Microsoft Internet IIS выполните перечисленные ниже операции.
Подробности, относящиеся к безопасности, см. в документации IIS 2.0.
При работе непосредственно с сервера индекс нетрудно создать с помощью интерактивной части программы поиска файлов.
Примечание. Если пользователи должны иметь к доступ документам Web-узла через протокол передачи файлов, а не только через HTTP, необходимо ввести в окно Выбор папки имя в формате UNC и обеспечить к ней доступ для чтения. Убедитесь также, что программа поиска имеет необходимые разрешения.
Примечание. В режиме Включить поиск фраз индексы разрастаются примерно в 4-6 раз, достигая по размеру от 10 до 30 процентов объема исходных документов. Время их создания также увеличивается.
Проследить за ходом создания индекса можно с помощью журнала системы поиска файлов (или просто открыв файл Ffastlog.txt в папке Windows\System). Как только индекс будет создан, он позволит выполнять поиск в Web.
Если создано несколько индексов, каждый из них должен иметь уникальное имя. Страница поиска может ссылаться лишь на один из них. Откройте файл Query.htm в текстовом редакторе (например, в редакторе Блокнот) и найдите в нем строку
< INPUT TYPE = "hidden" NAME = "Index" VALUE = " ">.
Поместите между кавычками вслед за ключевым словом VALUE имя индекса. Чтобы иметь возможность использовать при поиске несколько различных индексов, следует создать несколько разных копий файла Query.htm или задействовать такие команды HTML, как Select, которая дает возможность выбрать нужный индекс при работе с единственной страницей запроса.
При работе непосредственно с сервером для добавления папок в индекс можно использовать интерфейс программы поиска файлов.
Средство управления поиском в Web дает возможность управлять индексами в режиме удаленного доступа с любого из компьютеров, подключенных к HTTP-серверу. Само по себе оно представляет набор HTML-документов, работа с которыми производится с помощью программы просмотра Web непосредственно с HTTP-сервера или с любого другого компьютера.
| Поле | Значение |
| Имя индекса для Web | Укажите имя индекса, не содержащее символов пунктуации. Это имя понадобится при работе с другими разделами средства управления поиском в Web.
Совет. Желательно, чтобы имя индекса описывало охватываемый им спектр документов, например "Индекс для сервера отдела продаж". |
| Индекс должен охватывать файлы в папке | Укажите местоположение индекса. Индекс может быть создан только в одной из существующих папок на сервере Windows NT. Он будет охватывать папку, в которой находится, а также все ее подпапки.
Совет. Если при установке Office Server Pack использованная учетная запись обеспечивала доступ к папкам в сети, путь к индексу лучше указать в формате UNC (например, \\MyServer\MyFolder), нежели как локальный (типа N:\MyFolder). Если служба поиска настроена на возврат адреса файла, она будет использовать заданный путь UNC. |
| Альтернативный путь HTTP | Введите HTTP-адрес папки (например, http://MyServer/MyFolder). При этом следует проверить настройку HTTP для Web-сервера. Если служба поиска для Web настроена на возврат HTTP-адреса, она будет использовать указанный адрес. Более подробные сведения об отображении адресов HTTP см. в документации по Web-серверу. |
Индекс можно создать непосредственно с помощью программы поиска файлов на HTTP-сервере с помощью команды Создать индекс в меню (Индекс.
| Поле | Значение |
| Имя индекса | Укажите имя индекса, присвоенное ему при создании.
Совет. Чтобы выяснить текущие параметры индекса, воспользуйтесь ссылкой Отобразить сведения об индексах. |
| Что необходимо сделать | Выберите нужное действие: удаление или добавление папки.
Примечание. Папку, содержащую индекс, нельзя удалить. |
| Имя папки | Укажите имя добавляемой папки в формате UNC, например \\MyServer\MyFolder.
Добавляемая папка не должна пересекаться с областью, уже охваченной индексом. В частности, она не может быть подпапкой для папки, в которой находится индекс. |
| HTTP-адрес папки | Укажите HTTP-адрес добавляемой или удаляемой папки. |
Индекс можно изменить непосредственно с помощью программы поиска файлов на HTTP-сервере с помощью команды Обновить индекс в меню (Индекс.
Индекс можно удалить непосредственно с помощью программы поиска файлов на HTTP-сервере с помощью команды Удалить индекс в меню (Индекс.
На экране появляется страница со сведениями об индексах, содержащая перечисленные ниже атрибуты.
Примечание. Эти же данные можно получить с помощью ссылки Отобразить сведения об индексах на других страницах управления поиском в Web.
| Атрибут | Значение |
| Имя | Имя, присвоенное индексу при создании. |
| Папка, где хранится индекс | Путь к индексу. |
| Дополнительно индексированные папки | Папки, включенные в индекс в дополнение к папке, в которой он находится (и ее подпапкам). |
| HTTP-адреса | Индексированные папки и соответствующие им HTTP-адреса. |
| Значимость | Этот атрибут указывает, присутствуют ли в индексе сведения о значимости документов. Более подробные сведения о значимости позволяет получить эта ссылка. |
| Ускорить отображение свойств | Этот атрибут указывает, присутствуют ли в индексе сведения о свойствах документов. Более подробные сведения о значимости позволяет получить эта ссылка. |
| Поиск фраз | Этот атрибут указывает, поддерживает ли индекс поиск фраз. Более подробные сведения о значимости позволяет получить эта ссылка. |
Получить сведения об индексе можно непосредственно с помощью программы поиска файлов на HTTP-сервере с помощью команды Обновить индекс в меню (Индекс.
Набор средств поиска для Web включает следующие готовые страницы запросов и результатов.
| Страница | Имя файла |
| Простой запрос | Query.htm |
| Расширенный запрос | Queryadv.htm |
| Страница результатов | Results.htm |
Страница становится годной для использования только после установки значений нескольких параметров, в частности имени индекса, используемого по умолчанию. Для этого требуется внести изменения в текст на языке HTML.
Подставьте в следующей строке в пустое поле VALUE имя, присвоенное индексу при создании.
<INPUT TYPE = "hidden" NAME = "Index" VALUE = "">
Если размещение страницы результатов было изменено, необходимо указать путь к ней. Замените в приведенной ниже строке значение C:\wwwroot\results.htm фактическим путем к странице результатов.
<INPUT TYPE = "hidden" NAME = "Template" VALUE = "C:\wwwroot\results.htm">
Подставьте в следующей строке в пустое поле VALUE путь HTTP к системным GIF-файлам и другим GIF-файлам, на которые ссылаются страницы запросов и результата (это может быть эмблема организации).
<INPUT TYPE = "hidden" NAME = "Gif" VALUE = " ">
Существует возможность выбрать протокол, использующийся для ссылок на документы на странице результатов (HTTP или File).
<INPUT TYPE = "hidden" NAME = "Protocol" VALUE = "HTTP">
<INPUT TYPE = "hidden" NAME = "SortBy" VALUE = "Значимость">
Исправление страницы результатов (Results.htm) перед использованием не требуется. Внесение изменений может, однако, потребоваться, для помещения на нее эмблемы организации или отбора появляющихся на ней данных.
Ниже приведен список строк файла Results.htm, допускающих настройку. Данные из них используются при каждом построении страницы результатов.
| Строка | Значение |
|
Список, в котором отображаются найденные документы. |
|
Размещение ярлыка URL для возврата предыдущих результатов (если таковые имеются). |
|
Размещение ярлыка URL для возврата следующих результатов (если таковые имеются). |
| Вставка сообщения " Документы: x - y из z." |
| Дата создания индекса. По умолчанию в файле Results.htm не появляется. |
| Дата изменения индекса. |
| Полное число документов в индексе. По умолчанию в файле Results.htm не появляется. |
| Размещение рисунка GIF с ярлыком URL для возврата предыдущих результатов (если таковые имеются). По умолчанию используется рисунок Prev.gif, находящийся в той же папке, что и Results.htm. |
| Размещение рисунка GIF с ярлыком URL для возврата следующих результатов (если таковые имеются). По умолчанию используется рисунок Next.gif, находящийся в той же папке, что и Results.htm. |
| Размещение кнопок и соответствующих им ярлыков URL. По умолчанию в файле Results.htm не появляется. |
|
Отображение запроса пользователя. |
Простейший путь распространения ярлыков URL среди пользователей состоит в их рассылке в виде вложений в сообщения электронной почты. Само сообщение должно содержать инструкции пользователям, которые должны отобразить страницу и поместить ее в папку ''Избранное'' или выбрать в качестве основной.
В сообщение имеет также смысл включить указания по работе с Microsoft Internet Explorer 3.0. Если используется другая программа просмотра Web, обратитесь к ее документации.
При следующем нажатии кнопки Поиск Internet Explorer откроет страницу для поиска файлов в Web.
При поиске файлов в Web подборкой называется набор страниц с гиперссылками на документы Office, отобранные по общим значениям некоторых свойств. Чтобы документы Office могли появиться в подборке, они должны быть включены в текущий индекс для поиска в Web.
Подборка может включать три уровня группировки и объединять гиперссылки на все документы, удовлетворяющие заданным условиям. Например, нетрудно создать подборку, содержащую гиперссылки на все индексированные документы, созданные руководителем организации (свойство Автор) и посвященные новым возможностям развития производства (свойство Тема) в течение последнего года (свойство Дата изменения).
Ярылки URL для самой подборки или ее начальной страницы рассылаются конечным пользователям, что позволяет им найти все нужные документы в одном месте.
| Поле | Значение |
| Имя индекса | Введите имя, присвоенное индексу при создании. |
| Местонахождение Web-страницы | Укажите папку для размещения новых страниц. (Она должна быть создана заранее.) Можно указать также и имя страницы, например C:\wwroot\страница.htm. По умолчанию используется имя main.htm. Использование в имени формата UNC не допускается. |
| Группировать по полю | Выберите свойство, по которому следует группировать документы на старшем уровне. |
| Затем по полю | Выберите свойство, по которому следует группировать документы на среднем и нижнем уровнях. |
| Имя группы 1, 2, 3 | Укажите заголовки, под которыми выбранные свойства должны появиться в созданной подборке. |
| Сортировать по полю | Выберите свойство, по которому документы подборки будут отсортированы. |
| FILE или HTTP | Выберите тип гиперссылок: FILE или HTTP. |
На основе заданных условий средства поиска в Web создают набор связанных HTML-документов.
Простейший путь распространения ярлыков URL для подборок среди пользователей состоит в их рассылке в виде вложений в сообщения электронной почты. Само сообщение должно содержать инструкции пользователям, которые должны отобразить страницу и поместить ее в папку ''Избранное'' или выбрать в качестве основной.
В сообщение имеет также смысл включить указания по работе с Microsoft Internet Explorer 3.0. Если используется другая программа просмотра Web, обратитесь к ее документации.
При поиске файлов в Web значимость используется для отбора наиболее полезных документов из числа представленных на странице результата. Документы, в которых искомое слово или фраза встречается чаще, будут находиться на странице поиска выше остальных. При этом редкие (для английского языка) слова, например cinnamon, будут иметь больший вес, чем обычные типа spice.
Если индекс создан с помощью средства управления поиском в Web, он будет автоматически включать сведения о значимости, причем отменить этот режим нельзя. Если же для создания индекса используется интерфейс программы поиска файлов, появляется возможность выбора.
При работе через интерфейс программы поиска файлов задействовать сортировку по значимости позволяет флажок Включать данные о значимости при поиске в Web в диалоговом окне Создание индекса (меню Индекс). Размер индексного файла при этом существенно увеличивается, однако найденные документы будут в большей степени отвечать запросам. Это особенно полезно при просмотре наборов, включающих сотни и тысячи документов. Использование значимости необходимо также и для поиска фраз.
Фраза представляет собой совокупность стоящих рядом слов, которые могут быть разделены пробелами и знаками пунктуации. С грамматической точки зрения фраза не обязана нести како-либо определенный смысл; главную роль в ней играет порядок слов.
Если индекс создан с помощью средства управления поиском в Web, он будет автоматически включать сведения для поиска фраз, причем отменить этот режим нельзя. Если же для создания индекса используется интерфейс программы поиска файлов, появляется возможность выбора.
При работе через интерфейс программы поиска файлов задействовать поиск фраз позволяет флажок Включить поиск фраз в диалоговом окне Создание индекса (меню Индекс). Размер индексного файла при этом существенно увеличивается, однако растет и возможность точно сформулировать условия поиска.
Служба поиска файлов позволяет включать в индексный файл значения свойств документов, в частности название и имя автора. Помещенные в индекс свойства могут использоваться как программой поиска файлов в Web, так и в Microsoft Outlook. Если значения свойств в индексе отсутствуют:
Если индекс создан с помощью средства управления поиском в Web, он будет автоматически включать значения свойств, причем отменить этот режим нельзя. Если же для создания индекса используется интерфейс программы поиска файлов, появляется возможность выбора.
При работе через интерфейс программы поиска файлов задействовать поиск фраз позволяет флажок Ускорить отображение свойств в диалоговом окне Создание индекса (меню Индекс). Размер индексного файла при этом существенно увеличивается, однако появляется возможность отображать свойства найденных документов в списках. Установка флажка Ускорить отображение свойств также позволяет Microsoft Outlook отображать свойства документов в таблицах.
Протокол HTTP позволяет создать на компьютере пользователя копию найденного документа Office, однако не дает возможности сохранить измененный документ на сервере, откуда он был получен. Этот протокол удобен для доступа к библиотеке индексированных документов, когда пользователи не должны иметь к ним доступа на запись.
Использование протокола File возможно лишь в случае, если при установке Office Server Pack была использована учетная запись с разрешением на доступ к сетевым папкам. Этот протокол также требует использования для имен папок формата UNC при создании индексов на сервере и настройке страниц запроса.
При работе по протоколу File служба поиска файлов в Web открывает нужные документы Office непосредственно на сервере, где они находятся. При этом существует возможность изменить и сохранить документ, если он не защищен (например, с помощью пароля). Протокол File имеет смысл использовать наряду с другими средствами защиты документов, так как любой незащищенный документ может быть без труда открыт и изменен.
Эта проблема может появиться при запуске Microsoft IIS на платформе Windows NT Server. При первом вызове библиотеки ISAPI, например Dispatch.dll, происходит загрузка IIS в память. После этого IIS держит библиотеку в памяти в течение продолжительного периода времени, и лишь затем освобождает ее. Чтобы удалить библиотеку, не дожидаясь, пока IIS освободит ее, необходимо остановить службу поиска файлов из диспетчера IIS.
Служба поиска файлов для NT для индексирования документов нуждается в доступе к сети. Чтобы получить разрешение на доступ к сети, она обычно запускается с помощью учетной записи администратора системы. После изменения пароля администратора на сервере Windows NT, эта служба останавливается и не запускается при перезагрузке компьютера. Чтобы устранить проблему, достаточно запустить ее, используя новое имя или пароль.
Проще всего создать для каждого индекса отдельную страницу запроса. Другой подход предусматривает добавление к странице специального фрагмента кода на языке HTML, который позволит выбирать нужный индекс из списка. Для пользователей второй вариант значительно удобнее.
В приведенном ниже примере раскрывающийся список будет содержать ссылки на нескольких индексов. В частности, первый элемент списка ссылается на индекс ''Кадры'', которому в списке соответствует элемент "Отдел кадров".
<TR>
<TD colspan=2>Search <SELECT NAME="Index">
<OPTION SELECTED VALUE="Кадры">Отдел кадров
<OPTION VALUE="corporate.com">Наш Интернет-сервер
<OPTION VALUE="MKT News">Последние новости из газет
<OPTION VALUE="Образцы">Спецификации продуктов
</SELECT>
</TD>
Query.htm и другие страницы поиска должны находиться в папке, при установке стредств поиска в Web. (Чтобы сменить эту папку, повторите установку.) Убедитесь, что папка доступна для пользователей Web-сервера как для чтения, так и для записи.
Примечание. Сервер Windows NT обязательно должен быть доступен пользователям сети. В меню Пуск (Start) (в Windows NT 4.0) или в диспетчере программ (Windows NT 3.51) выберите пункт Администрирование/Диспетчер пользователей (Administrative Tools/User Manager). Затем выберите команду Права пользователя (User Rights) в меню Политика (Policies). Выберите в списке значение Все (Everyone) и сопоставьте этот режим пункту Доступ к компьютеру из сети (Access this computer from the network) в списке прав.
Примечание. Чтобы сменить папку для размещения средств поиска в Web и/или управления поиском в Web, следует повторно запустить программу установки. Вначале средства поиска в Web необходимо удалить, а затем переустановить в другую папку.
Все страницы, предназначенные для управления поисков в Web, должны находиться в папке, выбранной для них при установке. Повторите описанные выше действия. Убедитесь также в том, что
Если страницы управления поиском все равно оказываются недоступными, следует воспользоваться интерфейсом программы поиска файлов.
Если страница результата возвращает сообщение о том, что индекс не найден, это обычно связано с одной из двух причин:
Если уже успело пройти достаточно времени (в расчете не менее одного часа на 100 Мбайт данных), а поиск выполнить так и не удается, выполните следующую процедуру.
Служба поиска файлов может не иметь разрешений, необходимых для чтения отдельных сетевых папок, входящих в индекс. Проверьте журнал индексирования. Откройте программу поиска файлов в панели управления и выберите команду Вывести журнал в меню Индекс. Проглядите конец журнала. При наличии сообщений о недоступности папок измените учетную запись, которая используется для запуска службы поиска. Для этого необходимо повторить установку или выполнить следующие действия.
Проверьте журнал службы поиска. Возможно, индекс был поврежден. В этом случае его следует удалить и создать заново.
Скорее всего это означает, что индекс перестал обновляться. Чтобы проверить это, выполните следующие действия.
Выбор режима Обновлять автоматически по умолчанию устанавливает интервал обновления равным 2 часам. Чтобы изменить этот интервал, выберите в меню Индекс команду Интервал обновления и укажите новую длительность интервала. Более подробные сведения об обновлении индексов можно найти в справке по программе поиска файлов.
Примечание. Команда Обновить индекс в меню Индекс также позволяет обновить индекс немедленно.
Ниже перечислены наиболее часто возникающие при поиске файлов в Web ошибки и пояснения к ним.
Ошибка в запросе или условиях поиска:
Программе поиска файлов для Web не удается найти индекс для поиска.
К двум основным причинам этой ошибки могут относиться: 1) отсутствие индекса и 2) неверная ссылка на имя индекса.
<INPUT TYPE = "hidden" NAME = "Index" VALUE = "">