URL Фильтрация
URL Фильтрация (URL Filtering) - это возможность блокирования WEB-запросов по ключевому слову в адресе (а также возможность задания "черных" и "белых" списков WEB-сайтов).
Каждый URL Filter состоит из набора URL правил, количество которых неограничено. URL правило определяет адрес или часть адреса при нахождении которого в адресе WEB-запроса, данный WEB-запрос будет блокироваться. Например, URL Filter c URL правилами:
microsoft.com odnoklassniki.ru |
будет блокировать доступ ко всем сайтам содержащим в
своем имени строки microsoft.com или odnoklassniki.ru
Теория WEB-запросов
Согласно RFC 3986, адрес WEB-запроса состоит из следующих компонент:
foo://username:password@example.com:8042/over/there/?name=ferret#nose \ / \________________/\_________/ \__/\_________/ \_________/ \__/ | | | | | | | | userinfo hostname port URI-path query fragment scheme |
TMeter осуществляет поиск на совпадение URL правила в
частях hostname (имя хоста) и/или URI-path (URI-путь)
WEB-запроса.
Конструирование URL правил
Помимо простых URL правил, состоящих из частей WEB-адресов (таких как microsoft.com или odnoklassniki.ru), в URL правилах разрешается использование некоторых специальных символов, изменяющих логику поиска на успех совпадения.
Символ |
Описание |
^ |
определяет, что поиск шаблона URL правила должен осуществляться в начале имени хоста или URI-пути (например, ^forum будет генерировать успех для адреса forum.tmeter.ru, однако для адреса www.forum.tmeter.ru работать не будет) |
$ |
определяет, что поиск шаблона URL правила должен осуществляться в конце имени хоста или URI-пути (например, .gif$ предотвратит загрузку всех файлов, расширением которых является ".gif") |
* |
соответствует любой комбинации символов, например forum*.ru |
+ |
Разрешает (не блокирует) адрес, который будет соответствовать шаблону. Данный символ можно применять только в начале шаблона |
# |
Комментарий - строка, начинающаяся с этого символа, будет игнорироваться. |
Все описанные модификаторы разрешно использовать
только один раз в одном URL правиле.
Особенности работы URL фильтрации
URL фильтрация осуществляется в прозрачном режиме
(т.е. нет необходимости использовать какой-либо прокси-сервер и
специальным образом настраивать браузеры на клиентах). Технология
URL фильтрации анализирует каждый TCP пакет на предмет наличия в
нем заголовка HTTP-запроса. Если заголовок HTTP-запроса найден в
пакете и совпал шаблон URL правила для блокирования сайта, то
TMeter формирует ответную HTML-страничку "доступ запрещен" и
посылает ее клиенту как бы от имени WEB-сервера. В дополнение,
TMeter посылает TCP пакеты с флагом FIN для закрытия
TCP-соединения.
Примеры URL фильтров
URL Фильтр |
Описание |
odnoklassniki.ru vkontakte.ru fishki.net yaplakal.com |
Запрещает загрузку содержимого с указанных сайтов |
+forum*.js$ .js$ |
Запрещает загрузку всех файлов, расширение которых заканчивается на .js (сценарии javascript), однако разрешает использование javascript на сайтах, в URL-адресе которых встречается слово 'forum' |
+.ru$ +.com$ +.net$ * |
Создает "белый" список для сайтов в зонах .ru .com .net и блокирует загрузку всех сайтов из других зон. |
Обратите внимание