Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Oracle Новый топик    Ответить
 парсинг html страницы  [new]
maximkaxl
Member

Откуда:
Сообщений: 22
Добрый день.

жизненно необходимо разработать регулярное выражение (или несколько), которое позволяет определить что искомая ссылка(например www.mail.ru) содержиться в тексте сохраненной копии HTML страницы и открыта для индексации

ссылка закрыта для индексации если:
1 - заключена в теги noindex
2 - атрибут rel="noindex nofollow" у ссылки
3 - meta-теги в заголовке страницы
<META name="robots" content="noindex,follow">

во всех остальных случаях ссылка считается открытой для индексации

Заранее спасибо всем откликнувшимся
18 июн 08, 17:53    [5817080]     Ответить | Цитировать Сообщить модератору
 Re: парсинг html страницы  [new]
SQL*Plus
Member

Откуда: Россия, Москва
Сообщений: 8135
А почему это должны быть именно регулярные выражения, не функция, например?
18 июн 08, 19:58    [5817582]     Ответить | Цитировать Сообщить модератору
Все форумы / Oracle Ответить