Добро пожаловать в форум, Guest >> Войти | Регистрация | Поиск | Правила | | В избранное | Подписаться | ||
Все форумы / Microsoft Office |
![]() ![]() |
Топик располагается на нескольких страницах: ←Ctrl назад 1 2 3 4 [5] 6 7 вперед Ctrl→ все |
ferzmikk Member Откуда: Сообщений: 2185 |
|
||
18 июл 19, 11:22 [21929235] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
Я в обычном блокноте писал HTML. Получается обычный блокнот не задает нужную кодировку. |
18 июл 19, 11:23 [21929239] Ответить | Цитировать Сообщить модератору |
iMrTidy Member Откуда: Сообщений: 775 |
ferzmikk, Блокнот при сохранении К сообщению приложен файл. Размер - 6Kb |
18 июл 19, 11:26 [21929243] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
Каждый раз вводить определенный item объекта в Debug.Print не удобно, даже через цикл. Как же можно смотреть иерархию объекта? Внизу скриншот. В цикле один элемент. На строке elem появляется ошибка. К сообщению приложен файл. Размер - 47Kb |
||
18 июл 19, 14:07 [21929441] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
К сообщению приложен файл. Размер - 39Kb |
||
18 июл 19, 14:10 [21929446] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
Как можно по другому анализировать содержимое? |
18 июл 19, 14:10 [21929447] Ответить | Цитировать Сообщить модератору |
iMrTidy Member Откуда: Сообщений: 775 |
ferzmikk, Подождите, Вам же kealon(Ruslan) согласился написать все красиво: 21929211. |
18 июл 19, 14:12 [21929452] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
|
||
18 июл 19, 14:25 [21929465] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
Усложняю пример, который приближается к реальному.
Set elems = html.querySelectorAll("span class=""dots""") |
|
18 июл 19, 14:45 [21929485] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
Потом, когда узнали количество "страниц" для продолжение таблицы, то как правильно выгружать последующие "страницы"? |
18 июл 19, 14:47 [21929490] Ответить | Цитировать Сообщить модератору |
kealon(Ruslan) Member Откуда: Нижневартовск Сообщений: 6254 |
|
||
18 июл 19, 15:12 [21929516] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
|
|||||
18 июл 19, 17:04 [21929623] Ответить | Цитировать Сообщить модератору |
iMrTidy Member Откуда: Сообщений: 775 |
А я считаю, что все это явно указывает, что Вы горите желанием, демонстрируете свои глубокие знания в теме, и даже хотели бы сделать как надо, но, видимо, я мешаю, больше не мешаю, вперед. Только балаболы за свои слова не отвечают. Выбор за Вами. |
||||||||||||||||||||||||
19 июл 19, 10:35 [21930021] Ответить | Цитировать Сообщить модератору |
kealon(Ruslan) Member Откуда: Нижневартовск Сообщений: 6254 |
iMrTidy, Выбор за ТС - 21929516, если наиграется и решит, что не его это дело, всегда пожалуйста, обсудим. Ему уже много раз сказали, и не я один, что он выбрал плохой путь. Но можно конечно и безнадёжного поддерживать, если есть желающий оплатить сей процесс. |
19 июл 19, 10:58 [21930037] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
В общем, поскольку я не делал сайты и начал парсинги писать, то могу многое чего не знать. Начал изучать HTML и CSS. Не знаю нужно ли изучать JavaScript, но если не ошибаюсь, там могут сидеть данные и фильтр. Какой то код на VBA уже написан по выгрузке данных из сайта. Осталось немного дописать с учетом - выгрузить количество страниц не через Set elems = doc.querySelectorAll("body > a") Set elem = elems(elems.Length - 1) Debug.Print elem.innerTextа через использования стиля <div class="pagination-is "> <div class="pagination"><div class="context"> <span class="active"><span>1</span></span> <a href="/aaaaa/?page=2">2</a> <a href="/aaaaa/?page=10">10</a> <span class="dots">...</span> <a href="/aaaaa/?page=10000">10000</a> </div></div> </div>- выгрузка последующих страниц - с использованием аутентификации - с использованием фильтра
|
||
19 июл 19, 12:07 [21930109] Ответить | Цитировать Сообщить модератору |
Konst_One Member Откуда: Сообщений: 11561 |
curl тебе в помощь https://levashove.ru/how-to-install-curl-on-windows-10/ |
19 июл 19, 12:27 [21930138] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
|
||
19 июл 19, 12:50 [21930155] Ответить | Цитировать Сообщить модератору |
Konst_One Member Откуда: Сообщений: 11561 |
нет, это утилита командной строки для отправки запросов по http |
19 июл 19, 13:07 [21930175] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
|
||
19 июл 19, 13:19 [21930196] Ответить | Цитировать Сообщить модератору |
Konst_One Member Откуда: Сообщений: 11561 |
можешь автоматизировать , написать батник, например |
19 июл 19, 13:28 [21930206] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
|
||
19 июл 19, 13:35 [21930213] Ответить | Цитировать Сообщить модератору |
court Member Откуда: Сообщений: 2240 |
Ну будет он получать html-код страницы не с помощью COM-объекта XMLHTTP, а с помощью curl-а, - и что дальше ? У него нет проблемы с получением html-кода, у него проблема с тем как распарсить этот полученный код, особенно в случае если код "кривоватый" ... |
||
19 июл 19, 13:39 [21930218] Ответить | Цитировать Сообщить модератору |
ferzmikk Member Откуда: Сообщений: 2185 |
|
||
19 июл 19, 13:44 [21930223] Ответить | Цитировать Сообщить модератору |
court Member Откуда: Сообщений: 2240 |
|
||||
19 июл 19, 13:45 [21930224] Ответить | Цитировать Сообщить модератору |
Konst_One Member Откуда: Сообщений: 11561 |
с такими знаниями никакой динамический парсер не напишешь, так что ТСу придётся делать что-то кривенькое и с ограниченными возможностями |
19 июл 19, 13:46 [21930227] Ответить | Цитировать Сообщить модератору |
Топик располагается на нескольких страницах: ←Ctrl назад 1 2 3 4 [5] 6 7 вперед Ctrl→ все |
Все форумы / Microsoft Office | ![]() |