Files
portal/app/tests/Unit/Autopodbor/Fetch/XfetchDirectoryFetcherTest.php
T
Дмитрий 1b76cfec15 feat(автоподбор шаг2): справочники 2ГИС через xfetch.ru
Антибот 2ГИС бьём сервисом xfetch.ru (render:true, timeout:20 —
без timeout страница не дорисовывается). Доказано на живом КрасЛомбаре:
поиск → 12 филиалов → телефон + адрес каждой карточки.

- PageFetcher — граница «достать HTML» (тестируется без сети)
- XfetchClient — POST к xfetch, декод base64; без ключа молча пусто
- XfetchDirectoryFetcher — список→филиалы→карточки через DirectoryParser
- DirectoryParser — чтение списка и карточки 2ГИС (был в хвостах)
- config services.xfetch + .env.example; ключ только в .env (gitignored)

Яндекс.Карты — отдельно (другой формат URL карточек). TDD: Autopodbor 46/46.

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-30 12:38:18 +03:00

43 lines
1.9 KiB
PHP

<?php
use App\Services\Autopodbor\Agent\Fetch\PageFetcher;
use App\Services\Autopodbor\Agent\Fetch\XfetchDirectoryFetcher;
/** @param array<string,string> $pages */
function fakePages(array $pages): PageFetcher
{
return new class($pages) implements PageFetcher
{
/** @param array<string,string> $pages */
public function __construct(private array $pages) {}
public function html(string $url): string
{
return $this->pages[$url] ?? '';
}
};
}
it('обходит список 2ГИС и собирает карточки филиалов с адресом', function () {
$fake = fakePages([
'https://2gis.ru/krasnoyarsk/search/X' => '<a href="/krasnoyarsk/firm/111">ф1</a><a href="/krasnoyarsk/firm/222">ф2</a>',
'https://2gis.ru/krasnoyarsk/firm/111' => '<title>КрасЛомбард, улица Весны, 7, Красноярск — 2ГИС</title><a href="tel:+73912550000">x</a>',
'https://2gis.ru/krasnoyarsk/firm/222' => '<title>КрасЛомбард, проспект Мира, 10, Красноярск — 2ГИС</title><a href="tel:+73912920000">x</a>',
]);
$cards = (new XfetchDirectoryFetcher($fake))->directory('https://2gis.ru/krasnoyarsk/search/X');
expect($cards)->toHaveCount(2);
$byNum = collect($cards)->keyBy('number');
expect($byNum['+73912550000']->office)->toBe('улица Весны, 7');
expect($byNum['+73912550000']->source)->toBe('2ГИС');
expect($byNum['+73912920000']->office)->toBe('проспект Мира, 10');
});
it('site() тянет HTML конкурента через тот же загрузчик', function () {
$fake = fakePages(['https://k.ru' => '<a href="tel:+73912920000">x</a>']);
$site = (new XfetchDirectoryFetcher($fake))->site('https://k.ru');
expect($site->url)->toBe('https://k.ru')
->and($site->rawHtml)->toContain('tel:+73912920000');
});