Skanowanie treści
Skonfiguruj sposób, w jaki ChattyBox skanuje Twoją witrynę i indeksuje treści na potrzeby odpowiedzi AI.
Tryby scrapingu
ChattyBox obsługuje trzy tryby scrapingu:
1. Tylko strona główna
Skanuje tylko Twoją stronę główną. To najlepsza opcja w przypadku prostych stron docelowych lub gdy chcesz zindeksować jak najmniej treści.
2. Tryb mapy witryny (zalecane)
Podaj adres URL mapy witryny, a ChattyBox zeskanuje wszystkie strony na niej wymienione. To najpewniejszy sposób, aby upewnić się, że wszystkie strony w Twojej witrynie zostaną zaindeksowane.
https://example.com/sitemap.xml
3. Ręczne adresy URL
Podaj dokładne adresy URL do skanowania, po jednym w każdym wierszu. Użyj tej opcji, jeśli chcesz dokładnie określić, które strony mają być indeksowane.
https://example.com/pricing
https://example.com/features
https://example.com/about
https://example.com/faq
Limity stron
Liczba stron, które możesz skanować, zależy od twojego planu:
| Plan | Stron na witrynę |
|---|---|
| Free | 10 |
| Starter | 50 |
| Pro | 500 |
| Business | 2,000 |
Ekstrakcja treści
ChattyBox wyodrębnia:
- Tytuł strony - Znacznik
<title> - Główna treść - Tekst z
<main>,<article>lub<body> - Nagłówki - Wszystkie znaczniki od
<h1>do<h6> - Akapity - Całą treść z
<p> - Listy - Elementy list
<ul>i<ol>
Ignorowana treść
ChattyBox automatycznie ignoruje:
- Menu nawigacyjne
- Treść stopki
- Skrypty i arkusze stylów
- Ukryte elementy
- Banery cookie
Rozwiązywanie problemów
Strony nie są skanowane?
- Sprawdź, czy URL jest publicznie dostępny
- Upewnij się, że
robots.txtpozwala naszemu indeksatorowi na dostęp - Sprawdź, czy strona nie wymaga uwierzytelnienia
Brakuje treści w odpowiedziach?
- Zeskanuj stronę ponownie, aby pobrać najnowszą treść
- Sprawdź, czy treść nie jest ładowana przez JavaScript (renderujemy JS)
- Upewnij się, że treść znajduje się w głównej części strony, a nie w iframe'ach
Potrzebujesz większej kontroli?
Jeśli masz zaawansowane potrzeby związane ze skanowaniem (uwierzytelnianie, dynamiczne treści itp.), skontaktuj się z nami pod adresem [email protected].