Przejdź do głównej treści

Skanowanie treści

Skonfiguruj sposób, w jaki ChattyBox skanuje Twoją witrynę i indeksuje treści na potrzeby odpowiedzi AI.

Tryby scrapingu

ChattyBox obsługuje trzy tryby scrapingu:

1. Tylko strona główna

Skanuje tylko Twoją stronę główną. To najlepsza opcja w przypadku prostych stron docelowych lub gdy chcesz zindeksować jak najmniej treści.

2. Tryb mapy witryny (zalecane)

Podaj adres URL mapy witryny, a ChattyBox zeskanuje wszystkie strony na niej wymienione. To najpewniejszy sposób, aby upewnić się, że wszystkie strony w Twojej witrynie zostaną zaindeksowane.

https://example.com/sitemap.xml

3. Ręczne adresy URL

Podaj dokładne adresy URL do skanowania, po jednym w każdym wierszu. Użyj tej opcji, jeśli chcesz dokładnie określić, które strony mają być indeksowane.

https://example.com/pricing
https://example.com/features
https://example.com/about
https://example.com/faq

Limity stron

Liczba stron, które możesz skanować, zależy od twojego planu:

PlanStron na witrynę
Free10
Starter50
Pro500
Business2,000

Ekstrakcja treści

ChattyBox wyodrębnia:

  • Tytuł strony - Znacznik <title>
  • Główna treść - Tekst z <main>, <article> lub <body>
  • Nagłówki - Wszystkie znaczniki od <h1> do <h6>
  • Akapity - Całą treść z <p>
  • Listy - Elementy list <ul> i <ol>

Ignorowana treść

ChattyBox automatycznie ignoruje:

  • Menu nawigacyjne
  • Treść stopki
  • Skrypty i arkusze stylów
  • Ukryte elementy
  • Banery cookie

Rozwiązywanie problemów

Strony nie są skanowane?

  • Sprawdź, czy URL jest publicznie dostępny
  • Upewnij się, że robots.txt pozwala naszemu indeksatorowi na dostęp
  • Sprawdź, czy strona nie wymaga uwierzytelnienia

Brakuje treści w odpowiedziach?

  • Zeskanuj stronę ponownie, aby pobrać najnowszą treść
  • Sprawdź, czy treść nie jest ładowana przez JavaScript (renderujemy JS)
  • Upewnij się, że treść znajduje się w głównej części strony, a nie w iframe'ach

Potrzebujesz większej kontroli?

Jeśli masz zaawansowane potrzeby związane ze skanowaniem (uwierzytelnianie, dynamiczne treści itp.), skontaktuj się z nami pod adresem [email protected].