Přejít na hlavní obsah

Extrakce obsahu

Nastavte, jak ChattyBox prochází váš web a indexuje obsah pro odpovědi AI.

Režimy scrapování

ChattyBox nabízí tři režimy scrapování:

1. Pouze domovská stránka

Extrahuje pouze vaši domovskou stránku. Ideální pro jednoduché vstupní stránky nebo když chcete indexovat jen minimum obsahu.

2. Režim mapy webu (doporučeno)

Zadejte URL mapy webu a ChattyBox extrahuje všechny stránky, které jsou v ní uvedené. Jde o nejspolehlivější způsob, jak zajistit, aby byly všechny vaše stránky zaindexovány.

https://example.com/sitemap.xml

3. Ruční URL

Zadejte přesné URL k extrahování, jednu na řádek. Použijte toto, když chcete mít přesnou kontrolu nad tím, které stránky se indexují.

https://example.com/pricing
https://example.com/features
https://example.com/about
https://example.com/faq

Limity stránek

Počet stránek, které můžete extrahovat, závisí na vašem tarifu:

Tarifstránek na web
Free10
Starter50
Pro500
Business2 000

Extrakce obsahu

ChattyBox extrahuje:

  • Název stránky - Tag <title>
  • Hlavní obsah - Text z <main>, <article> nebo <body>
  • Nadpisy - Všechny tagy od <h1> do <h6>
  • Odstavce - Veškerý text v <p>
  • Seznamy - Položky ze <ul> a <ol>

Ignorovaný obsah

ChattyBox automaticky ignoruje:

  • Navigační menu
  • Obsah v zápatí
  • Skripty a styly
  • Skryté prvky
  • Cookie bannery

Řešení problémů

Stránky se neextrahují?

  • Zkontrolujte, že je URL veřejně přístupná
  • Zajistěte, aby váš robots.txt umožňoval přístup našemu prohledávači
  • Ověřte, že stránka není chráněná přihlášením

Chybí obsah v odpovědích?

  • Znovu extrahujte stránku, abyste získali nejnovější obsah
  • Zkontrolujte, že obsah není načítán pomocí JavaScriptu (JavaScript vykreslujeme)
  • Zajistěte, aby byl obsah v hlavní části stránky, ne v iframech

Potřebujete větší kontrolu?

Pokud máte pokročilejší požadavky na extrakci (ověřování, dynamický obsah apod.), kontaktujte nás na [email protected].