Extrakce obsahu
Nastavte, jak ChattyBox prochází váš web a indexuje obsah pro odpovědi AI.
Režimy scrapování
ChattyBox nabízí tři režimy scrapování:
1. Pouze domovská stránka
Extrahuje pouze vaši domovskou stránku. Ideální pro jednoduché vstupní stránky nebo když chcete indexovat jen minimum obsahu.
2. Režim mapy webu (doporučeno)
Zadejte URL mapy webu a ChattyBox extrahuje všechny stránky, které jsou v ní uvedené. Jde o nejspolehlivější způsob, jak zajistit, aby byly všechny vaše stránky zaindexovány.
https://example.com/sitemap.xml
3. Ruční URL
Zadejte přesné URL k extrahování, jednu na řádek. Použijte toto, když chcete mít přesnou kontrolu nad tím, které stránky se indexují.
https://example.com/pricing
https://example.com/features
https://example.com/about
https://example.com/faq
Limity stránek
Počet stránek, které můžete extrahovat, závisí na vašem tarifu:
| Tarif | stránek na web |
|---|---|
| Free | 10 |
| Starter | 50 |
| Pro | 500 |
| Business | 2 000 |
Extrakce obsahu
ChattyBox extrahuje:
- Název stránky - Tag
<title> - Hlavní obsah - Text z
<main>,<article>nebo<body> - Nadpisy - Všechny tagy od
<h1>do<h6> - Odstavce - Veškerý text v
<p> - Seznamy - Položky ze
<ul>a<ol>
Ignorovaný obsah
ChattyBox automaticky ignoruje:
- Navigační menu
- Obsah v zápatí
- Skripty a styly
- Skryté prvky
- Cookie bannery
Řešení problémů
Stránky se neextrahují?
- Zkontrolujte, že je URL veřejně přístupná
- Zajistěte, aby váš
robots.txtumožňoval přístup našemu prohledávači - Ověřte, že stránka není chráněná přihlášením
Chybí obsah v odpovědích?
- Znovu extrahujte stránku, abyste získali nejnovější obsah
- Zkontrolujte, že obsah není načítán pomocí JavaScriptu (JavaScript vykreslujeme)
- Zajistěte, aby byl obsah v hlavní části stránky, ne v iframech
Potřebujete větší kontrolu?
Pokud máte pokročilejší požadavky na extrakci (ověřování, dynamický obsah apod.), kontaktujte nás na [email protected].