Sisu kraapimine
Seadista, kuidas ChattyBox sinu veebisaiti läbib ja sisu AI vastuste jaoks indekseerib.
Kraapimisrežiimid
ChattyBox toetab kolme kraapimisrežiimi:
1. Ainult avaleht
Kraapib ainult sinu avalehte. Sobib kõige paremini lihtsatele maandumislehtedele või siis, kui soovid indekseerida võimalikult vähe sisu.
2. Saidikaardi režiim (soovitatav)
Sisesta saidikaardi URL ja ChattyBox kraapib kõik selles loetletud lehed. See on kõige usaldusväärsem viis tagada, et kõik sinu lehed on indekseeritud.
https://example.com/sitemap.xml
3. Käsitsi määratud URL-id
Määra kraapimiseks täpsed URL-id, üks igale reale. Kasuta seda, kui soovid täpselt juhtida, millised lehed indekseeritakse.
https://example.com/pricing
https://example.com/features
https://example.com/about
https://example.com/faq
Lehepiirangud
Kraapitavate lehtede arv sõltub sinu paketist:
| Pakett | Lehtede arv saidi kohta |
|---|---|
| Free | 10 |
| Starter | 50 |
| Pro | 500 |
| Business | 2,000 |
Sisu eraldamine
ChattyBox eraldab:
- Lehe pealkiri -
<title>-silt - Põhisisu - Tekst elementidest
<main>,<article>või<body> - Pealkirjad - Kõik
<h1>kuni<h6>sildid - Lõigud - Kogu
<p>-elementide sisu - Loendid -
<ul>- ja<ol>-loendite üksused
Ignoreeritav sisu
ChattyBox ignoreerib automaatselt:
- Navigeerimismenüüd
- Jaluse sisu
- Skriptid ja stiilid
- Peidetud elemendid
- Küpsiseribad
Tõrkeotsing
Kas lehti ei kraabita?
- Veendu, et URL on avalikult ligipääsetav
- Veendu, et sinu
robots.txtlubab meie veebirobotil lehti külastada - Veendu, et leht ei ole sisselogimise taga
Sisu puudub vastustest?
- Kraabi leht uuesti, et saada uusim sisu
- Veendu, et sisu ei laadita JavaScripti abil (me renderdame JavaScripti)
- Veendu, et sisu oleks lehe põhiosas, mitte iframe'ides
Kas vajad rohkem võimalusi juhtimiseks?
Keerukamate kraapimisvajaduste korral (autentimine, dünaamiline sisu jne) võta meiega ühendust aadressil [email protected].