Liigu põhisisu juurde

Sisu kraapimine

Seadista, kuidas ChattyBox sinu veebisaiti läbib ja sisu AI vastuste jaoks indekseerib.

Kraapimisrežiimid

ChattyBox toetab kolme kraapimisrežiimi:

1. Ainult avaleht

Kraapib ainult sinu avalehte. Sobib kõige paremini lihtsatele maandumislehtedele või siis, kui soovid indekseerida võimalikult vähe sisu.

2. Saidikaardi režiim (soovitatav)

Sisesta saidikaardi URL ja ChattyBox kraapib kõik selles loetletud lehed. See on kõige usaldusväärsem viis tagada, et kõik sinu lehed on indekseeritud.

https://example.com/sitemap.xml

3. Käsitsi määratud URL-id

Määra kraapimiseks täpsed URL-id, üks igale reale. Kasuta seda, kui soovid täpselt juhtida, millised lehed indekseeritakse.

https://example.com/pricing
https://example.com/features
https://example.com/about
https://example.com/faq

Lehepiirangud

Kraapitavate lehtede arv sõltub sinu paketist:

PakettLehtede arv saidi kohta
Free10
Starter50
Pro500
Business2,000

Sisu eraldamine

ChattyBox eraldab:

  • Lehe pealkiri - <title>-silt
  • Põhisisu - Tekst elementidest <main>, <article> või <body>
  • Pealkirjad - Kõik <h1> kuni <h6> sildid
  • Lõigud - Kogu <p>-elementide sisu
  • Loendid - <ul>- ja <ol>-loendite üksused

Ignoreeritav sisu

ChattyBox ignoreerib automaatselt:

  • Navigeerimismenüüd
  • Jaluse sisu
  • Skriptid ja stiilid
  • Peidetud elemendid
  • Küpsiseribad

Tõrkeotsing

Kas lehti ei kraabita?

  • Veendu, et URL on avalikult ligipääsetav
  • Veendu, et sinu robots.txt lubab meie veebirobotil lehti külastada
  • Veendu, et leht ei ole sisselogimise taga

Sisu puudub vastustest?

  • Kraabi leht uuesti, et saada uusim sisu
  • Veendu, et sisu ei laadita JavaScripti abil (me renderdame JavaScripti)
  • Veendu, et sisu oleks lehe põhiosas, mitte iframe'ides

Kas vajad rohkem võimalusi juhtimiseks?

Keerukamate kraapimisvajaduste korral (autentimine, dünaamiline sisu jne) võta meiega ühendust aadressil [email protected].