Perangkak web
Perangkak sesawang atau perangkak web (web crawler) ialah sejenis bot Internet yang menyelusuri laman dan tapak dalam Jaringan Sejagat untuk tujuan pengindeksan web. Bot jenis ini paling digunakan enjin carian untuk mengemaskini kandungan hasil carian mereka mahupun daripada indeks laman web lainnya.
Gambaran awam
[sunting | sunting sumber]Bot perangkak dibekalkan dengan suatu senarai URL yang perlu dilayari di mana bertindak seperti suatu "benih" (seed). Perangkak tersebut mengenalpasti semua hiperpautan yang wujud dalam laman yang ditelusuri lalu ditambahkan dalam senarai perangkak. Perangkak yang bertujuan mengarkibkan laman sesawang menyalin serta menyimpan maklumat yang didapati; arkib yang disimpan dipaparkan sepertimana ia dilihat dan diakseskan secara aktif dan dalam waktu semasa.[1] Hanya laman yang berformat HTML sahaja yang akan disimpan dalam bentuk failnya yang tersendiri.
Rujukan
[sunting | sunting sumber]- ^ Masanès, Julien (15 Februari 2007). Web Archiving. Springer. m/s. 1. ISBN 978-3-54046332-0. Dicapai pada 24 April 2014.[pautan mati kekal]