Skip to content

BLOG EDUKASI

Situs Berita Teknologi No #1 Terdepan Mengabarkan Powered by kopas.id

  • Beranda
  • news
  • tipsntrik
  • google
  • microsoft
  • apple
  • xiaomi
  • intel
  • amd
SUBSCRIBE
  • google, headline, internet, news, open source, software, teknologi
  • Juli 4, 2019
  • 0

Google Buka Kode ‘Web Crawler’ Setelah 20 Tahun

Google Robot Exclusion Protocol (REP), juga dikenal sebagai robots.txt , adalah standar yang digunakan oleh banyak situs untuk memberitahu crawler otomatis bagian mana dari situs dijelajahi atau tidak.

Namun, itu bukan standar yang diadopsi secara resmi, yang mengarah pada interpretasi yang berbeda. Dalam upaya menjadikan REP sebagai standar web resmi, Google memiliki parser robots.txt bersumber terbuka dan library C++ terkait yang pertama kali dibuat 20 tahun yang lalu. Anda bisa menemukan tool di GitHub .

REP disusun kembali pada tahun 1994 oleh seorang insinyur perangkat lunak Belanda Martijn Koster, dan hari ini adalah standar de facto yang digunakan oleh situs web untuk menginstruksikan crawler.

Crawler Googlebot menjelajahi file robots.txt untuk menemukan instruksi apa pun yang harus diabaikan oleh bagian situs web tersebut. Jika tidak ada file robots.txt , bot menganggap tidak apa-apa untuk menjelajahi seluruh situs web.

Namun, protokol ini telah ditafsirkan “agak berbeda selama bertahun-tahun” oleh pengembang, yang mengarah pada ambiguitas dan kesulitan dalam “menulis aturan dengan benar.”

Misalnya, ada ketidakpastian dalam kasus di mana “editor teks menyertakan karakter BOM dalam file robots.txt mereka .” Sedangkan untuk perayap dan pengembang tool, selalu ada ketidakpastian tentang “bagaimana mereka harus berurusan dengan file robots.txt yang berukuran ratusan megabita besar? “

Inilah mengapa Google ingin REP secara resmi diadopsi sebagai standar internet dengan aturan tetap untuk semua. Perusahaan mengatakan telah mendokumentasikan dengan tepat bagaimana REP harus digunakan dan mengajukan proposal ke Internet Engineering Task Force (IETF).

Meskipun kami tidak dapat mengatakan dengan pasti bahwa REP akan menjadi standar resmi; itu pasti akan membantu pengunjung web serta pemilik situs web dengan menunjukkan hasil pencarian yang lebih konsisten dan menghormati keinginan situs.

Bagikan ini:

  • Facebook
  • X

ekohendratno

Menyukai perkembangan dunia informasi teknologi, suka dengan pemrograman web dan mobile seperti java, php, dart, html, css, javascript, kotlin, vb, .net dan sejenisnya

  • Microsoft Goda ‘Windows 1.0’ di 2019 Dan Buat Bingung Netizen
  • Nvidia Hadirkan Seri GPU “Super RTX” Yang Lebih Powerfull Dengan Harga Yang Sama

Leave a Reply Cancel

Your email address will not be published. Required fields are marked *

Mungkin Kamu suka

Main Game Android di Laptop KenTang Dengan Fyde OS 16

  • Maret 21, 2023Maret 21, 2023
  • 0

Delivery Optimization Files di Windows 11: Apa Itu dan Bagaimana Cara Menonaktifkan dan Menghapusnya

  • Maret 8, 2023Maret 1, 2023
  • 0

Ini Dia Fitur Terbaru Android 14 Developer Preview 1: Dari Fast Pair Option Hingga App Cloning

  • Maret 1, 2023Maret 1, 2023
  • 0

Android 12L mulai diluncurkan ke Samsung Galaxy Tab S7

  • September 8, 2022
  • 0

BLOG EDUKASI

  • Halaman Utama
  • Halaman Utama Builder
  • Kebijakan Privasi
  • Ketentuan Layanan
  • Tentang Kami
  • Beranda
  • Ketentuan Layanan
  • Kebijakan Privasi
  • Tentang Kami

Copyright All Rights Reserved 2022 | Theme: Pritam by Template Sell.